不一致测试如何工作?
一个统计不一致性检验分析两个假设;一个有效的假设和一个不同的假设。工作假设H是一个陈述,即n个对象的整个数据集来自初始分布模型F,即H:oiÎF,其中i=1,2,n。
如果没有统计上重要的证据支持其拒绝,则保留该假设。不一致测试检查对象oi在分布F方面是否本质上是大(或小)。基于数据的可用知识,已经提出了不同的测试统计用作不一致测试。
假设已经选择了某个统计量T进行不一致测试,并且对象oi的统计量值为vi,则构建了T的分布。显着性概率SP(vi)=Prob(T>vi)被评估。
如果某个SP(vi)足够小,那么oi是不一致的并且工作假设被拒绝。采用了另一种假设,即oi出现在另一个分布模型G中。结果很大程度上取决于选择了哪个F模型,因为oi在一个模型下可能是异常值,而在另一个模型下可能是完全有效的值。
替代分布对于决定检验的功效非常重要,即当oi是异常值时工作假设被拒绝的概率。有几种类型的替代分布。
固有替代分布-在这种情况下,所有对象都来自分布F的工作假设被拒绝,以支持所有对象从另一个分布G增加的替代假设-
H:oiÎG,其中i=1,2,...,n
F和G可以是不同的分布,也可以只是相同分布的参数不同。G分布的形式存在限制,因为它应该有可能产生异常值。例如,它可以有不同的均值或离散度,或者长尾。
混合替代分布-混合替代指出不一致的值不是F群体中的异常值,而是来自其他一些群体的污染。在这种情况下,备择假设是-
H:oiÎ(1–l)F+lG,其中i=1,2,...,n
滑点替代分布-该替代方案表明所有对象(除了一些规定的小数)独立于具有参数m和s2的原始模型F产生,而其余对象是来自F的修改版本的独立观察,其中参数已更改。