КОЛМОГОРОВА—СМИРНОВА КРИТЕРИЙ
— один из
наиболее широко используемых статистических критериев, применяемый для проверки
гипотез совпадения функции распределения исследуемой величины, построенной по
выборке, с функцией распределения в другой выборке или с теоретической функцией
распределения. Этот критерий наиболее строг, т. к. определяет все виды различия
распределений, а не только связанные с различием определенных параметров.
В
качестве статистики, используемой для сравнения двух выборок, берется
наибольшая разность между долями наблюдений в обоих выборках, не превышающих
одно и то же значение. Практически для каждого значения переменной хi, встреченного в какой-либо из выборок, нужно найти долю
наблюдений, не больших хi в одной и другой выборках (соответственно р1
и p2) найти величину K = mах|р1 — р2|×√(п1
× n2)/(п1 + n2), где: п1
и п2 — объемы выборок. Если п1 + n2≥35, то превышение величиной K критических значений K5%=1,36 или K1%=1,63 вызывает отклонение гипотезы о равенстве
распределений соответственно на 5- и 1%-ном уровнях значимости.
При n1 = n2 ≥ 10 можно приближенно определить критическое α%
значение для величины D = mv^x|P|—Я2)
из формулы Dα% ≈ m/n, где: т — наименьшее целое число,
превышающее Ka%√2n. При сравнении эмпирического
распределения с теоретическим находится максимум модуля разности между
теоретически ожидаемой вероятностью р появления величины, не превышающей
xi(i = 1, 2...п) при гипотезе, что выборка имеет
ожидаемое теоретическое распределение и реально зарегистрированной долей рнаблюдений, не больших xi.
Критическими значениями критерия в этом
случае для D = max|p - p| будут Dα% = Ka%√n, если параметры теоретического
распределения были известны заранее и n≥ 35.
Если же параметры оценивались по той же
выборке, то для n≥ 30
берут критические значения D10% = 0,805√n и D5% = 0,886√n.
Критерий можно применять и к
сгруппированным данным при числе классов группирования не менее 5 и числе
наблюдений не менее 10, но в этом случае лучше пользоваться критерием
«хи-квадрат».