Критерии для оценки степени близости наблюдаемого распределения к нормальному
Допустим, что данное статистическое распределение выравнено с помощью некоторой теоретической кривой f(х). Как бы хорошо ни была подобрана теоретическая кривая, между ней и эмпирическим распределением неизбежны некоторые расхождения. Естественно возникает вопрос, объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, что подобранная нами кривая плохо выравнивает данное статистическое распределение. Для ответа на такой вопрос служат так называемые критерии согласия.
Для оценки степени близости теоретического распределения к эмпирическому в статистике известны несколько критериев, одним из которых является критерий акад. А. Н. Колмогорова.
В качестве меры расхождения между теоретическим и статистическим распределениями А. Н. Колмогоров рассматривает максимальное значение разности между статистической функцией распределения F*(х) и соответствующей теоретической функцией распределения
D = max│F*(х)–F(х)│ (3.15)
Схема применения критерия А. Н. Колмогорова следующая. Строится статистическая функция распределения F*(х) и предполагаемая теоретическая функция распределения F(х) ; определяется максимум D модуля разности между ними (рис. 3. 8).
Рис. 3.8. Схема применения критерия А. Н. Колмогорова
Далее вычисляется величина
(3.16)
и по таблице находится вероятность р(λ). Если вероятность р(λ) весьма мала, то гипотезу следует отвергнуть как неправдоподобную. При сравнительно больших р(λ) ее можно считать совместимой с опытными данными. Следует, однако, оговорить, что этот критерий можно принять только в случае, когда гипотетическое распределение F(х) известно заранее из каких-либо теоретических соображений, т. е. когда известен не только вид функции распределения F(х), но и все входящие в нее параметры.
К. Пирсон предложил критерий χ 2 (хи - квадрат) для оценки степени различия двух сравниваемых рядов частот (можно сравнивать эмпирический и теоретический или два эмпирических ряда).
В качестве меры отклонения берется выражение
(3.17)
где m и F(х)N — соответственно эмпирическая и теоретическая частоты.
По специальным таблицам определяется, при какой вероятности значение χ2, вычисленное по формуле (3.17), превзойдет табличное; при большой вероятности ряды различаются несущественно.
Сравнение распределений можно провести также с помощью критерия В. И. Романовского
(3.18)
где В — число интервалов минус 3.
Если R<3, то можно предполагать, что разность между эмпирическим и теоретическим распределением носит случайный характер.
Рассмотрим пример вычисления критериев А. Н. Колмогорова и В. И. Романовского по данным ряда распределения извлечения во флотационных опытах. Составим сводную таблицу обработки результатов измерений (табл. 3.2).
Таблица3.2