Критерии согласия
Определение 51. Критерии, которые позволяют судить, согласуются ли значения х1, х2,…, хn случайной величины Х с гипотезой относительно ее функции распределения, называются критериями согласия.
Идея применения критериев согласия
Пусть на основании данного статистического материала предстоит проверить гипотезу Н, состоящую в том, что СВ Х подчиняется некоторому определенному закону распределения. Этот закон может быть задан либо в виде функция распределения F(x), либо в виде плотности распределения f(x), или же в виде совокупности вероятностей pi. Так как из всех этих форм функция распределения F(x) является наиболее общей (существует и для ДСВ и для НСВ) и определяет собой любую другую, будем формулировать гипотезу Н, как состоящую в том, что величина Х имеет функцию распределения F(x).
Для того, чтобы принять или опровергнуть
гипотезу Н, рассмотрим некоторую
величину U , характеризующую
степень расхождения (отклонения)
теоретического и статистического
распределений. Величина U
может быть выбрана различными
способами: 1) сумма квадратов отклонений
теоретических вероятностей pi
от соответствующих частот
,
2) сумма тех же квадратов с некоторыми
коэффициентами (весами), 3) максимальное
отклонение статистической (эмпирической)
функции распределения
от
теоретической F(x).
Пусть величина U выбрана тем или иным способом. Очевидно, что это есть некоторая случайная величина. Закон распределения U зависит от закона распределения случайной величины Х, над которой производились опыты, и от числа опытов n. Если гипотеза Н верна, то закон распределения величины U определяется законом распределения величины Х (функцией F(x)) и числом n.
Допустим, что этот закон распределения
известен. В результате данной серии
опытов обнаружено, что выбранная мера
расхождения U приняла
некоторое значение u.
Вопрос: можно ли объяснить это случайными
причинами или же это расхождение
слишком велико и указывает на наличие
существенной разницы между теоретическим
и статистическим (эмпирическим)
распределениями и, следовательно, на
непригодность гипотезы Н? Для ответа
на этот вопрос предположим, что гипотеза
Н верна, и вычислим в этом предположении
вероятность того, что за счет случайных
причин, связанных с недостаточным
объемом опытного материала, мера
расхождения U окажется
не меньше, чем наблюдаемое в опыте
значение u, то есть
вычислим вероятность события:
.
Если эта вероятность мала, то гипотезу Н следует отвергнуть как мало правдоподобную, если же эта вероятность значительна, то делаем вывод, что экспериментальные данные не противоречат гипотезе Н.
Возникает вопрос: каким же способом следует выбирать меру расхождения (отклонения) U? Оказывается, что при некоторых способах ее выбора закон распределения величины U обладает весьма простыми свойствами и при достаточно большом n практически не зависит от функции F(x). Именно такими мерами расхождения и пользуются в математической статистике в качестве критериев согласия.
Определение 51/. Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Для количественных данных при распределениях, близких к нормальным, используют параметрические методы, основанные на таких показателях, как математическое ожидание и стандартное отклонение. В частности, для определения достоверности разницы средних для двух выборок применяют метод (критерий) Стьюдента, а для того чтобы судить о различиях между тремя или большим числом выборок, — тест F, или дисперсионный анализ. Если же имеем дело с неколичественными данными или выборки слишком малы для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, тогда используют непараметрические методы — критерий χ2 (хи-квадрат) или Пирсона для качественных данных и критерии знаков, рангов, Манна-Уитни, Вилкоксона и др. для порядковых данных.
Кроме того, выбор статистического метода зависит от того, являются ли те выборки, средние которых сравниваются, независимыми (т. е., например, взятыми из двух разных групп испытуемых) или зависимыми (т. е. отражающими результаты одной и той же группы испытуемых до и после воздействия или после двух различных воздействий).
