
§ 3. Критерии для дисперсий
Критерий равенства дисперсии генеральной совокупности определенному значению. Часто для выявления характера изменения признака в генеральной совокупности необходимо оценить не только среднее значение этого признака, но и степень его рассеяния или дисперсию на основании выборочных данных.
Пример 5. Вернемся к примеру о величине оброка в черноземной полосе в конце XVIII в. Допустим, что по результатам других исследователей принято считать г.с.=1,2 руб. Верно ли это? В качестве оценки значения в генеральной совокупности по выборочным данным получена величина S. Известно, что S= 1,7 руб.
1) Проверим гипотезу о том, что различие между ГС и S вызвано случайными причинами, т.е., что числовое значение среднего квадратического отклонения признака (оброк) в генеральной совокупности равно 1,2 руб.:
Н0:гс = 1,2.
2) В
качестве статистической характеристики
используется величина
,
где k
—
число степеней свободы (k=n—1);
S
— оценка среднего квадратичного
отклонения, полученная по упоминавшейся
ранее формуле. Распределение этой
величины при построении графика функции
называется распределением «хи квадрат».
Оно подчинено и зависит только от
количества степеней свободы k.
Основная формула этой величины
.
То есть, абсолютная величина это
показателя зависит только от количества
вариант в вариационном ряду. Эта функция
табулирована в таблицах, которые обычно
называются «Критические точки
распределения 2».
3) Найдем фактическое значение статистической характеристики:
4) Выберем уровень значимости а, например а=0,1.
5) По таблице критических точек распределения хи квадрат для а = 0,1 и k=15 найдем критическую точку=22,3.
Заметим, что в таблице X2 даны значения, соответствующие односторонней проверке, т.е. противоречащими нашей гипотезе считаются слишком большие значения характеристики (большие Х2Кр). Так как фактическая величина хи квадрат больше критической точки, то мы не можем считать, что наша выборка получена из генеральной совокупности со значением среднего квадратического отклонения, равным 1,2 руб.
В
случае больших выборок распределение
X2
приближается к нормальному. Если k>30,
то в качестве статистической характеристики
можно использовать величину t
,
которая подчинена нормальному
распределению. Пользуясь таблицей
значений функции Лапласа, можно получить
tкр,
откуда
.
Критерий равенства двух дисперсий. Вернемся опять к нашему примеру. Нам были известны значения средних двух выборок, х1 и х2. Требовалось проверить гипотезу том, что в генеральных совокупностях средние равны (Х1гс = X2гс). При этом использовалось существенное предположение о равенстве генеральных дисперсий (12 = 22). Это предположение можно проверить, используя оценки генеральных дисперсий S12 и S22, полученные по вышеупомянутой формуле.
Если взять отношение, то видно, что для хорошего согласования с гипотезой о равенстве дисперсий это отношение не должно быть очень большим или очень малым. Величина S12/S22 называется дисперсионным отношением и обозначается F. Она имеет так называемое F-распределение с k1 и k 2 степенями свободы (k1 = n1—1, k2=n2—1). Это распределение называется распределением Фишера – Снедекора. Оно табулировано под названием «Критические точки распределения F Фишера – Снедекора». Обычно таблицы составлены для вероятностей а=0,05 и 0,01, где по горизонтали и по вертикали даны степени свободы первой и второй выборок.
1) Таким образом, испытуемой гипотезой является гипотеза о равенстве генеральных дисперсий: Н0: 12 = 22.
2) Статистической характеристикой является дисперсионное отношение F:
F= S12/S22, где S1 и S2 подсчитываются для выборок по соответствующей формуле.
3) Находим фактическое значение F= (1,7)2/(1,26)21,8
4) Выберем в качестве а значение 0,05.
5) Пользуясь таблицей критических точек распределения Фишера – Снедекора для а=0,05, k1 = k2=15, найдем Fкр=2,40.
Заметим, что для использования таблицами критических точек для этого распределения в качестве S1 надо брать большее из двух значений S, тогда F всегда больше 1.
Так как F=1 дает наилучшее соответствие испытуемой гипотезе (мы предположили, что дисперсии двух выборок равны), то гипотеза будет отклоняться, если F сильно превосходит 1, а это соответствует односторонней проверке. Таким образом, в данном случае наш критерий является односторонним, и критическую область образуют значения F, превышающие Fкр.
6) Сравнивая Fф с FKP, видим, что Fф меньше FKP, то есть попадает в область допустимых значений, и на уровне значимости 0,05 гипотеза не отклоняется.
Ограничения при использовании критериев для дисперсий. При использовании в проверке статистических гипотез распределений X2 и F необходимо учитывать следующие требования: 1) независимость выборочных значений Xi, 2) нормальность распределения признака в генеральной совокупности.
КОРРЕЛЯЦИЯ КОЛИЧЕСТВЕННЫХ И КАЧЕСТВЕННЫХ ПРИЗНАКОВ