- •Элементы
- •5.1. Проверка гипотез о параметрах распределений.
- •5.1.1. Проверка значения математического ожидания нормального распределения.
- •5.1.2. Проверка значения дисперсии нормального распределения.
- •5.1.3. Проверка значения доли (параметра биноминального распределения).
- •5.2. Сравнение выборок
- •5.2.1. Сравнение дисперсий
- •5.2.2. Сравнение средних двух независимых выборок
- •5.2.3. Сравнение средних парных выборок.
- •5.2.4. Сравнение долей (параметра биноминального распределения)
- •5.3. Проверка однородности выборок.
- •5.4. Дисперсионный анализ (anova)
- •5.4.1. Однофакторный дисперсионный анализ.
- •5.4.2. Многофакторный дисперсионный анализ.
5.1.2. Проверка значения дисперсии нормального распределения.
Для проверки
гипотезы
надо вычислить критерий
,
который распределён по закону хи-квадрат
с числом степеней свободы
.
При альтернативной гипотезе
нулевая гипотеза принимается, если
,
при
- если
,
а при
,
- если
. Здесь под символом
понимается квантиль уровня
:
.
В то же время в ряде таблиц под тем же
символом приводятся значения
,
соответствующие неравенству
.
Так как
,
то при
,
.
В Excel
значения
,
соответствующие неравенству
находятся функциейХИ2ОБР,
в меню
Статистические.
В
качестве примера снова рассмотрим
результаты студенческих измерений.
Известно, что используемый студентами
метод анализа характеризуется стандартом
=3,5.
Выборочное отклонение оказалось, как
рассчитано ранее функциейСТАНДОТКЛ,
около
4 единиц. Естественно, возникает вопрос,
случайно ли это расхождение, или вызвано
дополнительными случайными ошибками
студентов. Результаты расчётов,
представленные в таблице, не позволяют
отвергнуть гипотезу
на уровне значимости 0,05.
|
|
15,71542929 |
|
|
100 |
|
|
3,5 |
|
|
127,0063265 |
|
ХИ2ОБР(0,025;99) |
128,422 |
|
ХИ2ОБР(0,975;99) |
73,36108 |
5.1.3. Проверка значения доли (параметра биноминального распределения).
При малом объёме
выборки проверку гипотезы
можно сделать путём непосредственного
анализа функции распределения
.
Проведём такой анализ на следующем
примере. Предположим, 20 раз бросается
игральная кость, и мы хотим проверить
гипотезу, по которой вероятность
выпадения шестёрки равно 1/6 (как это
должно быть, если выпадение всех граней
равновероятны). Для этого сформируем
столбец (строку) возможных значений
выпадения шестёрки (от 0 до 20), и, используя
функциюExcel
БИНОМРАСПРЕД c
параметрами 1/6, ИСТИНА, находим вероятности
.
Соответствующие значения вероятностей
получаем, вычитая полученные значения
из
единицы. Для удобства представления
данных выбран формат чисел с тремя
десятичными знаками после запятой. При
этом оказалось, что данные, начиная сk=10
при выбранной точности представления
не меняются, в связи с чем ниже приведена
только половина итоговой таблицы
результатов:
-
k
0
1
2
3
4
5
6
7
8
9
10
F(k,20,1/6)
0,026
0,130
0,329
0,567
0,769
0,898
0,963
0,989
0,997
0,999
1,000
p(x>k)
0,974
0,870
0,671
0,433
0,231
0,102
0,037
0,011
0,003
0,001
0,000
Теперь рассуждаем
следующим образом. При
наиболее вероятное число выпадения
шестёрки при 20 бросаниях равно трём.
Поэтому при выпадении большего числа
шестёрок возникает подозрение, что
кубик «неправильный», и появляется
альтернативная гипотеза
.
Очевидно, чем большее значение
будет получено, тем больше оснований
отклонить нулевую гипотезу. Поэтому в
качестве критической области следует
принять множество
.
Поскольку в дискретном случае функция
распределения имеет ступенчатый
характер, то нельзя подобрать значение
для произвольного уровня значимости
.
Так, при
=5
получаем
=0,102,
при
=6
-
=0,037,
а при
=7
-
=0,011.
Таким образом, если приемлемым считается
значение
=0,05,
то при альтернативной гипотезе
придётся отклонить основную гипотезу,
еслиk>6.
При противоположной альтернативной
гипотезе
основную гипотезу при том же
=0,05
придётся отклонить только в том случае,
если шестёрок вообще не выпадет, поскольку
при справедливости
уже
при
=1
>0,05
. Если же , то критическая область должна
быть двусторонней:
,
и при выпадении шестёрки от одного до
шести раз из 20 не следует отбрасывать
гипотезу
(уровень значимости при этом будет равен
0,026+0,011<0,05).
При больших
объёмах выборки, когда и
,
и
достаточно
велики, распределение Бернулли
аппроксимируется нормальным с параметрами
, поэтому для проверки гипотезы
можно использовать критерий
=
,
имеющий стандартное нормальное
распределение. При альтернативе
гипотеза
не отвергается, если
,
при
,
если
,
а при
- если![]()
