- •Міністерство освіти та науки україни
- •Інформаційні системи в менеджменті
- •Содержание
- •Лабораторная работа №1 Проверка гипотезы о нормальном распределении
- •Лабораторная работа №2 Проверка гипотезы о математическом ожидании
- •Задание
- •Лабораторная работа №3 Двухвыборочные критерии
- •Задания
- •Лабораторная работа №4 Проверка гипотезы об однородности дисперсий
- •Задания
- •Лабораторная работа №5 Однофакторный дисперсионный анализ
- •Задания
- •Лабораторная работа №6 Ранговый критерий
- •Задания
- •Лабораторная работа №7 Двухфакторный дисперсионный анализ
- •Задания.
- •Продолжительности проявления.
- •Лабораторная работа №8 Проверка гипотезы об однородности выборок
- •Содержание контрольного задания
- •Литература
Лабораторная работа №4 Проверка гипотезы об однородности дисперсий
Необходимость
проверки равенства дисперсий возникает
достаточно часто и не только в рассмотренных
ситуациях. Проверка разности между
дисперсиями двух генеральных совокупностей
основана на исследовании их отношения.
Если каждая генеральная совокупность
является нормально распределенной,
отношение
подчиняется F-распределению,
критические значения которого зависят
от степени свободы первой выборки
(числителя) и степени свободы знаменателя
(вторая выборка). Для проверки равенства
двух дисперсий в критерии используется
F-статистика:
,
(1)
где – дисперсия выборки из первой генеральной совокупности объема n1;
– дисперсия выборки из второй генеральной совокупности объема n2;
n1-1 и n2 -1 – степени свободы числителя и знаменателя соответственно.
При заданном уровне значимости нулевая и альтернативная гипотезы запишутся так:
,
.
(2)
Нулевая гипотеза отклоняется, если F-статистика больше верхнего критического значения FV или меньше нижнего критического значения FL из F-распределения, в противном случае нулевая гипотеза не отклоняется.
Рассмотрим применение F-критерия для проверки однородности выборок в задаче с оценками.
Задача 1. В большом университете был проведен эксперимент по преподаванию начальной биологии. Одна группа студентов обучалась по традиционному методу «лекции плюс лабораторные работы»; вторая группа – по методу «только лабораторные работы плюс демонстрации, без лекций». Студентов случайным образом распределили по указанным группам. В конце семестра все студенты сдавали экзамен; были получены случайные выборки оценок для каждой группы.
Размещение на рабочем листе Excel данных об оценках студентов на экзаменах может быть таким, как на рис.1. Проверим гипотезу об однородности дисперсий оценок при традиционном методе обучения и при замене лекций на демонстрации.
Для этого необходимо выполнить следующие действия.
Выбрать команду Сервис Анализ данных
В диалоговом окне Анализ данных выбрать пункт Двухвыборочный F- тест для дисперсии в списке Инструменты анализа
Щелкнуть ОК
|
A |
B |
|
1 |
Оценки |
||
2 |
Лекции |
Демонстр. |
|
3 |
55 |
56 |
|
4 |
57 |
60 |
|
5 |
60 |
62 |
|
6 |
63 |
67 |
|
7 |
72 |
70 |
|
8 |
73 |
71 |
|
9 |
79 |
82 |
|
10 |
85 |
88 |
|
11 |
92 |
95 |
|
Рис.1 Размещение данных.
В диалоговом окне Двухвыборочный F- тест для дисперсии сделать следующее:
Рис.2. Заполнение диалогового окна
Ввести в окне редактирования Интервал переменной 1 диапазон А2 : А11.
Ввести в окне редактирования Интервал переменной 2 диапазон В2 : В11.
Установить флажок Метки.
Ввести в окне редактирования Альфа число 0,05.
Установить переключатель Параметры вывода в положение Выходной интервал и ввести номер ячейки, в которой разместится верхний левый угол таблицы результатов: Е2.
Щелкнуть ОК.
Получим:
Двухвыборочный F-тест для дисперсии |
|
|
|
|
|
|
Лекции |
Демонстр. |
Среднее |
70,66666667 |
72,33333333 |
Дисперсия |
167,75 |
176,75 |
Наблюдения |
9 |
9 |
df |
8 |
8 |
F |
0,949080622 |
|
P(F<=f) одностороннее |
0,471445474 |
|
F критическое одностороннее |
0,290858219 |
|
Рис.3. Результаты проверки гипотезы
Поскольку p-значение равно 0,471 и больше уровня значимости, нулевая гипотеза о равенстве двух дисперсий не отклоняется. Этот же вывод подтверждает значение F-статистики, равное 0, 949, которое больше нижнего Fкр = 0,291.
Для большей уверенности в том, что значение F-статистики не попадает в критическую область можно воспользоваться двусторонним F-критерием или проверить значение F-статистики для обратного отношения дисперсий
Двухвыборочный F-тест для дисперсии |
|
|
|
|
|
|
Демонстр |
Традиц. |
Среднее |
72,3333333 |
70,6666667 |
Дисперсия |
176,75 |
167,75 |
Наблюдения |
9 |
9 |
df |
8 |
8 |
F |
1,05365127 |
|
P(F<=f) одностороннее |
0,47144547 |
|
F критическое одностороннее |
3,43810123 |
|
В последнем случае для задачи 1 получим аналогичный результат:
p-значение не изменилось, а F-статистика, равная 1,054, меньше верхнего Fкр =3,438. Следовательно, нулевая гипотеза об однородности дисперсий в случае двух методов обучения не может быть отвергнута.
Рассмотренный критерий применим только для проверки однородности дисперсий двух генеральных совокупностей. Для проверки гипотезы о равенстве дисперсий c генеральных совокупностей применяется один из самых мощных критериев – критерий Левенэ. Нулевая и альтернативная гипотезы формулируются так:
,
не все
одинаковы (j =1,2,…,c). (2)
Модифицированный критерий Левенэ основан на утверждении, что если изменчивость в группах одинакова, для проверки нулевой гипотезы о равенстве дисперсий можно применить анализ дисперсии абсолютных величин разностей между наблюдениями и медианами групп. Следовательно, сначала необходимо вычислить эти абсолютные величины в каждой группе, а затем выполнить однофакторный дисперсионный анализ полученных абсолютных величин разностей.
Проверим с помощью критерия Левенэ предположение об однородности дисперсий генеральных совокупностей в следующей задаче.
Задача 2. В большом университете был проведен эксперимент по преподаванию начальной биологии. Одна группа студентов обучалась по традиционному методу «лекции плюс лабораторные работы»; вторая группа – по методу «только лабораторные работы плюс демонстрации, без лекций»; третья группа – по методу «видеозаписи лекций плюс демонстрации», причем здесь студенты могли смотреть видеозаписи в любое время и сколько угодно раз. Студентов случайным образом распределили по 9 человек по указанным трем группам (c=3; n=27). В конце семестра все студенты сдавали экзамен; были получены случайные выборки оценок для каждой группы.
Разместим их на рабочем листе Excel:
|
A |
B |
C |
D |
1 |
|
|
Оценки |
|
2 |
|
Лекции |
ЛР+дем. |
Видеозап |
3 |
Студент |
X1 |
X2 |
X3 |
4 |
1 |
55 |
56 |
50 |
5 |
2 |
57 |
60 |
52 |
6 |
3 |
60 |
62 |
60 |
7 |
4 |
63 |
67 |
61 |
8 |
5 |
72 |
70 |
63 |
9 |
6 |
73 |
71 |
69 |
10 |
7 |
79 |
82 |
71 |
11 |
8 |
85 |
88 |
80 |
12 |
9 |
92 |
95 |
82 |
13 |
Медиана |
72 |
70 |
63 |
Рис.4 Данные об оценках.
В ячейки В13:D13 введены формулы для подсчета медианы:
= МЕДИАНА(B4:B12) ; = МЕДИАНА(C4:C12) ; = МЕДИАНА(D4:D12)
Последующие вычисления абсолютных величин разностей между статистическими данными и медианами разместим так:
|
A |
B |
C |
D |
17 |
|
X1-Me1 |
X2 - Me2 |
X3-Me3 |
18 |
Студент |
X1 |
X2 |
X3 |
19 |
1 |
17 |
14 |
13 |
20 |
2 |
15 |
10 |
11 |
21 |
3 |
12 |
8 |
3 |
22 |
4 |
9 |
3 |
2 |
23 |
5 |
0 |
0 |
0 |
24 |
6 |
1 |
1 |
6 |
25 |
7 |
7 |
12 |
8 |
26 |
8 |
13 |
18 |
17 |
27 |
9 |
20 |
25 |
19 |
Рис.5. Подготовка данных для критерия Левенэ
Для проверки гипотезы о равенстве дисперсий генеральных совокупностей в соответствии с критерием Левенэ необходимо выполнить следующие действия:
Сервис Анализ данных Однофакторный дисперсионный анализ
В диалоговом окне Однофакторный дисперсионный анализ заполнить поля (рис.6):
Ввести в окно редактирования Входной интервал диапазон B18 : D27.
Установить переключатель Группирование в положение По столбцам.
Установить флажок Метки в первой строке.
Ввести в окне Альфа число 0,05.
Установить переключатель Параметры вывода в положение Выходной интервал и ввести номер ячейки вывода результатов.
Щелкнуть на кнопке OK.
Рис.6. Заполнение диалогового окна
В результате получим: F = 0,1314 . Поскольку значение статистики F меньше критического Fкр (0,05;3;24) = 3,4, гипотеза об однородности трех генеральных совокупностей оценок студентов после трех разных методов обучения не отклоняется. Этот же вывод подтверждается p-значением, равным 0,8775, что значительно больше уровня значимости, равного 0,05.
Однофакторный дисперсионный анализ |
|
|
|
|
|
|
|
|
|
|
|
|
|
ИТОГИ |
|
|
|
|
|
|
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
|
|
X1 |
9 |
94 |
10,44444 |
47,0277778 |
|
|
X2 |
9 |
91 |
10,11111 |
67,8611111 |
|
|
X3 |
9 |
79 |
8,777778 |
44,9444444 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
Источник вариации |
SS |
df |
MS |
F |
p-значеие |
F критическое |
Между группами |
14 |
2 |
7 |
0,13138686 |
0,87750485 |
3,402826105 |
Внутри групп |
1278,667 |
24 |
53,27778 |
|
|
|
|
|
|
|
|
|
|
Итого |
1292,667 |
26 |
|
|
|
|
Таким образом, между дисперсиями оценок трех групп студентов существенной разницы нет.
