
- •I. Основы проверки гипотез: критерии одиночной выборки
- •1.1. Нулевая и альтернативная гипотеза
- •1.2. Области отклонения и принятия гипотез. Критическое значение тестовой статистики
- •Область отклонения гипотезы
- •Область отклонения гипотезы
- •Область принятия гипотезы
- •1.3. Риски, возникающие при проверке гипотез
- •1.4. Риски, возникающие при принятии решений
- •Проверка гипотез и принятие решения
- •1.5. Использование z-критерия для проверки гипотезы о математическом ожидании при известном стандартном отклонении
- •Область принятия гипотезы
- •1.6. Односторонние критерии
- •1.7. Использование t-критерия для проверки гипотезы о математическом ожидании при неизвестном стандартном отклонении
- •1.8. Применение z-критерия для проверки гипотезы о доле признака в генеральной совокупности
- •II. Проверка гипотез для оценки свойств двух генеральных совокупностей
- •2,1. Использование z-критерия6 для оценки разности между двумя математическими ожиданиями
- •2.2. Применение t-критерия7 для оценки разности между математическими ожиданиями с помощью суммарной дисперсии
- •2.3. Использование t-критерия для оценки разности между двумя математическими ожиданиями с помощью раздельной дисперсии
- •III. Критерии оценки свойств двух зависимых генеральных совокупностей
- •3. 1. Критерии для оценки разности между двумя математическими ожиданиями
- •Измерения результатов тестирования
- •3.2. Использование z-критерия для оценки разности между двумя долями признака
- •IV. Вопросы и задачи проверки знаний
- •4.1. Общие вопросы проверки знаний
- •4.2. Задачи проверки знаний по материалу учебного модуля «Основы проверки гипотез»
2.2. Применение t-критерия7 для оценки разности между математическими ожиданиями с помощью суммарной дисперсии
В большинстве ситуаций дисперсии и стандартные отклонения двух генеральных совокупностей неизвестны. Единственная информация, доступная исследователю, — выборочные средние, выборочные дисперсии и выборочные стандартные отклонения. Если выборки являются случайными, независимыми и извлечены из нормально распределенных реальных совокупностей, имеющих одинаковую дисперсию (т.е. s12 = s22), для проверки гипотезы о значимом различии между математическими ожиданиями двух генеральных совокупностей можно применять t-критерий, использующий суммарную дисперсию.
Нулевая гипотеза состоит в том, что математические ожидания двух независимых генеральных совокупностей не отличаются друг от друга:
H0: µ1 = µ2 или µ1 - µ2 = 0.
Альтернативная гипотеза заключается в том, что математические ожидания не совпадают:
H1: µ1 ≠ µ2 или µ1 - µ2 ≠ 0.
t-критерий для оценки разности между двумя математическими ожиданиями с помощью суммарной дисперсии имеет вид:
,
(7)
где
- выборочная cсуммарная
дисперсия;
S12 — дисперсия выборки из первой генеральной совокупности;
n1 — объем выборки, извлеченной из первой генеральной совокупности;
S22 — дисперсия выборки из второй генеральной совокупности;
n2 — объем выборки, извлеченной из второй генеральной совокупности.
Статистика t, зависящая от суммарной дисперсии, имеет t-распределение Стьюдента с n1+n2-2 степенями свободы. При заданном уровне значимости a двусторонний критерий отклоняет нулевую гипотезу, если t-статистика больше верхнего критического значения или меньше нижнего критического значения. Процедуры Excel по проверке гипотезы о разности математических ожиданий двух генеральных совокупностей с помощью t - критерия, использующего суммарную дисперсию, приведены в табл. 3.10.
2.3. Использование t-критерия для оценки разности между двумя математическими ожиданиями с помощью раздельной дисперсии
Если
дисперсии двух генеральных совокупностей
не одинаковы8,
то объединение их в одну суммарную
дисперсию
,
не вполне корректно.
Для
решения этой проблемы Саттерсвейт
(Satterthwaite)
предложил t-критерий,
использующий раздельную (различную)
дисперсию9.
Продемонстрируем различные варианты решения задач применения t-критерия для оценки разности между двумя математическими ожиданиями с использованием программы Microsoft Excel.
Упражнение 4.
Предположим, что с целью оценки качества усвоения материала по дисциплине «Информатика» студентами различных специальностей, было проведено выборочное тестирование студентов специальностей Управление качеством (УК) и Инноватика (И). Результаты выборочного тестирования приведены в табл. 4. Требуется определить - совпадают ли средние значения оценок результатов тестирования по дисциплине «Информатика», полученных всеми студентами групп УК и И. Иными словами, необходимо выяснить - качество усвоения дисциплины «Информатика» студентами различных специальностей вуза находится па одном уровне или эти уровни статистически различаются?
В этой задаче рассматриваются две генеральные совокупности. Первую генеральную совокупность составляют студенты специальности УК, а во вторую генеральную совокупность входят студенты вуза специальности И.
Сформулируем статистические гипотезы следующим образом.
Нулевая гипотеза состоит в том, что математические ожидания двух независимых генеральных совокупностей не отличаются друг от друга:
H0: µ1 = µ2 или µ1 - µ2 = 0.
Альтернативная гипотеза заключается в том, что математические ожидания не совпадают:
H1: µ1 ≠ µ2 или µ1 - µ2 ≠ 0.
Таблица 4
Оценки, выставленные студентам по результатам тестирования |
|
Студенты специальности УК |
Студенты специальности И |
3 |
2 |
4 |
4 |
4 |
4 |
4 |
5 |
3 |
3 |
2 |
3 |
2 |
4 |
5 |
3 |
4 |
2 |
3 |
4 |
|
4 |
Предполагая,
что выборки извлечены из нормально
распределенных генеральных совокупностей,
имеющих одинаковую дисперсию (т.е.
),
применим t-критерий,
использующий суммарную дисперсию. Эта
статистика имеет t-распределение
с 10 + 11 - 2 = 19 степенями свободы, т.к.
n1=10,
а n2
= 11. Если уровень значимости двустороннего
критерия равен 0,05, то из таблицы для
распределения Стьюдента следует, что
критические значения t-статистики
с 19 степенями свободы равны +2,09 и -2,09.
Решающее правило имеет следующий вид:
если t > t19 =+2,09 или t <-t19 = - 2,09, то нулевая гипотеза Н0 отклоняется, в противном случае она не отклоняется.
Расчеты, выполненные по формуле (7), приводят к следующим результатам:
= - 0,131,
где
При уровне значимости равном 0,05 нулевая гипотеза не может быть отклонена, так как t = - 0,13 > t19 = - 2,09.
Воспользовавшись программой Microsoft Excel, получаем аналогичные результаты, представленные в табл. 3.7.
Наблюдаемый уровень значимости (p-значение), вычисленный с помощью программы Microsoft Excel, равен 0,896774. Это означает, что по имеющимся статистическим данным, если мы отклоним гипотезу Н0, то с вероятностью 0,896774 совершим ошибку (ошибку первого рода α). Поскольку p-значение больше 0,05, у нас нет оснований отклонить нулевую гипотезу. Таким образом, можно утверждать, что степень усвоения дисциплины «Информатика» студентами специальностей УК и И находится на одном статистическом уровне.
Из табл. 5 видно, что дисперсии выборок не равны между собой, что, однако, еще не означает различия дисперсий их генеральных совокупностей. Однако, в общем случае объединение выборочных данных в одну суммарную дисперсию некорректно.
Результаты применения t-критерия, использующего раздельную дисперсию, полученный с помощью программы Microsoft Excel, для рассматриваемого примера, приведены в табл. 6.
Обратите
внимание на то, что результаты применения
t-критерия,
использующего раздельную дисперсию,
практически не отличаются от результатов,
полученных с помощью t-критерия,
использующего суммарную дисперсию.
Предположение о равенстве дисперсий в
этой задаче практически не влияет на
результат. Однако в других ситуациях
эти критерии могут привести к
противоположным выводам. Проблема
проверки равенства дисперсий является
весьма важной частью анализа данных.
Для ее решения можно применять F-критерий.
Проверка разности между дисперсиями
двух генеральных совокупностей основана
на исследовании их отношения. Если
каждая генеральная совокупность является
нормально распределенной, отношение
S
/S
подчиняется
F-распределению.
Критическое значение F-распределения
зависит от степеней свободы двух
множеств. Степени свободы числителя
относятся к выборке, у которой дисперсия
больше, а степени свободы знаменателя
— к выборке, у которой дисперсия меньше.
Для проверки равенства двух дисперсий
в критерии используется F-статистика:
.
Если F-статистика больше критического значения Fкр, то нулевая гипотеза отклоняется. В противном случае нулевая гипотеза не отклоняется. Расчеты по вычислению F-статистики и установлению критического значения Fкр легко и просто выполнить с помощью программы Microsoft Excel. Для рассматриваемого примера (см. табл. 4)лнить соьше,, вариант использования программы Microsoft Excel для проверки разности между дисперсиями двух генеральных совокупностей, приведен в табл. 7.
Таблица 5
Двухвыборочный t-тест с одинаковыми дисперсиями |
||
Студенты специальностей |
УК |
И |
Среднее |
3,4 |
3,454545 |
Дисперсия |
0,933333 |
0,872727 |
Наблюдения |
10 |
11 |
Объединенная дисперсия |
0,901435 |
|
Гипотетическая разность средних |
0 |
|
df |
19 |
|
t-статистика |
-0,13149 |
|
P(T<=t) одностороннее |
0,448387 |
|
t критическое одностороннее |
1,729133 |
|
P(T<=t) двухстороннее |
0,896774 |
Это показатель α |
t критическое двухстороннее |
2,093024 |
|
Таблица 6
Двухвыборочный t-тест с различными дисперсиями |
||
Студенты специальностей |
УК |
И |
Среднее |
3,4 |
3,454545455 |
Дисперсия |
0,933333 |
0,872727273 |
Наблюдения |
10 |
11 |
Гипотетическая разность средних |
0 |
|
df |
19 |
|
t-статистика |
-0,13126 |
|
P(T<=t) одностороннее |
0,448473 |
|
t критическое одностороннее |
1,729133 |
|
P(T<=t) двухстороннее |
0,896946 |
|
t критическое двухстороннее |
2,093024 |
|
Таблица 7
Двухвыборочный F-тест для дисперсии |
||
|
УК |
И |
Среднее |
3,4 |
3,45454545 |
Дисперсия |
0,93333333 |
0,87272727 |
Наблюдения |
10 |
11 |
df |
9 |
10 |
F |
1,06944444 |
|
P(F<=f) одностороннее |
0,45531337 |
|
F критическое одностороннее |
3,02038295 |
|
Обратите внимание на то, что два разных t-критерия привели к одинаковым результатам. Предположение о равенстве дисперсий в этой задаче практически не влияет на результат. Однако в других ситуациях эти критерии могут привести к противоположным выводам.
Процедуры Excel
проверка гипотезы о разности математических ожиданий двух генеральных совокупностей на основе исходных выборок с помощью t - критерия, использующего суммарную дисперсию |
1.
Выбрать
команду:
Сервис |
2. В диалоговом окне Анализ данных выбрать пункт Двухвыборочный t-тест с одинаковыми дисперсиями и щелкнуть на кнопке ОК |
3. В диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями сделать следующее: |
3.1. Ввести в окне редактирования Интервал переменной 1 A1:A11 |
3.2. Ввести в окне редактирования Интервал переменной 2 В1 : В11 |
3.3. Ввести в окне Гипотетическая средняя разность число 0 |
3.4. Установить флажок Метки |
3.5. Ввести в окне редактирования Альфа число 0,05 |
3.6. Установить Новый рабочий лист и ввести название нового листа |
3.7. Щелкнуть на кнопке ОК. |