Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
II- Гипотезы БАЗА-1.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
675.33 Кб
Скачать

2.2. Применение t-критерия7 для оценки разности между математическими ожиданиями с помощью суммарной дисперсии

В большинстве ситуаций дисперсии и стандартные отклонения двух генеральных совокупностей неизвестны. Единственная информация, доступная исследователю, — выборочные средние, выборочные дисперсии и выборочные стандартные отклонения. Если выборки являются случайными, независимыми и извлечены из нормально распределенных реальных совокупностей, имеющих одинаковую дисперсию (т.е. s12 = s22), для проверки гипотезы о значимом различии между математическими ожиданиями двух генеральных совокупностей можно применять t-критерий, использующий суммарную дисперсию.

Нулевая гипотеза состоит в том, что математические ожидания двух независимых генеральных совокупностей не отличаются друг от друга:

H0: µ1 = µ2 или µ1 - µ2 = 0.

Альтернативная гипотеза заключается в том, что математические ожидания не совпадают:

H1: µ1 ≠ µ2 или µ1 - µ20.

t-критерий для оценки разности между двумя математическими ожиданиями с помощью суммарной дисперсии имеет вид:

, (7)

где - выборочная cсуммарная дисперсия;

S12 — дисперсия выборки из первой генеральной совокупности;

n1 — объем выборки, извлеченной из первой генеральной совокупности;

S22 — дисперсия выборки из второй генеральной совокупности;

n2 — объем выборки, извлеченной из второй генеральной совокупности.

Статистика t, зависящая от суммарной дисперсии, имеет t-распределение Стьюдента с n1+n2-2 степенями свободы. При заданном уровне значимости a двусторонний критерий отклоняет нулевую гипотезу, если t-статистика больше верхнего критического значения или меньше нижнего критического значения. Процедуры Excel по проверке гипотезы о разности математических ожиданий двух генеральных совокупностей с помощью t - критерия, использующего суммарную дисперсию, приведены в табл. 3.10.

2.3. Использование t-критерия для оценки разности между двумя математическими ожиданиями с помощью раздельной дисперсии

Если дисперсии двух генеральных совокупностей не одинаковы8, то объединение их в одну суммарную дисперсию , не вполне корректно. Для решения этой проблемы Саттерсвейт (Satterthwaite) предложил t-критерий, использующий раздельную (различную) дисперсию9.

Продемонстрируем различные варианты решения задач применения t-критерия для оценки разности между двумя математическими ожиданиями с использованием программы Microsoft Excel.

Упражнение 4.

Предположим, что с целью оценки качества усвоения материала по дисциплине «Информатика» студентами различных специальностей, было проведено выборочное тестирование студентов специальностей Управление качеством (УК) и Инноватика (И). Результаты выборочного тестирования приведены в табл. 4. Требуется определить - совпадают ли средние значения оценок результатов тестирования по дисциплине «Информатика», полученных всеми студентами групп УК и И. Иными словами, необходимо выяснить - качество усвоения дисциплины «Информатика» студентами различных специальностей вуза находится па одном уровне или эти уровни статистически различаются?

В этой задаче рассматриваются две генеральные совокупности. Первую генеральную совокупность составляют студенты специальности УК, а во вторую генеральную совокупность входят студенты вуза специальности И.

Сформулируем статистические гипотезы следующим образом.

Нулевая гипотеза состоит в том, что математические ожидания двух независимых генеральных совокупностей не отличаются друг от друга:

H0: µ1 = µ2 или µ1 - µ2 = 0.

Альтернативная гипотеза заключается в том, что математические ожидания не совпадают:

H1: µ1 ≠ µ2 или µ1 - µ20.

Таблица 4

Оценки, выставленные студентам по результатам тестирования

Студенты специальности УК

Студенты специальности И

3

2

4

4

4

4

4

5

3

3

2

3

2

4

5

3

4

2

3

4

4

Предполагая, что выборки извлечены из нормально распределенных генеральных совокупностей, имеющих одинаковую дисперсию (т.е. ), применим t-критерий, использующий суммарную дисперсию. Эта статистика имеет t-распределение с 10 + 11 - 2 = 19 степенями свободы, т.к. n1=10, а n2 = 11. Если уровень значимости двустороннего крите­рия равен 0,05, то из таблицы для распределения Стьюдента следует, что критические значения t-статистики с 19 степенями свободы равны +2,09 и -2,09.

Решающее правило имеет следующий вид:

если t > t19 =+2,09 или t <-t19 = - 2,09, то нулевая гипотеза Н0 отклоняется, в противном случае она не отклоняется.

Расчеты, выполненные по формуле (7), приводят к следующим результатам:

= - 0,131,

где

При уровне значимости равном 0,05 нулевая гипотеза не может быть отклонена, так как t = - 0,13 > t19 = - 2,09.

Воспользовавшись программой Microsoft Excel, получаем аналогичные результаты, представленные в табл. 3.7.

Наблюдаемый уровень значимости (p-значение), вычисленный с помощью программы Microsoft Excel, равен 0,896774. Это означает, что по имеющимся статистическим данным, если мы отклоним гипотезу Н0, то с вероятностью 0,896774 совершим ошибку (ошибку первого рода α). Поскольку p-значение больше 0,05, у нас нет оснований отклонить нулевую гипотезу. Таким образом, можно утверждать, что степень усвоения дисциплины «Информатика» студентами специальностей УК и И находится на одном статистическом уровне.

Из табл. 5 видно, что дисперсии выборок не равны между собой, что, однако, еще не означает различия дисперсий их генеральных совокупностей. Однако, в общем случае объединение выборочных данных в одну суммарную дисперсию некорректно.

Результаты применения t-критерия, использующего раздельную дисперсию, полученный с помощью программы Microsoft Excel, для рассматриваемого примера, приведены в табл. 6.

Обратите внимание на то, что результаты применения t-критерия, использующего раздельную дисперсию, практически не отличаются от результатов, полученных с помощью t-критерия, использующего суммарную дисперсию. Предположение о равенстве дисперсий в этой задаче практически не влияет на результат. Однако в других ситуациях эти критерии могут привести к противоположным выводам. Проблема проверки равенства дисперсий является весьма важной частью анализа данных. Для ее решения можно применять F-критерий. Проверка разности между дисперсиями двух генеральных совокупностей основана на исследовании их отношения. Если каждая генеральная совокупность является нормально распределенной, отношение S /S подчиняется F-распределению. Критическое значение F-распределения зависит от степеней свободы двух множеств. Степени свободы числителя относятся к выборке, у которой дисперсия больше, а степени свободы знаменателя — к выборке, у которой дисперсия меньше. Для проверки равенства двух дисперсий в критерии используется F-статистика:

.

Если F-статистика больше критического значения Fкр, то нулевая гипотеза отклоняется. В противном случае нулевая гипотеза не отклоняется. Расчеты по вычислению F-статистики и установлению критического значения Fкр легко и просто выполнить с помощью программы Microsoft Excel. Для рассматриваемого примера (см. табл. 4)лнить соьше,, вариант использования программы Microsoft Excel для проверки разности между дисперсиями двух генеральных совокупностей, приведен в табл. 7.

Таблица 5

Двухвыборочный t-тест с одинаковыми дисперсиями

Студенты специальностей 

УК

И

Среднее

3,4

3,454545

Дисперсия

0,933333

0,872727

Наблюдения

10

11

Объединенная дисперсия

0,901435

Гипотетическая разность средних

0

df

19

t-статистика

-0,13149

P(T<=t) одностороннее

0,448387

t критическое одностороннее

1,729133

P(T<=t) двухстороннее

0,896774

Это показатель α

t критическое двухстороннее

2,093024

 

Таблица 6

Двухвыборочный t-тест с различными дисперсиями

Студенты специальностей  

УК

И

Среднее

3,4

3,454545455

Дисперсия

0,933333

0,872727273

Наблюдения

10

11

Гипотетическая разность средних

0

df

19

t-статистика

-0,13126

P(T<=t) одностороннее

0,448473

t критическое одностороннее

1,729133

P(T<=t) двухстороннее

0,896946

t критическое двухстороннее

2,093024

 

Таблица 7

Двухвыборочный F-тест для дисперсии

 

УК

И

Среднее

3,4

3,45454545

Дисперсия

0,93333333

0,87272727

Наблюдения

10

11

df

9

10

F

1,06944444

P(F<=f) одностороннее

0,45531337

F критическое одностороннее

3,02038295

 

Обратите внимание на то, что два разных t-критерия привели к одинаковым результатам. Предположение о равенстве дисперсий в этой задаче практически не влияет на результат. Однако в других ситуациях эти критерии могут привести к противоположным выводам.

Процедуры Excel

проверка гипотезы о разности математических ожиданий двух генеральных совокупностей на основе исходных выборок с помощью t - критерия, использующего суммарную дисперсию

1. Выбрать команду: Сервис Анализ данных....

2. В диалоговом окне Анализ данных выбрать пункт Двухвыборочный t-тест с одинаковыми дисперсиями и щелкнуть на кнопке ОК

3. В диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями сделать следующее:

3.1. Ввести в окне редактирования Интервал переменной 1 A1:A11

3.2. Ввести в окне редактирования Интервал переменной 2 В1 : В11

3.3. Ввести в окне Гипотетическая средняя разность число 0

3.4. Установить флажок Метки

3.5. Ввести в окне редактирования Альфа число 0,05

3.6. Установить Новый рабочий лист и ввести название нового листа

3.7. Щелкнуть на кнопке ОК.