Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теор_вероятности_14_ноября_2014.DOC
Скачиваний:
5
Добавлен:
01.07.2025
Размер:
3.41 Mб
Скачать

2.2.2. Исследование статистических различий между двумя выборками

Постановка задачи о проверке значимости различий.

Гипотеза однородности выборок

Пусть для изучения некоторой переменной  сформированы две выборки:

– объем первой выборки;

– объем второй выборки.

Получение этих выборок может отличаться по времени регистрации, месту сбора информации, типу объектов и т.д.

Возникает вопрос: значимо либо незначимо различаются эти выборки? Другими словами, извлечены эти выборки из одной и той же генеральной совокупности либо их следует отнести к различным генеральным совокупностям?

Проведем данную описательную постановку вопроса на математический язык и сведем к задаче проверки статистической гипотезы.

Выдвинем нулевую гипотезу , состоящую в том, что генеральные совокупности, из которых извлечены данные выборки, одинаковы, т.е. имеют одинаковые функции распределения:

,

при альтернативной гипотезе

.

Выдвинутая гипотеза означает отсутствие статистических различий и называется гипотезой однородности выборок. Таким образом, возникает следующая математическая задача: требуется на заданном уровне значимости проверить гипотезу однородности об отсутствии статистических различий между двумя выборками.

Различным конкретизациям гипотезы однородности соответствуют свои критерии проверки, которые называются критериями однородности.

Критерий однородности Фишера – Стьюдента

Этот объединенный критерий состоит в последовательном применении к данным выборкам классических критериев Фишера и Стьюдента.

Критерий Фишера

Условия применимости этого критерия:

  • данные выборки независимые;

  • соответствующие генеральные совокупности имеют нормальное распределение.

Поскольку нормальный закон распределения имеет два параметра и , то для совпадения функций распределения и достаточно убедиться в соответствующих равенствах одноименных параметров. Предварительно следует проверить гипотезу о равенстве генеральных дисперсий.

На заданном уровне значимости для данных выборок (при указанных предположениях) проверяется гипотеза о равенстве генеральных дисперсий:

при .

В качестве статистики критерия проверки используется случайная величина

,

характеризующая отношение большей "исправленной" дисперсии к меньшей. Установлено, что эта случайная величина F при условии справедливости выдвинутой гипотезы имеет распределение Фишера с и степенями свободы. Здесь – объем выборки, по которой вычислена большая "исправленная" дисперсия, а – объем выборки с меньшей "исправленной" дисперсией.

По данным выборкам вычисляем наблюдаемое значение статистики Фишера .

По таблице квантилей распределения Фишера (табл.П7)7 для уровня значимости (вдвое меньше заданного) и найденным числам степеней свободы и определяем критическую точку статистики Фишера в соответствии с равенством

,

где (порядок квантили).

Критерий Фишера (разрешающее правило) проверки гипотезы однородности состоит в следующем:

1. Если , то гипотеза сохраняется (генеральные дисперсии практически совпадают).

2. Если же , то гипотеза решительно отвергается (выборки значимо отличаются друг от друга).

Критерий Стьюдента

Он применяется после критерия Фишера только в том случае, если гипотеза о равенстве генеральных дисперсий по критерию Фишера сохраняется.

Условия применимости критерия Стьюдента:

  • выборки независимые;

  • генеральные совокупности имеют нормальное распределение;

  • независимые генеральные дисперсии равны .

Заметим, что последнее требование при последовательном применении критериев будет автоматически выполнено.

На заданном уровне значимости для данных выборок проверяется гипотеза о равенстве генеральных математических ожиданий:

при .

В качестве статистики критерия проверки используется случайная величина

.

Установлено, что при условии справедливости выдвинутой гипотезы эта случайная величина имеет t-распределение Стьюдента с степенями свободы.

По данным выборок вычисляем наблюдаемое значение статистики Стьюдента .

По таблице квантилей распределения Стьюдента (табл.П6)8 для заданного уровня значимости и найденного числа степеней свободы определяем критическую точку статистики Стьюдента в соответствии с равенством

,

где (порядок квантили).

Разрешающее правило проверки гипотезы состоит в следующем:

1 Если , то гипотеза сохраняется (генеральные математические ожидания практически совпадают).

2 Если же , то гипотеза отвергается (выборки значимо различаются друг от друга).

Примечание: При применении объединенного критерия Фишера – Стьюдента обязательным требованием является нормальность распределения. При этом гипотеза однородности (об отсутствии значимых статистических различий между выборками) подтверждается только в случае сохранения обеих гипотез, проверяемых соответственно по критерию Фишера ( ) и критерию Стьюдента ( ). Если хотя бы одна из этих частных гипотез отвергается, то можно уверенно утверждать о наличии значимых статистических различий между данными выборками.

Критерий однородности Вилкоксона

Этот критерий рекомендуется применять в тех случаях, когда распределение генеральной совокупности отличается от нормального или это распределение фактически неизвестно.

Условия применимости критерия Вилкоксона:

  • изучаемая переменная является непрерывной случайной величиной;

  • данные выборки независимые;

  • .

На заданном уровне значимости проверяется гипотеза однородности (об отсутствии значимых статистических различий между данными выборками):

при .

Предварительно расположим элементы обеих выборок в виде одного объединенного вариационного ряда (в порядке неубывания наблюдаемых значений). Каждому элементу объединенного ряда присвоим ранг – порядковый номер в ряде. Если несколько элементов объединенного ряда совпадают по величине, то применим так называемый способ средних рангов, а именно каждому из элементов однородной группы присвоим ранг, равный среднему арифметическому их порядковых номеров.

Пусть – сумма рангов элементов 1-й выборки, – сумма рангов элементов 2-й выборки.

Составим выражения ,

;

при этом должно соблюдаться контрольное соотношение

.

Найдем величину .

В качестве статистики критерия Вилкоксона проверки гипотезы однородности используется случайная величина

.

Установлено, что при условии справедливости выдвинутой гипотезы эта случайная величина Z имеет стандартное нормальное распределение (0;1).

По данным выборок вычисляем наблюдаемое значение статистики Вилкоксона .

По таблице квантилей стандартного нормального распределения (0;1) (табл.П1)9 для заданного уровня значимости определяем критическую точку статистики Z в соответствии с равенством:

,

где (порядок квантили).

Разрешающее правило (критерий) проверки гипотезы однородности заключается в следующем:

1. Если , то гипотеза сохраняется (выборки практически однородны).

2. Если же , то гипотеза решительно отвергается (выборки значимо отличаются друг от друга).

Пример. Даны две независимые выборки

50

41

48

60

46

60

51

42

62

54

42

46

38

40

47

51

63

50

63

57

59

51

Требуется на уровне значимости проверить гипотезы однородности этих выборок с помощью:

1) критерия однородности Фишера – Стьюдента;

2) критерия Вилкоксона.

Решение поставленной задачи начнем с применения объединенного критерия Фишера – Стьюдента при молчаливом предположении нормальности распределения.

1. Сначала с помощью критерия Фишера проверим гипотезу о равенстве генеральных дисперсий при .

Предварительно для данных выборок найдем выборочные средние и исправленные дисперсии:

.

Далее вычислим наблюдаемое значение статистики Фишера:

и найдем числа степеней свободы:

, .

По таблице квантилей распределения Фишера определим критическую точку статистики Фишера:

.

Заметим, что порядок квантили .

Сравнивая и , обнаруживаем, что , и в соответствии с разрешающим правилом критерия Фишера заключаем, что гипотеза о равенстве генеральных дисперсий сохраняется.

Теперь с помощью критерия Стьюдента проверим гипотезу о равенстве генеральных математических ожиданий при .

Для этого вычислим наблюдаемое значение статистики Стьюдента:

и найдем число степеней свободы .

По таблице квантилей распределения Стьюдента определим критическую точку статистики Стьюдента:

.

Так как , то в соответствии с разрешающим правилом критерия Стьюдента заключаем, что и гипотеза о равенстве математических ожиданий сохраняется.

Таким образом, согласно объединенному критерию Фишера – Стьюдента данные выборки практически однородны, т.е. различаются статистически незначимо.

2. Перейдем к применению критерия однородности Вилкоксона.

Сначала расположим элементы обеих выборок в виде одного объединенного вариационного ряда и присвоим им порядковые номера (условно строгая ранжировка). При этом элементы второй выборки для отчетливости их выделения пометим чертой сверху:

41

42

42

46

46

48

50

51

3

4

5

6

7

9

10

12

54

60

60

62

15

18

19

20

Затем применим способ средних рангов:

41

42

42

46

46

48

50

3

4,5

4,5

6,5

6,5

9

10,5

51

54

60

60

62

13

15

18,5

18,5

20

Далее последовательно находим

;

.

Затем вычисляем наблюдаемое значение статистики Вилкоксона:

.

По таблице квантилей стандартного нормального распределения (0;1) для заданного уровня значимости определяем критическую точку статистики Z:

.

Так как , то в соответствии с разрешающим правилом критерия Вилкоксона заключаем, что гипотеза однородности сохраняется, что свидетельствует об отсутствии значимых статистических различий между двумя данными выборками.