- •Введение
- •1. Основные понятия теории вероятностей Операции над событиями
- •Частость наступления события
- •Свойства частости
- •Аксиоматика теории вероятности Построение вероятностного пространства
- •Теорема о продолжении меры
- •Определение вероятностного пространства
- •Классическое определение вероятности
- •Условная вероятность
- •Обоснование формулы условной вероятности в общем случае
- •Независимые события
- •Формула сложения вероятностей
- •Формула полной вероятности
- •Формула Байеса
- •Композиция испытаний
- •Композиция n испытаний
- •Композиция n независимых испытаний
- •Биномиальное распределение
- •Случайная величина Теорема Колмогорова
- •Дискретные случайные величины
- •Вероятностные характеристики дискретных случайных величин
- •Свойства математического ожидания
- •Производная функция
- •Первая модель распределения Пуассона
- •Вторая модель распределения Пуассона
- •Непрерывные случайные величины
- •Свойства плотности вероятности
- •Второе эквивалентное определение плотности вероятности
- •Вероятностные характеристики непрерывных случайных величин
- •Распределение Гаусса - нормальное
- •Функция Лапласа
- •Неравенство Чебышева
- •Многомерные случайные величины
- •Аксиоматика. Формальная вероятностная модель
- •Двумерные случайные величины
- •Двумерные непрерывные случайные величины
- •2. Основы математической статистики
- •2.1. Основные понятия математической статистики
- •Интервальная группировка и представление выборочных данных
- •Числовые характеристики распределения выборки
- •Точечные статистические оценки параметров распределения
- •2.1.5.3. "Исправленная" дисперсия и "исправленное" среднее квадратическое отклонение
- •Интервальные статистические оценки параметров распределения (доверительные интервалы)
- •2.1.6.3. Доверительный интервал для математического ожидания нормального распределения случайной величины
- •Основные законы распределения, используемые в статистических исследованиях
- •Асимметрия и эксцесс распределения
- •2.2. Основные методы математической статистики
- •2.2.1. Проверка статистических гипотез
- •Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий Колмогорова
- •2.2.2. Исследование статистических различий между двумя выборками
- •Список использованных источников
- •Содержание Справочные материалы
- •Значения функции
- •Значения нормально распределенной случайной величины z
- •На интервале [0,1]
- •Значения функции
- •Табличные (критические) значения функции распределения χ2
2.2.2. Исследование статистических различий между двумя выборками
Постановка задачи о проверке значимости различий.
Гипотеза однородности выборок
Пусть для изучения некоторой переменной сформированы две выборки:
– объем первой выборки;
– объем второй выборки.
Получение этих выборок может отличаться по времени регистрации, месту сбора информации, типу объектов и т.д.
Возникает вопрос: значимо либо незначимо различаются эти выборки? Другими словами, извлечены эти выборки из одной и той же генеральной совокупности либо их следует отнести к различным генеральным совокупностям?
Проведем данную описательную постановку вопроса на математический язык и сведем к задаче проверки статистической гипотезы.
Выдвинем нулевую гипотезу , состоящую в том, что генеральные совокупности, из которых извлечены данные выборки, одинаковы, т.е. имеют одинаковые функции распределения:
,
при альтернативной гипотезе
.
Выдвинутая гипотеза означает отсутствие статистических различий и называется гипотезой однородности выборок. Таким образом, возникает следующая математическая задача: требуется на заданном уровне значимости проверить гипотезу однородности об отсутствии статистических различий между двумя выборками.
Различным конкретизациям гипотезы однородности соответствуют свои критерии проверки, которые называются критериями однородности.
Критерий однородности Фишера – Стьюдента
Этот объединенный критерий состоит в последовательном применении к данным выборкам классических критериев Фишера и Стьюдента.
Критерий Фишера
Условия применимости этого критерия:
данные выборки независимые;
соответствующие генеральные совокупности имеют нормальное распределение.
Поскольку нормальный
закон распределения имеет два параметра
и
,
то для совпадения функций распределения
и
достаточно убедиться в соответствующих
равенствах одноименных параметров.
Предварительно следует проверить
гипотезу о равенстве генеральных
дисперсий.
На заданном уровне значимости для данных выборок (при указанных предположениях) проверяется гипотеза о равенстве генеральных дисперсий:
при
.
В качестве статистики критерия проверки используется случайная величина
,
характеризующая
отношение большей "исправленной"
дисперсии к меньшей. Установлено, что
эта случайная величина F
при условии справедливости выдвинутой
гипотезы
имеет распределение Фишера с
и
степенями свободы. Здесь
– объем выборки, по которой вычислена
большая "исправленная" дисперсия,
а
– объем выборки с меньшей "исправленной"
дисперсией.
По данным выборкам
вычисляем наблюдаемое значение статистики
Фишера
.
По таблице квантилей
распределения Фишера (табл.П7)7
для уровня значимости
(вдвое меньше заданного) и найденным
числам степеней свободы
и
определяем критическую точку статистики
Фишера в соответствии с равенством
,
где
(порядок квантили).
Критерий Фишера (разрешающее правило) проверки гипотезы однородности состоит в следующем:
1. Если
,
то гипотеза
сохраняется (генеральные дисперсии
практически совпадают).
2. Если же
,
то гипотеза
решительно отвергается (выборки значимо
отличаются друг от друга).
Критерий Стьюдента
Он применяется после критерия Фишера только в том случае, если гипотеза о равенстве генеральных дисперсий по критерию Фишера сохраняется.
Условия применимости критерия Стьюдента:
выборки независимые;
генеральные совокупности имеют нормальное распределение;
независимые генеральные дисперсии равны
.
Заметим, что последнее требование при последовательном применении критериев будет автоматически выполнено.
На заданном уровне значимости для данных выборок проверяется гипотеза о равенстве генеральных математических ожиданий:
при
.
В качестве статистики критерия проверки используется случайная величина
.
Установлено, что
при условии справедливости выдвинутой
гипотезы
эта случайная величина имеет t-распределение
Стьюдента с
степенями свободы.
По данным выборок
вычисляем наблюдаемое значение статистики
Стьюдента
.
По таблице квантилей распределения Стьюдента (табл.П6)8 для заданного уровня значимости и найденного числа степеней свободы определяем критическую точку статистики Стьюдента в соответствии с равенством
,
где (порядок квантили).
Разрешающее правило проверки гипотезы состоит в следующем:
1 Если
,
то гипотеза
сохраняется (генеральные математические
ожидания практически совпадают).
2 Если же
,
то гипотеза
отвергается (выборки значимо различаются
друг от друга).
Примечание:
При применении объединенного критерия
Фишера – Стьюдента обязательным
требованием является нормальность
распределения. При этом гипотеза
однородности (об отсутствии значимых
статистических различий между выборками)
подтверждается только в случае сохранения
обеих гипотез, проверяемых соответственно
по критерию Фишера (
)
и критерию Стьюдента (
).
Если хотя бы одна из этих частных гипотез
отвергается, то можно уверенно утверждать
о наличии значимых статистических
различий между данными выборками.
Критерий однородности Вилкоксона
Этот критерий рекомендуется применять в тех случаях, когда распределение генеральной совокупности отличается от нормального или это распределение фактически неизвестно.
Условия применимости критерия Вилкоксона:
изучаемая переменная является непрерывной случайной величиной;
данные выборки независимые;
.
На заданном уровне значимости проверяется гипотеза однородности (об отсутствии значимых статистических различий между данными выборками):
при .
Предварительно расположим элементы обеих выборок в виде одного объединенного вариационного ряда (в порядке неубывания наблюдаемых значений). Каждому элементу объединенного ряда присвоим ранг – порядковый номер в ряде. Если несколько элементов объединенного ряда совпадают по величине, то применим так называемый способ средних рангов, а именно каждому из элементов однородной группы присвоим ранг, равный среднему арифметическому их порядковых номеров.
Пусть
– сумма рангов элементов 1-й выборки,
– сумма рангов элементов 2-й выборки.
Составим выражения
,
;
при этом должно соблюдаться контрольное соотношение
.
Найдем величину
.
В качестве статистики критерия Вилкоксона проверки гипотезы однородности используется случайная величина
.
Установлено, что
при условии справедливости выдвинутой
гипотезы
эта случайная величина Z имеет стандартное
нормальное распределение
(0;1).
По данным выборок вычисляем наблюдаемое значение статистики Вилкоксона .
По таблице квантилей стандартного нормального распределения (0;1) (табл.П1)9 для заданного уровня значимости определяем критическую точку статистики Z в соответствии с равенством:
,
где
(порядок квантили).
Разрешающее правило (критерий) проверки гипотезы однородности заключается в следующем:
1. Если
,
то гипотеза
сохраняется (выборки практически
однородны).
2. Если же
,
то гипотеза
решительно отвергается (выборки значимо
отличаются друг от друга).
Пример. Даны две независимые выборки
|
50 |
41 |
48 |
60 |
46 |
60 |
51 |
42 |
62 |
54 |
42 |
46 |
|
|
38 |
40 |
47 |
51 |
63 |
50 |
63 |
57 |
59 |
51 |
– |
– |
Требуется на уровне значимости проверить гипотезы однородности этих выборок с помощью:
1) критерия однородности Фишера – Стьюдента;
2) критерия Вилкоксона.
Решение поставленной задачи начнем с применения объединенного критерия Фишера – Стьюдента при молчаливом предположении нормальности распределения.
1. Сначала с помощью
критерия Фишера проверим гипотезу о
равенстве генеральных дисперсий
при
.
Предварительно для данных выборок найдем выборочные средние и исправленные дисперсии:
.
Далее вычислим наблюдаемое значение статистики Фишера:
и найдем числа степеней свободы:
,
.
По таблице квантилей распределения Фишера определим критическую точку статистики Фишера:
.
Заметим, что порядок
квантили
.
Сравнивая
и
,
обнаруживаем, что
,
и в соответствии с разрешающим правилом
критерия Фишера заключаем, что гипотеза
о равенстве генеральных дисперсий
сохраняется.
Теперь с помощью
критерия Стьюдента проверим гипотезу
о равенстве генеральных математических
ожиданий
при
.
Для этого вычислим наблюдаемое значение статистики Стьюдента:
и найдем число
степеней свободы
.
По таблице квантилей распределения Стьюдента определим критическую точку статистики Стьюдента:
.
Так как
,
то в соответствии с разрешающим правилом
критерия Стьюдента заключаем, что и
гипотеза о равенстве математических
ожиданий сохраняется.
Таким образом, согласно объединенному критерию Фишера – Стьюдента данные выборки практически однородны, т.е. различаются статистически незначимо.
2. Перейдем к применению критерия однородности Вилкоксона.
Сначала расположим элементы обеих выборок в виде одного объединенного вариационного ряда и присвоим им порядковые номера (условно строгая ранжировка). При этом элементы второй выборки для отчетливости их выделения пометим чертой сверху:
|
|
|
41 |
42 |
42 |
46 |
46 |
|
48 |
50 |
|
51 |
|
|
|
|
3 |
4 |
5 |
6 |
7 |
|
9 |
10 |
|
12 |
|
|
|
|
54 |
|
|
60 |
60 |
62 |
|
|
|
||
|
|
|
15 |
|
|
18 |
19 |
20 |
|
|
|
||
Затем применим способ средних рангов:
|
|
|
41 |
42 |
42 |
46 |
46 |
|
48 |
50 |
|
|
|
|
3 |
4,5 |
4,5 |
6,5 |
6,5 |
|
9 |
10,5 |
|
|
51 |
|
|
54 |
|
|
60 |
60 |
62 |
|
|
|
13 |
|
|
15 |
|
|
18,5 |
18,5 |
20 |
|
|
Далее последовательно находим
;
.
Затем вычисляем наблюдаемое значение статистики Вилкоксона:
.
По таблице квантилей
стандартного нормального распределения
(0;1)
для заданного уровня значимости
определяем критическую точку статистики
Z:
.
Так как
,
то в соответствии с разрешающим правилом
критерия Вилкоксона заключаем, что
гипотеза однородности
сохраняется, что свидетельствует об
отсутствии значимых статистических
различий между двумя данными выборками.
