- •Элементы
- •5.1. Проверка гипотез о параметрах распределений.
- •5.1.1. Проверка значения математического ожидания нормального распределения.
- •5.1.2. Проверка значения дисперсии нормального распределения.
- •5.1.3. Проверка значения доли (параметра биноминального распределения).
- •5.2. Сравнение выборок
- •5.2.1. Сравнение дисперсий
- •5.2.2. Сравнение средних двух независимых выборок
- •5.2.3. Сравнение средних парных выборок.
- •5.2.4. Сравнение долей (параметра биноминального распределения)
- •5.3. Проверка однородности выборок.
- •5.4. Дисперсионный анализ (anova)
- •5.4.1. Однофакторный дисперсионный анализ.
- •5.4.2. Многофакторный дисперсионный анализ.
5.2.2. Сравнение средних двух независимых выборок
Предположим,
что имеется две выборки
и
,
причём
и
распределены по нормальному закону с
одинаковой (проверено
двухвыборочным
F-тестом для дисперсии),
но неизвестной дисперсией
.
Требуется проверить гипотезу о равенстве
математических ожиданий
и
.
Разность
распределена тоже по нормальному закону
с математическим ожиданием
,
и дисперсией
.
Оценкой
может служить средневзвешенное значение
двух выборок:

Случайная величина
![]()
,
имеет распределение
Стьюдента с
степенями свободы. Поэтому в качестве
критерия для проверки гипотезы
можно взять статистку

При альтернативной
гипотезе
гипотезу
можно принять, если
.
Если альтернативная гипотеза
,
то нулевая гипотеза принимается при
условии
,
а при
- при условии
.
Если же дисперсии
различны, то значение
вычисляется по формуле
,
а число степеней свободы – наибольшее целое, не превосходящее значения

Конечно, все
величины для вычисления
можно находить отдельно. Но стоит
обратить внимание на то, что вExcel
в меню
Сервис
Анализ
данныхесть
функции Двухвыборочный
-тест
с одинаковыми дисперсиями и
Двухвыборочный
-тест
с разными дисперсиями для
работы которых достаточно ввести просто
координаты массивов
и
.
Различия в этих функциях целиком описаны
в их названиях, и, если выборочные
дисперсии различаются не слишком сильно,
то результаты оказываются идентичными.
В качестве примера приведём результат
действия функции «
Двухвыборочный
-тест
с одинаковыми дисперсиями
(B2:E2;B18:E18;0;0,05;G2)».
В
ячейках
находились результаты измерения
концентрации первым студентов,
-вторым,
число 0 показывает, что мы проверяем
гипотезу
,
0,05 – установленный уровень значимости
,
и , наконец
- номер ячейки, которую решено сделать
левым верхним углом таблицы вывода
результатов:
|
Двухвыборочный t-тест с одинаковыми дисперсиями | ||
|
|
Переменная 1 |
Переменная 2 |
|
Среднее |
309,875 |
311,125 |
|
Дисперсия |
10,22916667 |
48,39583333 |
|
Наблюдения |
4 |
4 |
|
Объединенная дисперсия |
29,3125 |
|
|
Гипотетическая разность средних |
0 |
|
|
df |
6 |
|
|
t-статистика |
-0,326511574 |
|
|
P(T<=t) одностороннее |
0,377563115 |
|
|
t критическое одностороннее |
1,943180274 |
|
|
P(T<=t) двухстороннее |
0,755126229 |
|
|
t критическое двухстороннее |
2,446911846 |
|
Как видим, программа
определила объёмы каждой выборки
(Наблюдения),
их средние и дисперсии, оценку дисперсии
генеральной совокупности (Объединенная
дисперсия)
число степеней свободы (df),
и, наконец искомое значение
,соответствующее
этим данным (t-статистика).
Для проверки
гипотезы
надо сопоставить значение «t-статистика»
с значением
«t
критическое одностороннее» в
случае односторонних альтернативных
гипотез, и со значением «t
критическое двухстороннее» - при
.
Как видим, гипотезу
нет оснований отбрасывать, и различие
средних результатов двух студентов
можно считать случайным.
Кроме этого, в
меню «статистические» имеется функция
ТТЕСТ,
которой тоже можно в
оспользоваться
для сравнения средних двух выборок. Для
этого в окна массивов вводятся их
координаты. В окно «Хвосты» вводится 1
в случае односторонних альтернативных
гипотез, и 2-
при
.
В окно «Тип» вводится 1, если проводится
сравнение пар, 2 – для теста с равными
дисперсиями, и 3, - с неравными.
