- •§ 1. Основные параметры случайных величин Использование Мастера функций
- •Использование пакета анализа
- •§ 2. Построение графиков и диаграмм Использование Мастера функций
- •Использование пакета анализа
- •§ 3. Интервальное оценивание Использование Мастера функций
- •Использование пакета анализа
- •Нахождение доверительного интервала и доверительной вероятности с помощью самостоятельно введенных формул
- •§ 4. Проверка статистических гипотез Использование Мастера функций
- •Использование пакета анализа
- •§ 5. Корреляция Использование Мастера функций
- •Использование пакета анализа
- •§ 6. Регрессия Использование Мастера функций
- •Использование пакета анализа
- •§ 7. Факторный дисперсионный анализ
- •§ 8. Статистические задачи Вариационный ряд. Гистограмма. Полигон
- •Продолжение таблицы значений для функции Лапласа
- •Критические точки χ2 -распределения Пирсона
Использование пакета анализа
Задача о гипотезах может быть решена с помощью следующих методов анализа:
Парный двухвыборочный t-тест для средних.
Двухвыборочный t-тест с одинаковыми дисперсиями.
Двухвыборочный t-тест с разными дисперсиями.
Двухвыборочный z-тест для средних.
Двухвыборочный F-тест для дисперсий.
Парный двухвыборочный t-тест для средних. Парный двухвыборочный t-тест Стьюдента используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные. Парный тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды – до и после эксперимента.
Двухвыборочный t-тест с одинаковыми дисперсиями. Двухвыборочный t-тест Стьюдента служит для проверки гипотезы о равенстве средних для двух выборок. Эта форма t-теста предполагает совпадение значений дисперсии генеральных совокупностей и обычно называется гомоскедастическим t-тестом.
Двухвыборочный t-тест с разными дисперсиями. Двухвыборочный t-тест Стьюдента используется для проверки гипотезы о равенстве средних для двух выборок данных из разных генеральных совокупностей. Эта форма t-теста предполагает несовпадение дисперсий генеральных совокупностей и обычно называется гетероскедастическим t-тестом. Если тестируется одна и та же генеральная совокупность, используйте парный тест.
Двухвыборочный z-тест для средних с известными дисперсиями. Используется для проверки гипотезы о различии между средними двух генеральных совокупностей.
Двухвыборочный F-тест применяется для сравнения дисперсий двух генеральных совокупностей. Этот тест предоставляет результаты сравнения нулевой гипотезы о том, что эти две выборки взяты из распределения с равными дисперсиями, с гипотезой, предполагающей, что дисперсии различны.
Демонстрационный пример 4В
Рассмотрим задачу на применение Двухвыборочного F-теста для сравнения дисперсий двух генеральных совокупностей. Это может быть самостоятельной задачей, если мы оцениваем, например, точность двух приборов. Точность измерений будет одинаковой, если дисперсии равны. Кроме того F-тест используется перед проведением Двухвыборочного t-теста с одинаковыми дисперсиями.
Пусть необходимо оценить существенность различий в скорости оседания эритроцитов (СОЭ) двух групп больных для уровня значимости α = 0,01 по следующим данным:
X |
43 |
50 |
47 |
49 |
50 |
46 |
44 |
Y |
39 |
40 |
37 |
43 |
39 |
41 |
40 |
Для того, чтобы выбрать тест для оценки существенности различий, т.к. рассматриваются выборки не повторных испытаний, нам нужно оценить равенство дисперсий. В зависимости от того равны они или нет выбрать соответствующий t-тест. Поэтому сначала проведем F-тест.
Выдвигаем нулевую гипотезу Н0: о равенстве дисперсий при альтернативной гипотезе Н1: дисперсия первой группы больше дисперсии второй группы (одностороннее распределение, обычно здесь другие альтернативные гипотезы не используются) при уровне значимости α = 0,01.
Значения данных вносим в таблицу Excel в блоки А1:H1 и А2:H2. Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный F- тест для дисперсии и нажимаем Ок. На экран будет выведено окно (см. рис. 4.3)
Рис. 4.3
В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А10 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:
|
|
|
Двухвыборочный F-тест для дисперсии |
|
|
|
|
|
|
X |
Y |
Среднее |
47 |
39,85714286 |
Дисперсия |
8 |
3,476190476 |
Наблюдения |
7 |
7 |
df |
6 |
6 |
F |
2,301369863 |
|
P(F<=f) одностороннее |
0,166943934 |
|
F критическое одностороннее |
8,466031431 |
|
|
|
|
В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); df – k = n-1 (число степеней свободы); F – вычисленный параметр Фишера; P(F<= f)одностороннее – критический уровень значимости; F критическое одностороннее – табличное значение параметра Фишера для заданного уровня значимости 0,01. Нулевая гипотеза принимается при F<Fкритическое, в противном случае, при F>Fкритическое, принимается альтернативная гипотеза.
В нашем случае F = 2,3. Это значительно меньше Fкритическое = 8,47. Следовательно, дисперсии одинаковы для уровня значимости 0,01 (вероятность 99 %).
Теперь переходим ко второй части задачи о существенности различий в СОЭ. Проверяем нулевую гипотезу о равенстве математических ожиданий СОЭ Н0: а1 = а2 при альтернативной гипотезе, что они не равны Н1: а1 ≠ а2 (двустороннее распределение) для уровня значимости 0,01.
Так как мы установили равенство дисперсий двух рядов, то используем Двухвыборочный t-тест с одинаковыми дисперсиями.
Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный t-тест с одинаковыми дисперсиями и нажимаем Ок. На экран будет выведено окно (см. рис. 4.4)
Рис. 4.4
В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. В поле Гипотетическая средняя разность ввести ноль (т.к. нулевая гипотеза предполагает равенство математических ожиданий рядов). Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А22 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:
Двухвыборочный t-тест с одинаковыми дисперсиями |
|
|
|
|
|
|
X |
Y |
Среднее |
47 |
39,85714286 |
Дисперсия |
8 |
3,476190476 |
Наблюдения |
7 |
7 |
Объединенная дисперсия |
5,738095238 |
|
Гипотетическая разность средних |
0 |
|
df |
12 |
|
t-статистика |
5,578560025 |
|
P(T<=t) одностороннее |
6,00857E-05 |
|
t критическое одностороннее |
2,680990292 |
|
P(T<=t) двухстороннее |
0,000120171 |
|
t критическое двухстороннее |
3,054537956 |
|
В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); Объединенная дисперсия – пока не рассматриваем; Гипотетическая разность средних – гипотеза о равенстве математических ожиданий а1-а2 = 0; df – k = n1+n2-2 (число степеней свободы); t-статистика – рассчитанный параметр Т; t-критическое одностороннее – табличный параметр при альтернативной гипотезе математическое ожидание одной ГС больше (или меньше) математического ожидания второй ГС; t-критическое двухстороннее – табличный параметр при альтернативной гипотезе математические ожидания двух ГС не равны; P(T<=t) одностороннее и P(T<=t) двухстороннее соответствующие критические уровни значимости.
Для рассмотренного примера Т = 5,58, а tтабл = 3,05. Так как Т>tтабл для уровня значимости 0,01, то это означает, что различие в СОЭ для двух групп больных существенно.
Примечание:
В случае неравных дисперсий следует выбрать Двухвыборочный t-тест с разными дисперсиями.
Демонстрационный пример 4Г
Рассмотрим задачу на использование парного метода. Пусть нам дано: Группа спортсменов снижает вес по определенной диете (см. таблицу). Х – вес до диеты, Y – вес после диеты. Определить эффективность диеты для уровня значимости 0,05:
X |
72 |
75 |
83 |
64 |
61 |
Y |
69 |
70 |
75 |
61 |
60 |
Выдвинем нулевую гипотезу о равенстве математических ожиданий и альтернативную о том, что они не равны.
Так как дисперсии неизвестны и выборка тестируется дважды, то используем метод анализа Парный двухвыборочный t-тест для средних.
Значения таблицы вносим в блоки А1:А6 и В1:В6. Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Парный двухвыборочный t-тест для средних и нажимаем Ок.
В появившемся окне (Рис. 4.5), указываем Интервал переменной 1: блок А1:А6; Интервал переменной 2: блок В1:В6; Гипотетическая средняя разность: 0 (т.к. мы выдвинули нулевую гипотезу о равенстве математических ожиданий а1-а2 = 0);
Ставим флажок Метки; в поле Альфа введем 0,05 (заданный уровень значимости); ставим переключатель Выходной интервал и напротив, в поле, указываем ячейку D1. Нажимаем кнопку Ок.
Рис. 4.5
На лист Excel будет выведена следующая таблица:
Парный двухвыборочный t-тест для средних |
|
|
|
|
|
|
X |
Y |
Среднее |
71 |
67 |
Дисперсия |
77,5 |
40,5 |
Наблюдения |
5 |
5 |
Корреляция Пирсона |
0,990637172 |
|
Гипотетическая разность средних |
0 |
|
df |
4 |
|
t-статистика |
3,380617019 |
|
P(T<=t) одностороннее |
0,013884806 |
|
t критическое одностороннее |
2,131846782 |
|
P(T<=t) двухстороннее |
0,027769613 |
|
t критическое двухстороннее |
2,776445105 |
|
В данной таблице параметры обозначают следующее: Наблюдения – число опытов (объем выборки); Корреляция Пирсона – пока не рассматриваем; Гипотетическая разность средних – гипотеза о равенстве математических ожиданий а1-а2 = 0; df – k = n-1 (число степеней свободы); t-статистика – рассчитанный параметр Т; t-критическое одностороннее – табличный параметр при альтернативной гипотезе математическое ожидание одной ГС больше (или меньше) математического ожидания второй ГС; t-критическое двухстороннее – табличный параметр при альтернативной гипотезе математические ожидания двух ГС не равны; P(T<=t) одностороннее и P(T<=t) двухстороннее соответствующие критические уровни значимости.
Для рассмотренного примера Т = 3,38, а tтабл = 2,77. Так как Т>tтабл для уровня значимости 0,05, то это означает, что диета эффективна.