Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЕТОДИЧКА Анализ с Excel(для студ)1.doc
Скачиваний:
19
Добавлен:
28.08.2019
Размер:
1.24 Mб
Скачать

Использование пакета анализа

Задача о гипотезах может быть решена с помощью следующих методов анализа:

  1. Парный двухвыборочный t-тест для средних.

  2. Двухвыборочный t-тест с одинаковыми дисперсиями.

  3. Двухвыборочный t-тест с разными дисперсиями.

  4. Двухвыборочный z-тест для средних.

  5. Двухвыборочный F-тест для дисперсий.

Парный двухвыборочный t-тест для средних. Парный двухвыборочный t-тест Стьюдента используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные. Парный тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды – до и после эксперимента.

Двухвыборочный t-тест с одинаковыми дисперсиями. Двухвыборочный t-тест Стьюдента служит для проверки гипотезы о равенстве средних для двух выборок. Эта форма t-теста предполагает совпадение значений дисперсии генеральных совокупностей и обычно называется гомоскедастическим t-тестом.

Двухвыборочный t-тест с разными дисперсиями.  Двухвыборочный t-тест Стьюдента используется для проверки гипотезы о равенстве средних для двух выборок данных из разных генеральных совокупностей. Эта форма t-теста предполагает несовпадение дисперсий генеральных совокупностей и обычно называется гетероскедастическим t-тестом. Если тестируется одна и та же генеральная совокупность, используйте парный тест.

Двухвыборочный z-тест для средних с известными дисперсиями. Используется для проверки гипотезы о различии между средними двух генеральных совокупностей.

Двухвыборочный F-тест применяется для сравнения дисперсий двух генеральных совокупностей. Этот тест предоставляет результаты сравнения нулевой гипотезы о том, что эти две выборки взяты из распределения с равными дисперсиями, с гипотезой, предполагающей, что дисперсии различны.

Демонстрационный пример 4В

Рассмотрим задачу на применение Двухвыборочного F-теста для сравнения дисперсий двух генеральных совокупностей. Это может быть самостоятельной задачей, если мы оцениваем, например, точность двух приборов. Точность измерений будет одинаковой, если дисперсии равны. Кроме того F-тест используется перед проведением Двухвыборочного t-теста с одинаковыми дисперсиями.  

Пусть необходимо оценить существенность различий в скорости оседания эритроцитов (СОЭ) двух групп больных для уровня значимости α = 0,01 по следующим данным:

X

43

50

47

49

50

46

44

Y

39

40

37

43

39

41

40

Для того, чтобы выбрать тест для оценки существенности различий, т.к. рассматриваются выборки не повторных испытаний, нам нужно оценить равенство дисперсий. В зависимости от того равны они или нет выбрать соответствующий t-тест. Поэтому сначала проведем F-тест.

Выдвигаем нулевую гипотезу Н0: о равенстве дисперсий при альтернативной гипотезе Н1: дисперсия первой группы больше дисперсии второй группы (одностороннее распределение, обычно здесь другие альтернативные гипотезы не используются) при уровне значимости α = 0,01.

Значения данных вносим в таблицу Excel в блоки А1:H1 и А2:H2. Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный F- тест для дисперсии и нажимаем Ок. На экран будет выведено окно (см. рис. 4.3)

Рис. 4.3

В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А10 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:

Двухвыборочный F-тест для дисперсии

 

X

Y

Среднее

47

39,85714286

Дисперсия

8

3,476190476

Наблюдения

7

7

df

6

6

F

2,301369863

P(F<=f) одностороннее

0,166943934

F критическое одностороннее

8,466031431

 

В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); df – k = n-1 (число степеней свободы); F – вычисленный параметр Фишера; P(F<= f)одностороннее – критический уровень значимости; F критическое одностороннее – табличное значение параметра Фишера для заданного уровня значимости 0,01. Нулевая гипотеза принимается при F<Fкритическое, в противном случае, при F>Fкритическое, принимается альтернативная гипотеза.

В нашем случае F = 2,3. Это значительно меньше Fкритическое = 8,47. Следовательно, дисперсии одинаковы для уровня значимости 0,01 (вероятность 99 %).

Теперь переходим ко второй части задачи о существенности различий в СОЭ. Проверяем нулевую гипотезу о равенстве математических ожиданий СОЭ Н0: а1 = а2 при альтернативной гипотезе, что они не равны Н1: а1 ≠ а2 (двустороннее распределение) для уровня значимости 0,01.

Так как мы установили равенство дисперсий двух рядов, то используем Двухвыборочный t-тест с одинаковыми дисперсиями.  

Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный t-тест с одинаковыми дисперсиями и нажимаем Ок. На экран будет выведено окно (см. рис. 4.4)

Рис. 4.4

В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. В поле Гипотетическая средняя разность ввести ноль (т.к. нулевая гипотеза предполагает равенство математических ожиданий рядов). Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А22 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:

Двухвыборочный t-тест с одинаковыми дисперсиями

 

X

Y

Среднее

47

39,85714286

Дисперсия

8

3,476190476

Наблюдения

7

7

Объединенная дисперсия

5,738095238

Гипотетическая разность средних

0

df

12

t-статистика

5,578560025

P(T<=t) одностороннее

6,00857E-05

t критическое одностороннее

2,680990292

P(T<=t) двухстороннее

0,000120171

t критическое двухстороннее

3,054537956

 

В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); Объединенная дисперсия – пока не рассматриваем; Гипотетическая разность средних – гипотеза о равенстве математических ожиданий а12 = 0; df – k = n1+n2-2 (число степеней свободы); t-статистика – рассчитанный параметр Т; t-критическое одностороннее – табличный параметр при альтернативной гипотезе математическое ожидание одной ГС больше (или меньше) математического ожидания второй ГС; t-критическое двухстороннее – табличный параметр при альтернативной гипотезе математические ожидания двух ГС не равны; P(T<=t) одностороннее и P(T<=t) двухстороннее соответствующие критические уровни значимости.

Для рассмотренного примера Т = 5,58, а tтабл = 3,05. Так как Т>tтабл для уровня значимости 0,01, то это означает, что различие в СОЭ для двух групп больных существенно.

Примечание:

В случае неравных дисперсий следует выбрать Двухвыборочный t-тест с разными дисперсиями.

Демонстрационный пример 4Г

Рассмотрим задачу на использование парного метода. Пусть нам дано: Группа спортсменов снижает вес по определенной диете (см. таблицу). Х – вес до диеты, Y – вес после диеты. Определить эффективность диеты для уровня значимости 0,05:

X

72

75

83

64

61

Y

69

70

75

61

60

Выдвинем нулевую гипотезу о равенстве математических ожиданий и альтернативную о том, что они не равны.

Так как дисперсии неизвестны и выборка тестируется дважды, то используем метод анализа Парный двухвыборочный t-тест для средних.

Значения таблицы вносим в блоки А1:А6 и В1:В6. Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Парный двухвыборочный t-тест для средних и нажимаем Ок.

В появившемся окне (Рис. 4.5), указываем Интервал переменной 1: блок А1:А6; Интервал переменной 2: блок В1:В6; Гипотетическая средняя разность: 0 (т.к. мы выдвинули нулевую гипотезу о равенстве математических ожиданий а12 = 0);

Ставим флажок Метки; в поле Альфа введем 0,05 (заданный уровень значимости); ставим переключатель Выходной интервал и напротив, в поле, указываем ячейку D1. Нажимаем кнопку Ок.

Рис. 4.5

На лист Excel будет выведена следующая таблица:

Парный двухвыборочный t-тест для средних

 

X

Y

Среднее

71

67

Дисперсия

77,5

40,5

Наблюдения

5

5

Корреляция Пирсона

0,990637172

Гипотетическая разность средних

0

df

4

t-статистика

3,380617019

P(T<=t) одностороннее

0,013884806

t критическое одностороннее

2,131846782

P(T<=t) двухстороннее

0,027769613

t критическое двухстороннее

2,776445105

 

В данной таблице параметры обозначают следующее: Наблюдения – число опытов (объем выборки); Корреляция Пирсона – пока не рассматриваем; Гипотетическая разность средних – гипотеза о равенстве математических ожиданий а12 = 0; df – k = n-1 (число степеней свободы); t-статистика – рассчитанный параметр Т; t-критическое одностороннее – табличный параметр при альтернативной гипотезе математическое ожидание одной ГС больше (или меньше) математического ожидания второй ГС; t-критическое двухстороннее – табличный параметр при альтернативной гипотезе математические ожидания двух ГС не равны; P(T<=t) одностороннее и P(T<=t) двухстороннее соответствующие критические уровни значимости.

Для рассмотренного примера Т = 3,38, а tтабл = 2,77. Так как Т>tтабл для уровня значимости 0,05, то это означает, что диета эффективна.