- •Міністерство освіти та науки україни
- •Інформаційні системи в менеджменті
- •Содержание
- •Лабораторная работа №1 Проверка гипотезы о нормальном распределении
- •Лабораторная работа №2 Проверка гипотезы о математическом ожидании
- •Задание
- •Лабораторная работа №3 Двухвыборочные критерии
- •Задания
- •Лабораторная работа №4 Проверка гипотезы об однородности дисперсий
- •Задания
- •Лабораторная работа №5 Однофакторный дисперсионный анализ
- •Задания
- •Лабораторная работа №6 Ранговый критерий
- •Задания
- •Лабораторная работа №7 Двухфакторный дисперсионный анализ
- •Задания.
- •Продолжительности проявления.
- •Лабораторная работа №8 Проверка гипотезы об однородности выборок
- •Содержание контрольного задания
- •Литература
Лабораторная работа №7 Двухфакторный дисперсионный анализ
В двухфакторном анализе факторы A и B считаются взаимодействующими, если эффект фактора A зависит от уровня фактора B. В двухфакторном эксперименте с одинаковым количеством реплик в каждой ячейке полная вариация SST подразделяется на сумму квадратов, соответствующую фактору A (SSA) и фактору B (SSB), сумму квадратов, учитывающую взаимодействие факторов A и B (SSAB), и сумму квадратов, возникающую вследствие случайной ошибки (SSE). Полная сумма квадратов представляет собой полную вариацию всех наблюдений вокруг общего среднего.
В двухфакторном дисперсионном анализе применяются три разных критерия: для проверки гипотез об отсутствии эффектов фактора A , фактора B , а также их взаимодействия.
Для проверки отсутствия эффекта фактора A выдвигаются нулевая и альтернативная гипотезы:
H0 : 1 = 2 = … = r и H1: не все i равны.
и применяется F-статистика, вычисленная по формуле
(1)
При заданном уровне значимости нулевая гипотеза отклоняется, если F > FU , где FU – верхнее критическое значение F-распределения, имеющего r-1 степеней свободы в числителе и rc(n-1) степеней свободы в знаменателе, где
r – .количество уровней фактора A; c – количество уровней фактора B; n – количество значений, соответствующих конкретным уровням факторов A и B.
Для проверки гипотезы H0 об отсутствии эффекта фактора B и альтернативной гипотезы H1
H0 : 1 = 2 = … = с и H1: не все j равны
применяется F-статистика, вычисленная по формуле
(2)
При заданном уровне значимости нулевая гипотеза отклоняется, если F > FU , где FU – верхнее критическое значение F-распределения, имеющего c-1 степеней свободы в числителе и rc(n-1) степеней свободы в знаменателе.
Для проверки гипотезы об отсутствии эффекта взаимодействия факторов A и B
H0: взаимодействие факторов A и B равно нулю
и альтернативной гипотезы
H1: взаимодействие факторов A и B не равно нулю
применяется F-статистика, вычисленная по формуле
(3)
При заданном уровне значимости нулевая гипотеза отклоняется, если F > FU , где FU – верхнее критическое значение F-распределения, имеющего (r-1)(c-1) степеней свободы в числителе и rc(n-1) степеней свободы в знаменателе.
Задача 1. Парашюты изготавливаются из синтетических волокон, поставляемых четырьмя разными поставщиками и на двух видах станков Jetta и Turk. Совершенно очевидно, что одной из основных характеристик является прочность парашюта. Необходимо сравнить поставщиков синтетических волокон и оценить, на каком из станков Jetta или Turk выпускаются более прочные парашюты. Кроме того, необходимо определить, зависит ли разница между четырьмя поставщиками от типа станков, на которых производятся парашюты.
Данные измерений прочности парашютов можно представить на рабочем листе Excel в виде таблицы с двумя входами (r=2;c=4; n=5):
|
A |
B |
C |
D |
E |
3 |
Тип станка |
Поставщик |
|||
4 |
|
П1 |
П2 |
П3 |
П4 |
5 |
Jetta |
20,6 |
22,6 |
27,7 |
21,5 |
6 |
|
18 |
24,6 |
18,6 |
20 |
7 |
|
19 |
19,6 |
20,8 |
21,1 |
8 |
|
21,3 |
23,8 |
25,1 |
23,9 |
9 |
|
13,2 |
27,1 |
17,7 |
16 |
10 |
Turk |
18,5 |
26,3 |
20,6 |
25,4 |
11 |
|
24 |
25,3 |
25,2 |
19,9 |
12 |
|
17,2 |
24 |
20,8 |
22,6 |
13 |
|
19,9 |
21,2 |
24,7 |
17,5 |
14 |
|
18 |
24,5 |
22,9 |
20,4 |
Рис.1. Исходные данные .
Двухфакторный дисперсионный анализ в Excel осуществляется с помощью надстройки Пакет анализа следующим образом. Необходимо выполнить такую последовательность действий.
Выбрать команду Сервис – Анализ данных
В диалоговом окне Анализ данных выбрать команду Двухфакторный дисперсионный анализ с повторениями в списке Инструменты анализа и щелкнуть ОК.
В диалоговом окне Двухфакторный дисперсионный анализ с повторениями заполнить поля :
Входной интервал (диапазон ячеек, содержащий исходные данные),
Число строк для выборки,
Альфа (уровень значимости ),
Параметры вывода, установив переключатель в положение Новый рабочий лист и ввести название нового листа либо в положении переключателя Выходной интервал ввести адрес ячейки, с которой должна начаться выдача результатов.
Щелкнуть на кнопке ОК
Для нашей задачи :
Рис.2. Диалоговое окно
Результаты двухфакторного дисперсионного анализа данных задачи 4.4 имеют вид, представленный на рис.3. Здесь представлены в столбце Итоги объем выборки, сумма, среднее и дисперсия каждой комбинации типа станка и поставщика. В первых двух таблицах приведены результаты дисперсионного анализа для всех типов станков, а в третьей – для каждого поставщика. Кроме того, в сводной таблице дисперсионного анализа идентификатор df обозначает количество степеней свободы, SS – суммы квадратов, MS –выборочные дисперсии, а F – вычисленное значение F-статистики.
Двухфакторный дисперсионный анализ с повторениями |
|
|
||||
|
|
|
|
|
|
|
ИТОГИ |
П1 |
П2 |
П3 |
П4 |
Итого |
|
Jetta |
|
|
|
|
|
|
Счет |
5 |
5 |
5 |
5 |
20 |
|
Сумма |
92,1 |
117,7 |
109,9 |
102,5 |
422,2 |
|
Среднее |
18,42 |
23,54 |
21,98 |
20,5 |
21,11 |
|
Дисперсия |
10,202 |
7,568 |
18,397 |
8,355 |
13,1283158 |
|
|
|
|
|
|
|
|
Turk |
|
|
|
|
|
|
Счет |
5 |
5 |
5 |
5 |
20 |
|
Сумма |
97,6 |
121,3 |
114,2 |
105,8 |
438,9 |
|
Среднее |
19,52 |
24,26 |
22,84 |
21,16 |
21,945 |
|
Дисперсия |
7,237 |
3,683 |
4,553 |
8,903 |
8,46260526 |
|
|
|
|
|
|
|
|
Итого |
|
|
|
|
|
|
Счет |
10 |
10 |
10 |
10 |
|
|
Сумма |
189,7 |
239 |
224,1 |
208,3 |
|
|
Среднее |
18,97 |
23,9 |
22,41 |
20,83 |
|
|
Дисперсия |
8,086778 |
5,14444 |
10,40544 |
7,791222 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
Источник вариации |
SS |
df |
MS |
F |
p-значение |
F критическое |
Выборка |
6,97225 |
1 |
6,97225 |
0,809574 |
0,37496779 |
4,149097409 |
Столбцы |
134,3488 |
3 |
44,78292 |
5,199909 |
0,00486617 |
2,901119588 |
Взаимодействие |
0,28675 |
3 |
0,095583 |
0,011099 |
0,99836457 |
2,901119588 |
Внутри |
275,592 |
32 |
8,61225 |
|
|
|
Рис.3. Результаты дисперсионного анализа.
Прежде всего надо проверить, существует ли взаимосвязь между типами станков (фактор A) и поставщиками (фактор B). Если эффект взаимодействия является существенным, дальнейший анализ ограничивается лишь оценкой этого эффекта. Если эффект взаимодействия незначителен, необходимо сосредоточиться на главных эффектах – потенциальных различиях между типами станков (фактор А) и поставщиками (фактор В). Нулевая гипотеза об отсутствии эффекта взаимодействия отклоняется, если вычисленное значение F-статистики больше верхнего критического значения F-распределения с тремя степенями свободы в числителе и 32 степенями свободы в знаменателе при уровне значимости 0,05: FU = 2,9. Поскольку F= 0,011< FU , а p-значение равно 0,998, то гипотеза H0 не отклоняется. Следовательно, необходимо проанализировать главные эффекты.
При заданном уровне значимости, равном 0,05, в основе проверки разности между двумя станками (фактор А) лежит следующее правило: нулевая гипотеза отклоняется, если вычисленное значение F-статистики больше верхнего критического значения F-распределения с одной степенью свободы в числителе и 32 степенями свободы в знаменателе: FU = 4,15. Поскольку F = 0,81 < FU , а p-значение равно 0,375 и больше уровня значимости, гипотеза H0 не отклоняется. Следовательно, не достаточно оснований утверждать, что между прочностью парашютов, произведенных на разных станках, существует значимая разница.
При заданном уровне значимости, равном 0,05, в основе проверки разности между поставщиками (фактор В) лежит следующее решающее правило: нулевая гипотеза отклоняется, если вычисленное значение F-статистики больше верхнего критического значения F-распределения с тремя степенями свободы в числителе и 32 степенями свободы в знаменателе: FU = 2,92. Поскольку F = 5,2 > FU, а p-значение равно 0,049 и меньше уровня значимости, гипотеза H0 отклоняется. Следовательно, можно утверждать, что между прочностью парашютов, произведенных из волокон, приобретенных у разных поставщиков, существует значимая разница.
В тех случаях, когда данные представляют собой результаты эксперимента, проведенного при четко разграниченных числовых значениях или марках независимых величин, их можно представить в виде таблицы (матрицы) без повторений данных. В этом случае дисперсионный анализ выполняется с помощью надстройки Пакет анализа и ее инструмента Дисперсионный анализ без повторений.
Задача 2. При спектрографическом исследовании были проведены испытания с целью проверки влияния различных электродов (фактор А) и фотопластинок (фактор В) на признак, характеризующий интенсивность света.
Результаты испытаний представлены в таблице (на рабочем листе Excel):
|
A |
B |
C |
D |
E |
F |
3 |
Электроды |
Фотопластинки |
||||
4 |
|
В1 |
В2 |
В3 |
В4 |
В5 |
5 |
А1 |
4 |
18 |
26 |
38 |
44 |
6 |
А2 |
3 |
19 |
25 |
35 |
43 |
7 |
А3 |
6 |
18 |
24 |
28 |
39 |
8 |
А4 |
7 |
13 |
21 |
31 |
38 |
Рис.4. Исходные данные.
Выполнив действия Сервис – Анализ данных – Дисперсионный анализ без повторений, в появившемся диалоговом окне следует заполнить его поля. Для задачи 4.5 это будет выглядеть так:
Рис. 5. Заполнение диалогового окна
Нажав кнопку ОК, получим:
Двухфакторный дисперсионный анализ без повторений |
|
|||||
|
|
|
|
|
|
|
ИТОГИ |
Счет |
Сумма |
Среднее |
Дисперсия |
|
|
А1 |
5 |
130 |
26 |
254 |
|
|
А2 |
5 |
125 |
25 |
236 |
|
|
А3 |
5 |
115 |
23 |
149 |
|
|
А4 |
5 |
110 |
22 |
161 |
|
|
|
|
|
|
|
|
|
В1 |
4 |
20 |
5 |
3,333333 |
|
|
В2 |
4 |
68 |
17 |
7,333333 |
|
|
В3 |
4 |
96 |
24 |
4,666667 |
|
|
В4 |
4 |
132 |
33 |
19,33333 |
|
|
В5 |
4 |
164 |
41 |
8,666667 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
||
Источник вариации |
SS |
df |
MS |
F |
p-значение |
F критическое |
Строки |
50 |
3 |
16,66667 |
2,5 |
0,109155 |
3,490295 |
Столбцы |
3120 |
4 |
780 |
117 |
1,67E-09 |
3,259167 |
Погрешность |
80 |
12 |
6,666667 |
|
|
|
|
|
|
|
|
|
|
Итого |
3250 |
19 |
|
|
|
|
Рис.6. Результаты двухфакторного анализа.
Поскольку FA =2,5 < FU = 3,49, можно считать, что вид электродов не влияет на интенсивность света. Для фотопластинок FB = 117 > Fu = 3,26, следовательно, вид фотопластинки существенно влияет на интенсивность света.
Индивидуальные задания к лабораторным работам №5-№8 выбираются в соответствии с вариантом по таблице, приведенной в конце ЛР №8.
