Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИСМ-ЛР-1.doc
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
1.8 Mб
Скачать

Лабораторная работа №7 Двухфакторный дисперсионный анализ

В двухфакторном анализе факторы A и B считаются взаимодействующими, если эффект фактора A зависит от уровня фактора B. В двухфакторном эксперименте с одинаковым количеством реплик в каждой ячейке полная вариация SST подразделяется на сумму квадратов, соответствующую фактору A (SSA) и фактору B (SSB), сумму квадратов, учитывающую взаимодействие факторов A и B (SSAB), и сумму квадратов, возникающую вследствие случайной ошибки (SSE). Полная сумма квадратов представляет собой полную вариацию всех наблюдений вокруг общего среднего.

В двухфакторном дисперсионном анализе применяются три разных критерия: для проверки гипотез об отсутствии эффектов фактора A , фактора B , а также их взаимодействия.

Для проверки отсутствия эффекта фактора A выдвигаются нулевая и альтернативная гипотезы:

H0 : 1 = 2 = … = r и H1: не все i равны.

и применяется F-статистика, вычисленная по формуле

(1)

При заданном уровне значимости  нулевая гипотеза отклоняется, если F > FU , где FU – верхнее критическое значение F-распределения, имеющего r-1 степеней свободы в числителе и rc(n-1) степеней свободы в знаменателе, где

r – .количество уровней фактора A; c – количество уровней фактора B; n – количество значений, соответствующих конкретным уровням факторов A и B.

Для проверки гипотезы H0 об отсутствии эффекта фактора B и альтернативной гипотезы H1

H0 : 1 = 2 = … = с и H1: не все j равны

применяется F-статистика, вычисленная по формуле

(2)

При заданном уровне значимости  нулевая гипотеза отклоняется, если F > FU , где FU – верхнее критическое значение F-распределения, имеющего c-1 степеней свободы в числителе и rc(n-1) степеней свободы в знаменателе.

Для проверки гипотезы об отсутствии эффекта взаимодействия факторов A и B

H0: взаимодействие факторов A и B равно нулю

и альтернативной гипотезы

H1: взаимодействие факторов A и B не равно нулю

применяется F-статистика, вычисленная по формуле

(3)

При заданном уровне значимости  нулевая гипотеза отклоняется, если F > FU , где FU – верхнее критическое значение F-распределения, имеющего (r-1)(c-1) степеней свободы в числителе и rc(n-1) степеней свободы в знаменателе.

Задача 1. Парашюты изготавливаются из синтетических волокон, поставляемых четырьмя разными поставщиками и на двух видах станков Jetta и Turk. Совершенно очевидно, что одной из основных характеристик является прочность парашюта. Необходимо сравнить поставщиков синтетических волокон и оценить, на каком из станков Jetta или Turk выпускаются более прочные парашюты. Кроме того, необходимо определить, зависит ли разница между четырьмя поставщиками от типа станков, на которых производятся парашюты.

Данные измерений прочности парашютов можно представить на рабочем листе Excel в виде таблицы с двумя входами (r=2;c=4; n=5):

A

B

C

D

E

3

Тип станка

Поставщик

4

П1

П2

П3

П4

5

Jetta

20,6

22,6

27,7

21,5

6

 

18

24,6

18,6

20

7

 

19

19,6

20,8

21,1

8

 

21,3

23,8

25,1

23,9

9

 

13,2

27,1

17,7

16

10

Turk

18,5

26,3

20,6

25,4

11

 

24

25,3

25,2

19,9

12

 

17,2

24

20,8

22,6

13

 

19,9

21,2

24,7

17,5

14

 

18

24,5

22,9

20,4

Рис.1. Исходные данные .

Двухфакторный дисперсионный анализ в Excel осуществляется с помощью надстройки Пакет анализа следующим образом. Необходимо выполнить такую последовательность действий.

  • Выбрать команду Сервис – Анализ данных

  • В диалоговом окне Анализ данных выбрать команду Двухфакторный дисперсионный анализ с повторениями в списке Инструменты анализа и щелкнуть ОК.

  • В диалоговом окне Двухфакторный дисперсионный анализ с повторениями заполнить поля :

  • Входной интервал (диапазон ячеек, содержащий исходные данные),

  • Число строк для выборки,

  • Альфа (уровень значимости ),

  • Параметры вывода, установив переключатель в положение Новый рабочий лист и ввести название нового листа либо в положении переключателя Выходной интервал ввести адрес ячейки, с которой должна начаться выдача результатов.

  • Щелкнуть на кнопке ОК

Для нашей задачи :

Рис.2. Диалоговое окно

Результаты двухфакторного дисперсионного анализа данных задачи 4.4 имеют вид, представленный на рис.3. Здесь представлены в столбце Итоги объем выборки, сумма, среднее и дисперсия каждой комбинации типа станка и поставщика. В первых двух таблицах приведены результаты дисперсионного анализа для всех типов станков, а в третьей – для каждого поставщика. Кроме того, в сводной таблице дисперсионного анализа идентификатор df обозначает количество степеней свободы, SS – суммы квадратов, MS –выборочные дисперсии, а F – вычисленное значение F-статистики.

Двухфакторный дисперсионный анализ с повторениями

 

 

 

 

ИТОГИ

П1

П2

П3

П4

Итого

 

Jetta

 

 

 

 

 

 

Счет

5

5

5

5

20

 

Сумма

92,1

117,7

109,9

102,5

422,2

 

Среднее

18,42

23,54

21,98

20,5

21,11

 

Дисперсия

10,202

7,568

18,397

8,355

13,1283158

 

 

Turk

 

 

 

 

 

 

Счет

5

5

5

5

20

 

Сумма

97,6

121,3

114,2

105,8

438,9

 

Среднее

19,52

24,26

22,84

21,16

21,945

 

Дисперсия

7,237

3,683

4,553

8,903

8,46260526

 

 

Итого

 

 

 

 

Счет

10

10

10

10

 

Сумма

189,7

239

224,1

208,3

 

Среднее

18,97

23,9

22,41

20,83

 

Дисперсия

8,086778

5,14444

10,40544

7,791222

 

 

 

 

 

Дисперсионный анализ

 

Источник

вариации

SS

df

MS

F

p-значение

F критическое

Выборка

6,97225

1

6,97225

0,809574

0,37496779

4,149097409

Столбцы

134,3488

3

44,78292

5,199909

0,00486617

2,901119588

Взаимодействие

0,28675

3

0,095583

0,011099

0,99836457

2,901119588

Внутри

275,592

32

8,61225

 

Рис.3. Результаты дисперсионного анализа.

Прежде всего надо проверить, существует ли взаимосвязь между типами станков (фактор A) и поставщиками (фактор B). Если эффект взаимодействия является существенным, дальнейший анализ ограничивается лишь оценкой этого эффекта. Если эффект взаимодействия незначителен, необходимо сосредоточиться на главных эффектах – потенциальных различиях между типами станков (фактор А) и поставщиками (фактор В). Нулевая гипотеза об отсутствии эффекта взаимодействия отклоняется, если вычисленное значение F-статистики больше верхнего критического значения F-распределения с тремя степенями свободы в числителе и 32 степенями свободы в знаменателе при уровне значимости 0,05: FU = 2,9. Поскольку F= 0,011< FU , а p-значение равно 0,998, то гипотеза H0 не отклоняется. Следовательно, необходимо проанализировать главные эффекты.

При заданном уровне значимости, равном 0,05, в основе проверки разности между двумя станками (фактор А) лежит следующее правило: нулевая гипотеза отклоняется, если вычисленное значение F-статистики больше верхнего критического значения F-распределения с одной степенью свободы в числителе и 32 степенями свободы в знаменателе: FU = 4,15. Поскольку F = 0,81 < FU , а p-значение равно 0,375 и больше уровня значимости, гипотеза H0 не отклоняется. Следовательно, не достаточно оснований утверждать, что между прочностью парашютов, произведенных на разных станках, существует значимая разница.

При заданном уровне значимости, равном 0,05, в основе проверки разности между поставщиками (фактор В) лежит следующее решающее правило: нулевая гипотеза отклоняется, если вычисленное значение F-статистики больше верхнего критического значения F-распределения с тремя степенями свободы в числителе и 32 степенями свободы в знаменателе: FU = 2,92. Поскольку F = 5,2 > FU, а p-значение равно 0,049 и меньше уровня значимости, гипотеза H0 отклоняется. Следовательно, можно утверждать, что между прочностью парашютов, произведенных из волокон, приобретенных у разных поставщиков, существует значимая разница.

В тех случаях, когда данные представляют собой результаты эксперимента, проведенного при четко разграниченных числовых значениях или марках независимых величин, их можно представить в виде таблицы (матрицы) без повторений данных. В этом случае дисперсионный анализ выполняется с помощью надстройки Пакет анализа и ее инструмента Дисперсионный анализ без повторений.

Задача 2. При спектрографическом исследовании были проведены испытания с целью проверки влияния различных электродов (фактор А) и фотопластинок (фактор В) на признак, характеризующий интенсивность света.

Результаты испытаний представлены в таблице (на рабочем листе Excel):

A

B

C

D

E

F

3

Электроды

Фотопластинки

4

 

В1

В2

В3

В4

В5

5

А1

4

18

26

38

44

6

А2

3

19

25

35

43

7

А3

6

18

24

28

39

8

А4

7

13

21

31

38

Рис.4. Исходные данные.

Выполнив действия Сервис – Анализ данных – Дисперсионный анализ без повторений, в появившемся диалоговом окне следует заполнить его поля. Для задачи 4.5 это будет выглядеть так:

Рис. 5. Заполнение диалогового окна

Нажав кнопку ОК, получим:

Двухфакторный дисперсионный анализ без повторений

 

 

 

ИТОГИ

Счет

Сумма

Среднее

Дисперсия

 

А1

5

130

26

254

 

А2

5

125

25

236

 

А3

5

115

23

149

 

А4

5

110

22

161

 

 

 

В1

4

20

5

3,333333

 

В2

4

68

17

7,333333

 

В3

4

96

24

4,666667

 

В4

4

132

33

19,33333

 

В5

4

164

41

8,666667

 

 

 

 

 

Дисперсионный анализ

 

Источник

вариации

SS

df

MS

F

p-значение

F критическое

Строки

50

3

16,66667

2,5

0,109155

3,490295

Столбцы

3120

4

780

117

1,67E-09

3,259167

Погрешность

80

12

6,666667

 

 

 

Итого

3250

19

 

 

 

 

Рис.6. Результаты двухфакторного анализа.

Поскольку FA =2,5 < FU = 3,49, можно считать, что вид электродов не влияет на интенсивность света. Для фотопластинок FB = 117 > Fu = 3,26, следовательно, вид фотопластинки существенно влияет на интенсивность света.

Индивидуальные задания к лабораторным работам №5-№8 выбираются в соответствии с вариантом по таблице, приведенной в конце ЛР №8.