Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЕТОДИЧКА Анализ с Excel(для студ)1.doc
Скачиваний:
37
Добавлен:
28.08.2019
Размер:
1.24 Mб
Скачать

§ 7. Факторный дисперсионный анализ

Однофакторный дисперсионный анализ позволяет статистически обосновать существенность влияния факторного признака А на результативный F.

Однофакторный дисперсионный анализ используется для проверки гипотезы о сходстве средних значений двух или более выборок, принадлежащих одной и той же генеральной совокупности. Этот метод распространяется также на тесты для двух средних (к которым относится, например, t-критерий или ttest). То есть, если для разных уровней фактора А средние отличаются незначительно, то следует принять гипотезу о несущественном влиянии факторного признака А на результативный F.

Демонстрационный пример 7

Проверить статистическую существенность влияния фактора А (для разных уровней фактора) на содержание цистина (фактор F) в плазме крови (мг/л). Результаты измерений при 5 уровнях фактора А приведены в таблице 1:

Таблица 1

А1

А2

А3

А4

А5

3,2

2,6

2,9

3,7

3

3,1

3,1

2,6

3,4

3,4

3,1

2,7

3

3,2

3,2

2,8

2,9

3,1

3,3

3,5

3,3

2,7

3

3,5

2,9

3

2,8

2,8

3,3

3,1

Введем исходные данные в Excel в блок А1:Е7. В пункте меню Сервис выбираем строку Анализ данных и далее указываем курсором мыши на строку Однофакторный дисперсионный анализ. В появившемся диалоговом окне (рис. 7.1) задаем Входной интервал А1:Е7.

Рис. 7.1

Группирование: по столбцам – именно такое расположение имеют уровни фактора А; Отметим Mетки в первой строке (там расположены уровни фактора); в Выходном интервале отметим левую верхнею ячейку выходного интервала $A$12. После нажатия кнопки ОК, получим таблицу однофакторного дисперсионного анализа:

Двухфакторный дисперсионный анализ с повторениями представляет собой более сложный вариант однофакторного анализа, включающего более чем одну выборку для каждой группы данных. Двухфакторный дисперсионный анализ позволяет статистически обосновать существенность влияния факторных признаков А и В и взаимодействия факторов {А и В) на результативный фактор F.

Демонстрационный пример 8

У 60 человек фиксировалась содержание некоторого анализа в зависимости от возраста и дозы лекарственного вещества. Данные обследования отражены в таблице 2.

Таблица 2

А

В

С

D

1

Возраст

2

Доза (мкг)

От 25 до 35 лет

От 35 до 45 лет

от 45 до 55 лет

3

от 10

до 20

19

19

18

4

20

20

19

5

20

20

20

6

20

23

21

7

22

25

23

8

от 20

до 30

30

20

19

9

 

31

29

25

10

 

32

30

25

11

от 30

до 40

32

31

26

12

34

31

26

13

35

36

24

14

35

40

24

15

39

41

24

16

 

40

42

25

17

 

41

45

25

18

свыше 40

40

28

20

19

 

40

31

24

20

 

41

35

25

21

 

41

36

31

22

 

42

40

32

Оценить существенность влияния возраста (А) и дозы (В) на некоторый анализ (F).

Решение. Данные в таблице 2 приведены так, как они должны выглядеть на листе Excel. Заполним диалоговое окно согласно рис. 7.2.

Рис. 7.2

Следует отметить, что в исходных данных должно быть одинаковое число строк (повторений наблюдений), в противном случае рекомендуется ввести оценки пропущенных наблюдений, выбрав их таким образом, чтобы минимизировать остаточную дисперсию (иначе нужно ввести среднюю других наблюдений в ячейках), причём нельзя включать эти оценки при подсчёте соответствующих степеней свободы. В случае пропуска данных в дисперсионном анализе без повторений необходимы более сложные методы.

После нажатия на кнопку ОК мы получим итоговую таблицу 3.

Таблица 3

Двухфакторный дисперсионный анализ с повторениями

ИТОГИ

От 25 до 35 лет

От 35 до 45 лет

от 45 до 55 лет

Итого

от 10 до 20 мкг

 

 

 

 

Счет

5

5

5

15

Сумма

101

107

101

309

Среднее

20,2

21,4

20,2

20,6

Дисперсия

1,2

6,3

3,7

3,54285

От 20 до 30

 

Счет

5

5

5

15

Сумма

159

141

121

421

Среднее

31,8

28,2

24,2

28,0666

Дисперсия

2,2

21,7

8,7

19,6380

 

 

Счет

5

5

5

15

Сумма

190

204

122

516

Среднее

38

40,8

24,4

34,4

Дисперсия

8

10,7

0,3

60,4

свыше 40

 

Счет

5

5

5

15

Сумма

204

170

132

506

Среднее

40,8

34

26,4

33,7333

Дисперсия

0,7

21,5

25,3

50,6380

Итого

 

Счет

20

20

20

Сумма

654

622

476

Среднее

32,7

31,1

23,8

Дисперсия

68,5368

66,6210

13,3263

Дисперсионный анализ

Источник вариации

SS

df

MS

F

P-Значение

F крити­- ческое

Выборка

1842,533

3

614,177

66,8189

3,7E-17

2,798

Столбцы

900,4

2

450,2

48,9791

2,56E-12

3,190

Взаимодей- ствие

537,4666

6

89,5777

9,74554

5,2E-07

2,294

Внутри

441,2

48

9,19166

Итого

3721,6

59

Дисперсионный анализ с повторениями позволяет оценить существенность влияния фактора А (доза), В (возраста), и их взаимодействия (факторов А и В) на некоторый анализ. Так как:

FA расч = 66,8189>FA кp = 2,7980;

FВ расч = 48,979l>FB кp = 3,1907;

FAВ расч = 9,7456>FAВ к p= 2,2945;

то следует признать статистически значимым влияние дозы (фактор А), возраста (фактор В) и их взаимодействия (факторы А и В) на некоторый анализ.

Итоговая таблица позволяет более детально рассмотреть свойства отдельных групп (например, возраст от 35до 45 лет и доза от 20 до 30 мкг).

В Excel имеется хорошая возможность наглядного представления изучаемых процессов или явлений с помощью мастера диаграмм. Для этого: предварительно выделим данные Таблица 2 нажмём кнопку Мастер диаграмм панели Стандартная; выберем закладку Стандартные, Тип диаграммы – График, нажмем кнопку Далее.

На закладке Диапазон данных укажем диапазон B2:D22, поставим отметку Ряды – в столбцах, нажмем кнопку Далее.

На закладке Заголовки укажем название диаграммы «Влияние дозы и возраста на некоторый анализ», ось X : доза, ось Y : возраст, нажмем кнопку Далее.

В следующем окне отметим Поместить на имеющемся (листе), нажмем кнопку Готово. В результате получим график на рис. 7.3.

Двухфакторный дисперсионный анализ без повторений позволяет оценить существенность воздействия факторов А и В на результирующий фактор F без учёта воздействия взаимодействия факторов А и В.

Рис. 7.3

Демонстрационный пример 9

Рассмотрим решение примера 8, высчитав с помощью Excel в каждой ячейке среднее значение наблюдений (таблица 4).

Таблица 4

Доза

Возраст

от 25 до 35 лет

от 35 до 45 лет

от 45 до 55 лет

от 10 до 20 мкг

20,2

21,4

20,2

от 20 до 30 мкг

31,8

28,2

24,2

От 30 до 40 мкг

38

40,8

24,4

свыше 40 мкг

40,8

34

26,4

В результате заполнения диалогового окна (аналогичного окну примера 8 см. рис. 7.2) получим итоговую таблицу двухфакторного дисперсионного анализ без повторений (Таблица 5).

Таблица 5

Двухфакторный дисперсионный анализ без повторений

ИТОГИ

Счет

Сумма

Среднее

Дисперсия

от 10 до 20 мкг

3

61,8

20,6

0,48

от 20 до 30 мкг

3

84,2

28,066

14,4533

от 30 до 40 мкг

3

103,2

34,4

76,96

свыше 40 мкг

3

101,2

33,7333

51,8933

от 25 до 35 лет

4

130,8

32,7

83,5866

от 35 до 45 лет

4

124,4

31,1

68,3333

от 45 до 55 лет

4

95,2

23,8

6,74666

Дисперсионный анализ

Источник вариации

SS

df

MS

F

P-Зна- чение

F крити- ческое

Строки

368,5066667

3

122,8355

6,8563

0,0229

4,757

Столбцы

180,08

2

90,04

5,0258

0,0522

5,143

Погрешность

107,4933333

6

17,91555

Итого

656,08

11

 

 

 

 

Данные дисперсионного анализа свидетельству­ют о том, что фактор А (доза) существенно влияет на некоторый анализ (так как FA расч = 6,8563>FA кр = 4,7570), а фактор В (возраст) статистически существенного влияния не оказывает (так как FBpacч = 5,0258<FBкcp = = 5,1432).

Различие в выводах примеров 8 и 9 можно объяснить тем, что в примере 9 мы не учитывали конкретные наблюдения в ячейках, а рассматривали лишь их среднее значение. Поэтому результат дисперсионного анализа с повторениями является более значимым, что соответствует и самому смыслу задачи.

Так как очевидно – на некоторый анализ влияют и доза, и возраст, и их взаимодействие (доза и возраст). Отсюда следует сделать вывод, что при организации наблюдений необходимо, для каждого уровня факторов, рассматривать возможно большее количество элементов в ячейках.