- •§ 1. Основные параметры случайных величин Использование Мастера функций
- •Использование пакета анализа
- •§ 2. Построение графиков и диаграмм Использование Мастера функций
- •Использование пакета анализа
- •§ 3. Интервальное оценивание Использование Мастера функций
- •Использование пакета анализа
- •Нахождение доверительного интервала и доверительной вероятности с помощью самостоятельно введенных формул
- •§ 4. Проверка статистических гипотез Использование Мастера функций
- •Использование пакета анализа
- •§ 5. Корреляция Использование Мастера функций
- •Использование пакета анализа
- •§ 6. Регрессия Использование Мастера функций
- •Использование пакета анализа
- •§ 7. Факторный дисперсионный анализ
- •§ 8. Статистические задачи Вариационный ряд. Гистограмма. Полигон
- •Продолжение таблицы значений для функции Лапласа
- •Критические точки χ2 -распределения Пирсона
§ 7. Факторный дисперсионный анализ
Однофакторный дисперсионный анализ позволяет статистически обосновать существенность влияния факторного признака А на результативный F.
Однофакторный дисперсионный анализ используется для проверки гипотезы о сходстве средних значений двух или более выборок, принадлежащих одной и той же генеральной совокупности. Этот метод распространяется также на тесты для двух средних (к которым относится, например, t-критерий или ttest). То есть, если для разных уровней фактора А средние отличаются незначительно, то следует принять гипотезу о несущественном влиянии факторного признака А на результативный F.
Демонстрационный пример 7
Проверить статистическую существенность влияния фактора А (для разных уровней фактора) на содержание цистина (фактор F) в плазме крови (мг/л). Результаты измерений при 5 уровнях фактора А приведены в таблице 1:
Таблица 1
А1 |
А2 |
А3 |
А4 |
А5 |
3,2 |
2,6 |
2,9 |
3,7 |
3 |
3,1 |
3,1 |
2,6 |
3,4 |
3,4 |
3,1 |
2,7 |
3 |
3,2 |
3,2 |
2,8 |
2,9 |
3,1 |
3,3 |
3,5 |
3,3 |
2,7 |
3 |
3,5 |
2,9 |
3 |
2,8 |
2,8 |
3,3 |
3,1 |
Введем исходные данные в Excel в блок А1:Е7. В пункте меню Сервис выбираем строку Анализ данных и далее указываем курсором мыши на строку Однофакторный дисперсионный анализ. В появившемся диалоговом окне (рис. 7.1) задаем Входной интервал А1:Е7.
Рис. 7.1
Группирование: по столбцам – именно такое расположение имеют уровни фактора А; Отметим Mетки в первой строке (там расположены уровни фактора); в Выходном интервале отметим левую верхнею ячейку выходного интервала $A$12. После нажатия кнопки ОК, получим таблицу однофакторного дисперсионного анализа:
Двухфакторный дисперсионный анализ с повторениями представляет собой более сложный вариант однофакторного анализа, включающего более чем одну выборку для каждой группы данных. Двухфакторный дисперсионный анализ позволяет статистически обосновать существенность влияния факторных признаков А и В и взаимодействия факторов {А и В) на результативный фактор F.
Демонстрационный пример 8
У 60 человек фиксировалась содержание некоторого анализа в зависимости от возраста и дозы лекарственного вещества. Данные обследования отражены в таблице 2.
Таблица 2
|
А |
В |
С |
D |
1 |
|
Возраст |
||
2 |
Доза (мкг) |
От 25 до 35 лет |
От 35 до 45 лет |
от 45 до 55 лет |
3 |
от 10 до 20 |
19 |
19 |
18 |
4 |
20 |
20 |
19 |
|
5 |
20 |
20 |
20 |
|
6 |
20 |
23 |
21 |
|
7 |
22 |
25 |
23 |
|
8 |
от 20 до 30 |
30 |
20 |
19 |
9 |
|
31 |
29 |
25 |
10 |
|
32 |
30 |
25 |
11 |
от 30 до 40 |
32 |
31 |
26 |
12 |
34 |
31 |
26 |
|
13 |
35 |
36 |
24 |
|
14 |
35 |
40 |
24 |
|
15 |
39 |
41 |
24 |
|
16 |
|
40 |
42 |
25 |
17 |
|
41 |
45 |
25 |
18 |
свыше 40 |
40 |
28 |
20 |
19 |
|
40 |
31 |
24 |
20 |
|
41 |
35 |
25 |
21 |
|
41 |
36 |
31 |
22 |
|
42 |
40 |
32 |
Оценить существенность влияния возраста (А) и дозы (В) на некоторый анализ (F).
Решение. Данные в таблице 2 приведены так, как они должны выглядеть на листе Excel. Заполним диалоговое окно согласно рис. 7.2.
Рис. 7.2
Следует отметить, что в исходных данных должно быть одинаковое число строк (повторений наблюдений), в противном случае рекомендуется ввести оценки пропущенных наблюдений, выбрав их таким образом, чтобы минимизировать остаточную дисперсию (иначе нужно ввести среднюю других наблюдений в ячейках), причём нельзя включать эти оценки при подсчёте соответствующих степеней свободы. В случае пропуска данных в дисперсионном анализе без повторений необходимы более сложные методы.
После нажатия на кнопку ОК мы получим итоговую таблицу 3.
Таблица 3
Двухфакторный дисперсионный анализ с повторениями
ИТОГИ |
От 25 до 35 лет |
От 35 до 45 лет |
от 45 до 55 лет |
Итого |
от 10 до 20 мкг |
|
|
|
|
Счет |
5 |
5 |
5 |
15 |
Сумма |
101 |
107 |
101 |
309 |
Среднее |
20,2 |
21,4 |
20,2 |
20,6 |
Дисперсия |
1,2 |
6,3 |
3,7 |
3,54285 |
|
|
|
|
|
От 20 до 30 |
|
|
|
|
Счет |
5 |
5 |
5 |
15 |
Сумма |
159 |
141 |
121 |
421 |
Среднее |
31,8 |
28,2 |
24,2 |
28,0666 |
Дисперсия |
2,2 |
21,7 |
8,7 |
19,6380 |
|
|
|
|
|
Счет |
5 |
5 |
5 |
15 |
Сумма |
190 |
204 |
122 |
516 |
Среднее |
38 |
40,8 |
24,4 |
34,4 |
Дисперсия |
8 |
10,7 |
0,3 |
60,4 |
|
|
|
|
|
свыше 40 |
|
|
|
|
Счет |
5 |
5 |
5 |
15 |
Сумма |
204 |
170 |
132 |
506 |
Среднее |
40,8 |
34 |
26,4 |
33,7333 |
Дисперсия |
0,7 |
21,5 |
25,3 |
50,6380 |
Итого |
|
|
|
|
Счет |
20 |
20 |
20 |
|
Сумма |
654 |
622 |
476 |
|
Среднее |
32,7 |
31,1 |
23,8 |
|
Дисперсия |
68,5368 |
66,6210 |
13,3263 |
|
Дисперсионный анализ |
||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F крити- ческое |
Выборка |
1842,533 |
3 |
614,177 |
66,8189 |
3,7E-17 |
2,798 |
Столбцы |
900,4 |
2 |
450,2 |
48,9791 |
2,56E-12 |
3,190 |
Взаимодей- ствие |
537,4666 |
6 |
89,5777 |
9,74554 |
5,2E-07 |
2,294 |
Внутри |
441,2 |
48 |
9,19166 |
|
|
|
Итого |
3721,6 |
59 |
|
|
|
|
Дисперсионный анализ с повторениями позволяет оценить существенность влияния фактора А (доза), В (возраста), и их взаимодействия (факторов А и В) на некоторый анализ. Так как:
FA расч = 66,8189>FA кp = 2,7980;
FВ расч = 48,979l>FB кp = 3,1907;
FAВ расч = 9,7456>FAВ к p= 2,2945;
то следует признать статистически значимым влияние дозы (фактор А), возраста (фактор В) и их взаимодействия (факторы А и В) на некоторый анализ.
Итоговая таблица позволяет более детально рассмотреть свойства отдельных групп (например, возраст от 35до 45 лет и доза от 20 до 30 мкг).
В Excel имеется хорошая возможность наглядного представления изучаемых процессов или явлений с помощью мастера диаграмм. Для этого: предварительно выделим данные Таблица 2 нажмём кнопку Мастер диаграмм панели Стандартная; выберем закладку Стандартные, Тип диаграммы – График, нажмем кнопку Далее.
На закладке Диапазон данных укажем диапазон B2:D22, поставим отметку Ряды – в столбцах, нажмем кнопку Далее.
На закладке Заголовки укажем название диаграммы «Влияние дозы и возраста на некоторый анализ», ось X : доза, ось Y : возраст, нажмем кнопку Далее.
В следующем окне отметим Поместить на имеющемся (листе), нажмем кнопку Готово. В результате получим график на рис. 7.3.
Двухфакторный дисперсионный анализ без повторений позволяет оценить существенность воздействия факторов А и В на результирующий фактор F без учёта воздействия взаимодействия факторов А и В.
Рис. 7.3
Демонстрационный пример 9
Рассмотрим решение примера 8, высчитав с помощью Excel в каждой ячейке среднее значение наблюдений (таблица 4).
Таблица 4
Доза |
Возраст |
||
от 25 до 35 лет |
от 35 до 45 лет |
от 45 до 55 лет |
|
от 10 до 20 мкг |
20,2 |
21,4 |
20,2 |
от 20 до 30 мкг |
31,8 |
28,2 |
24,2 |
От 30 до 40 мкг |
38 |
40,8 |
24,4 |
свыше 40 мкг |
40,8 |
34 |
26,4 |
В результате заполнения диалогового окна (аналогичного окну примера 8 см. рис. 7.2) получим итоговую таблицу двухфакторного дисперсионного анализ без повторений (Таблица 5).
Таблица 5
Двухфакторный дисперсионный анализ без повторений |
|
|||
ИТОГИ |
Счет |
Сумма |
Среднее |
Дисперсия |
от 10 до 20 мкг |
3 |
61,8 |
20,6 |
0,48 |
от 20 до 30 мкг |
3 |
84,2 |
28,066 |
14,4533 |
от 30 до 40 мкг |
3 |
103,2 |
34,4 |
76,96 |
свыше 40 мкг |
3 |
101,2 |
33,7333 |
51,8933 |
|
|
|
|
|
от 25 до 35 лет |
4 |
130,8 |
32,7 |
83,5866 |
от 35 до 45 лет |
4 |
124,4 |
31,1 |
68,3333 |
от 45 до 55 лет |
4 |
95,2 |
23,8 |
6,74666 |
|
|
|
|
|
Дисперсионный анализ |
||||||
Источник вариации |
SS |
df |
MS |
F |
P-Зна- чение |
F крити- ческое |
Строки |
368,5066667 |
3 |
122,8355 |
6,8563 |
0,0229 |
4,757 |
Столбцы |
180,08 |
2 |
90,04 |
5,0258 |
0,0522 |
5,143 |
Погрешность |
107,4933333 |
6 |
17,91555 |
|
|
|
|
|
|
|
|
|
|
Итого |
656,08 |
11 |
|
|
|
|
Данные дисперсионного анализа свидетельствуют о том, что фактор А (доза) существенно влияет на некоторый анализ (так как FA расч = 6,8563>FA кр = 4,7570), а фактор В (возраст) статистически существенного влияния не оказывает (так как FBpacч = 5,0258<FBкcp = = 5,1432).
Различие в выводах примеров 8 и 9 можно объяснить тем, что в примере 9 мы не учитывали конкретные наблюдения в ячейках, а рассматривали лишь их среднее значение. Поэтому результат дисперсионного анализа с повторениями является более значимым, что соответствует и самому смыслу задачи.
Так как очевидно – на некоторый анализ влияют и доза, и возраст, и их взаимодействие (доза и возраст). Отсюда следует сделать вывод, что при организации наблюдений необходимо, для каждого уровня факторов, рассматривать возможно большее количество элементов в ячейках.
