
- •Дисперсионный анализ данных с помощью Microsoft Excel
- •1. Основные понятия дисперсионного анализа.
- •2. Дисперсионный анализ с помощью Microsoft Excel
- •3. Расчет однофакторного комплекса.
- •4. Двухфакторный анализ без повторений
- •5.Двухфакторный анализ с повторяющимися данными
- •Р исунок 8
- •6. Задание для самостоятельной работы.
2. Дисперсионный анализ с помощью Microsoft Excel
В программе MS Excel для статистического анализа данных имеется надстройка "Пакет анализа", которая позволяет проводить дисперсионный анализ следующих видов:
однофакторный дисперсионный анализ,
двухфакторный дисперсионный анализ без повторений,
двухфакторный дисперсионный анализ с повторениями.
Последний вид двухфакторного анализа используется в том случае, когда в каждой группе данных имеется более одной выборки.
3. Расчет однофакторного комплекса.
Рассмотрим задачу проверки влияния дозы мерказолила на время Y (в сутках) устранения тиреотоксикоза у больных диффузным токсическим зобом. При этом исследуемый фактор A имеет три уровня:
A1 - 30 мг/сутки
A2 - 25 мг/сутки
A3 - 20 мг/сутки.
Статистический комплекс представлен на рисунке 2. Он включает 3 группы и в каждой группе имеется по 2 наблюдения, т.е. n = 2, к =3.
ВАРИАНТЫ РЕЗУЛЬТАТИВНОГО ПРИЗНАКА Y |
||
Уровень |
Уровень |
Уровень |
фактора A1 |
фактора A2 |
фактора A3 |
54 |
67 |
73 |
57 |
63 |
70 |
Рисунок 2
Для выполнения расчетов в MS Excel:
1. Сформируйте таблицу с исходными данными (Рисунок 3):
Рисунок 3
2.Выполните команду Анализ данных из меню Сервис.
3.Выберите в появившемся диалоговом окне метод "Однофакторный дисперсионный анализ" и нажмите кнопку [OK].
4.В окне "Однофакторный дисперсионный анализ" (Рисунок 4) установите для входных данных следующие параметры:
входной интервал равен $A$1:$C$3,
входной диапазон содержит метки в первой строке,
альфа (уровень значимости) равен 0,05.
Рисунок 4
5.Для параметров вывода установите переключатель в положение "Новый рабочий лист".
6.После завершения настройки параметров нажмите кнопку [OK].
Результаты дисперсионного анализа будут представлены на новом листе и состоять из двух таблиц (Рисунок 5). В первой таблице для каждой строки и каждого столбца исходной таблицы приведены числовые параметры: количество чисел, сумма, среднее и дисперсия.
Рисунок 5
Вторая часть – это результаты дисперсионного анализа. В таблице результатов Excel использует следующие обозначения:
В таблице результатов MS Excel использует следующие обозначения:
SS - сумма квадратов,
df - степени свободы,
MS - средний квадрат (дисперсия),
F – наблюдаемое значение F-статистики Фишера,
p-значение - значимость критерия Фишера,
F-критическое - критическое значение F-статистики при p=0,05.
Проанализируем полученные результаты. В соответствии с рисунком 5 имеем F = 22,85 и Fкр. = 9,55, т.е. F > Fкр. Следовательно влияние фактора на результативный признак можно считать достоверным, что и подтверждается величиной значимости (p=0.0153), которая меньше 0.05.
Итак, конкурирующая гипотеза о достоверности влияния фактора А может быть принята с вероятностью 0.95. При этом сила влияния мерказолила на устранение тиреотоксикоза оценивается в соответствии с формулой (10) величиной: