- •Лабораторная работа № 6 Примеры однофакторного и двухфакторного дисперсионного анализов
- •Цель работы
- •Общие сведения
- •2.1. Основные понятия
- •2.2. Однофакторный дисперсионный анализ
- •2.3. Двухфакторный дисперсионный анализ с повторениями
- •6.4. Двухфакторный дисперсионный анализ без повторений
- •Задание к лабораторной работе
- •Содержание отчета
- •Контрольные вопросы
2.2. Однофакторный дисперсионный анализ
Это средство реализует критерий проверки гипотезы о равенстве математических ожиданий нескольких независимых выборок, построенный на основе дисперсионного анализа. Здесь покажем применение средства Однофакторный дисперсионный анализ и опишем его выходные данные.
На рис. 6.1 показаны три выборки, имеющие нормальное распределение с математическими ожиданиями 0, 0,5 и 1 и среднеквадратическими отклонениями 1, 2 и 3 соответственно. Объемы выборок — 50, 40 и 30 значений. (Выборки сгенерированы с помощью средства Генерация случайных чисел.) На рис. 6.1 также показано заполненное диалоговое окно Однофакторный дисперсионный анализ. Обращаем внимание, что все три выборки задаются в виде одного диапазона ячеек. В случае, когда выборки имеют разные размеры, диапазон задается в соответствии с наибольшей выборкой и неизбежно содержит пустые ячейки. Но средство правильно определяет объемы выборок. Также отметим, что в данном случае результаты анализа будут выводиться на отдельный рабочий лист с именем Результаты, который автоматически вставится в текущую рабочую книгу.
Рис. 6.1. Исходные данные и диалоговое окно Однофакторныи дисперсионный анализ
На рис. 6.2 показаны результаты, выводимые средством Однофакторныи дисперсионный анализ. Они представлены в виде двух таблиц, озаглавленных ИТОГИ и Дисперсионный анализ. В таблице ИТОГИ выводятся основные статистические характеристики выборок: в столбце Счет — объемы выборок, в столбце Сумма — суммы выборочных значений, в столбцах Среднее и Дисперсия — соответственно выборочные средние и дисперсии.
Рис. 6.2. Результат вычислений
Значения в первых четырех столбцах таблицы Дисперсионный анализ повторяют значения из дисперсионной таблицы. В столбце SS приведены суммы квадратов (межгрупповая, внутригрупповая и полная); в столбце df —значения степеней свободы, а в столбце MS — дисперсии, межгрупповая и внутригрупповая. В столбце F записано значение критериальной статистики, в столбце Р-Значение — значение вероятности Р(Х ≥ х), где X — случайная величина, имеющая F-распределение с df степенями свободы. В столбце F критическое приводится критическое значение t, рассчитанное в соответствии с заданным уровнем значимости (параметр Альфа).
Нулевая гипотеза о равенстве математических ожиданий всех выборок принимается, если выполняется неравенство F ≤ F критическое (α,k1,k2). В нашем примере эту гипотезу отвергать не следует.
Число степеней свободы (df) определяется как общее число наблюдений минус число связывающих их уравнений. Поэтому для среднего квадрата SS1, являющегося несмещенной оценкой межгрупповой дисперсии, число степеней свободы k1=m-1, так как при его расчете используются m групповых средних. А для среднего квадрата SS2, являющегося несмещенной оценкой внутригрупповой дисперсии, число степеней свободы k2=mn-m, ибо при ее расчете используются все mn наблюдений.
Как видно из рис. 6.2, верно тождество:
Q=Q1+Q2, (6.3)
где Q– общая, или полная, сумма квадратов отклонений;
Q1–сумма квадратов отклонений групповых средних от общей средней, или межгрупповая (факторная) сумма квадратов отклонений;
Q2– сумма квадратов отклонений наблюдений от групповых средних, или внутригрупповая (остаточная) сумма квадратов отклонений.
В разложении (6.3) заключена основная идея дисперсионного анализа. Применительно к рассматриваемой задаче равенство (6.3) показывает, что общая вариация показателя качества, измеренная суммой Q, складывается из двух компонент — Q1 и Q2, характеризующих изменчивость этого показателя между партиями (Q1) и изменчивость «внутри» партий (Q2), характеризующих одинаковую (по условию) для всех партий вариацию под воздействием неучтенных факторов.
