- •Понятие о дисперсионном анализе
- •Однофакторный дисперсионный анализ. Предварительные расчеты
- •Однофакторный дисперсионный анализ. Закон Фишера–Снедекора распределения непрерывной случайной величины
- •Однофакторный дисперсионный анализ. Решение вопроса о значимости рассматриваемого фактора
- •Задание
- •Пример выполнения
Однофакторный дисперсионный анализ. Закон Фишера–Снедекора распределения непрерывной случайной величины
Для определения критерия, меры, с помощью которой можно решить вопрос о значимости величины факторной дисперсии, сначала надо рассмотреть факторную и остаточную дисперсии с позиций непрерывной случайной величины.
Если варианты xki считать случайными порождениями непрерывных случайных величин Xki, которые распределены по нормальному закону с математическим ожиданием mx и средним квадратическим отклонением σx, то можно считать, что случайные величины
,
порождающие значения выборочных средних для каждого уровня рассматриваемого фактора
,
будут тоже
распределены по нормальному закону с
тем же математическим ожиданием mx,
но с другим средним квадратическим
отклонением, которое есть
.
В связи с этим можно утверждать, что факторная дисперсия в нормированном следующим способом виде
является порождением непрерывной случайной величины
,
которая распределена по закону χ2 с (K – 1)-ой степенью свободы.
Аналогичные рассуждения можно выполнить для остаточной дисперсии. Она в нормированном виде
,
является порождением непрерывной случайной величины
,
которая тоже распределена по закону χ2, но с (KN – K) степенями свободы.
Теорема. Если U и V – непрерывные случайные величины, распределённые по закону χ2 с kU и с kV степенями свободы соответственно, то их композиция
имеет распределение, которое называется F-распределением Фишера–Снедекора, с плотностью
,
где
,
а Г(x) – гамма-функция Гаусса.
Подсчёт вероятности попадания непрерывной случайной величины, подчиняющейся закону Фишера–Снедекора, на заданный интервал от a до b, осуществляется с помощью плотности распределения традиционным образом
.
Её вычисление в среде Excel’а выполняется с помощью стандартной функции FРАСП(δ; kU; kV), которая определяется интегралом
FРАСП(δ;
kU;
kV)
,
где kU и с kV – степени свободы закона. Делается это на основе свойства определённого интеграла следующим образом
= FРАСП(a; kU; kV) – FРАСП(b; kU; kV).
Для решения обратной задачи – определения по заданной вероятности границ локализации случайной величины, которая распределена по закону Фишера–Снедекора, в Excel’е существует стандартная функция FРАСПОБР(α; kU; kV). С её помощью для заданной вероятности
можно найти левую границу δ полубесконечного интервала локализации величины F
δ = FРАСПОБР(α; kU; kV),
где kU и с kV, как и ранее, обозначают числа степеней свободы рассматриваемого закона.
В соответствии с рассмотренной теоремой случайные величины Dфакт и Dост порождают случайную величину
,
которая распределена по закону Фишера–Снедекора с (K – 1)-ой и (KN – K)-ой степенями свободы, и которая может быть использована для решения вопроса о значимости величины факторной дисперсии.
Таблицу распределения Фишера можно найти практически в каждой книге по математической статистике, в частности в Приложении №7 книги Гмурмана В.Е. Теория вероятностей и математическая статистика.
Однофакторный дисперсионный анализ. Решение вопроса о значимости рассматриваемого фактора
Для проверки гипотезы о значимости или незначимости влияния рассматриваемого фактора A в качестве критерия можно использовать случайную величину F, которая подчиняется закону Фишера–Снедекора
.
Этот критерий описывает правостороннюю критическую область для гипотезы о незначимости рассматриваемого фактора. Если F < Fкр, то значение Dфакт недостаточно велико для того, чтобы считать влияние фактора A значимым. В противном случае, при F > Fкр, когда Dфакт существенно превосходит Dост, следует отвергнуть гипотезу о том, что влияние фактора A незначительно.
Для реализации такого подхода сначала надо выбрать уровень значимости α и из уравнения
с помощью закона Фишера–Снедекора найти критическое значение критерия Fкр. В среде Excel’а это можно сделать, воспользовавшись функцией FРАСПОБР
Fкр = FРАСПОБР(α; K – 1; KN – K).
Далее, по данным выборки следует вычислить наблюдаемое значение критерия. Это может быть сделано по формуле
,
где
,
или по формуле,
учитывающей формулы для
.
После этого, сравнивая значения Fкр и Fнабл, можно сделать вывод о значимости или незначимости рассматриваемого фактора.
Замечание. Для вычисления выборочной дисперсии и факторной дисперсии удобно применять следующие формулы
.
