
0491807_F3EAE_lekcii_po_statistike / 010_дисперсионный_анализ
.docТема 10. Дисперсионный анализ
Различия между значениями отдельных элементов совокупности складываются под влиянием множества отдельных факторов. Одни факторы в большей степени, а другие в меньшей степени оказывают влияние на вариант признака. Поэтому различают вариации - систематическую и случайную.
Задача дисперсионного анализа заключается в исследовании влияния тех или иных факторов на изменчивость средних величин результативного признака.
С этой целью производится разложение дисперсии наблюдаемой совокупности на составляющие, порождаемые независимыми факторами.
Разложение дисперсий
Общая дисперсия разбивается на факторную
(межгрупповую) дисперсию, связанную с
группировочным признаком, и остаточную
(внутригрупповую) дисперсию, не связанную
с группировочным признаком.
Сущность дисперсионного анализа заключается в сопоставлении факторной (межгрупповой) и остаточной (внутригрупповой) дисперсий и определения на основе этого соотношения суждения о влиянии и роли изучаемого фактора.
Факторная дисперсия объясняет вариацию результативного признака под влиянием изучаемого фактора
Остаточная дисперсия - вариацию результативного признака, обусловленную влиянием прочих факторов (за исключением влияния изучаемого фактора).
Общая дисперсия
В дисперсионном анализе дисперсией принято называть сумму квадратов отклонений индивидуальных значений признака от их средней арифметической.
Определение общей дисперсии обусловленной влиянием вариации всех признаков, производится по формуле:
|
где
|
Например,
-
высота каблука(1ой пары обуви и
каждой),
-
общая средняя высота каблука
Факторная дисперсия
Факторная дисперсия представляет собой
сумму квадратов отклонений частных
(групповых) средних
от общей средней, умноженных на число
единиц в каждой группе(
)
(в случае расчета по взвешенной формуле):
|
где
|
Остаточная дисперсия
Остаточная (случайная) дисперсия есть сумма групповых сумм квадратов отклонений всех вариант результативного признака в группах от их средних значений, т.е.
Далее производится оценка достоверности влияния факторного признака на результативный
Оценка надежности
Оценка надежности влияния факторного признака на результативный проводится с помощью расчета «числа степеней свободы вариации» - V, определяемых для:
- факторной дисперсии,
- остаточной дисперсии.
Число степеней свободы для факторной
дисперсии равно количеству групп
минус единица:
Если выборочная совокупность достаточно велика, то разница между N и N-1 несущественна, поэтому не оказывает влияния на результат расчетов.
Число степеней свободы для остаточной
дисперсии равно разности между
общей численностью совокупности и
числом групп:
Затем рассчитываются
дисперсии на одну степень свободы
вариации (такая дисперсия соответствует
среднему квадратическому отклонению
признака в совокупности и может быть
обозначена как).
В этом случае дисперсии выступают как
показатели, позволяющие сравнивать
группы с разной численностью.
Проверка правильности расчетов числа
степеней свободы вариации может быть
осуществлена по равенству
Расчет дисперсии на одну степень свободы вариации
Критерий Фишера
Отношение факторной дисперсии и
остаточной, рассчитанных на одну степень
свободы, позволяет определить F-критерий:
,
разработанный английским ученым
Р.Фишером.
Теоретическое значение F-критерия
Р.Фишером было установлено распределение отношений дисперсий, а также разработаны специальные таблицы теоретических значений F-критерия при двух вероятностях: 0,05 и 0,01.
Находят по таблицам для принятого в исследовании уровня значимости с учетом числа степеней свободы для факторной и остаточной дисперсий.
5%-ному уровню значимости соответствует 95%-ный уровень вероятности,
1%-ному уровню значимости - 99%-ный уровень вероятности.
В большинстве случаев избирают 5%-ный уровень значимости.
Теоретическое значение F-критерия при заданном уровне значимости по таблицам определяют на пересечении строки и столбца, соответствующим двум степеням свободы дисперсий: по строке -остаточной; по столбцу - факторной.
Расчетное значение F-критерия сравнивают с табличным
Если,
то опыт доказывает с вероятностью
большей заданной влияние фактора на
результативный признак;
Если
,
то опыт доказывает с заданной вероятностью
влияние фактора на результативный
признак;
Если
,
влияние фактора на результативный
признак не доказано, но не доказано и
отсутствие влияния фактора. Опыт
необходимо повторить, уравнивая группы
по факторам, за исключением изучаемого
фактора, или увеличить количество единиц
изучаемой совокупности.
Если
,
то рассчитывают
определяют
как отношение остаточной дисперсии на
одну степень свободы к факторной
дисперсии на одну степень свободы:
Теоретическое значение F-критерия в данном случае определяют при заданном уровне значимости по таблицам на пересечении строки и столбца, соответствующим двум степеням свободы дисперсий: по строке -факторной; по столбцу - остаточной.
Если
,
то опыт достоверно доказывает отсутствие
влияния фактора на результативный
признак.
Принципиальная схема дисперсионного анализа
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|