0491803_E70E2_voprosy_k_ekzamenu_po_statistike / 21_d_analiz
.docТема 10. Дисперсионный анализ
Различия между значениями отдельных элементов совокупности складываются под влиянием множества отдельных факторов. Одни факторы в большей степени, а другие в меньшей степени оказывают влияние на вариант признака. Поэтому различают вариации - систематическую и случайную.
Задача дисперсионного анализа заключается в исследовании влияния тех или иных факторов на изменчивость средних величин результативного признака.
С этой целью производится разложение дисперсии наблюдаемой совокупности на составляющие, порождаемые независимыми факторами.
Разложение дисперсий
Общая дисперсия разбивается на факторную (межгрупповую) дисперсию, связанную с группировочным признаком, и остаточную (внутригрупповую) дисперсию, не связанную с группировочным признаком.
Сущность дисперсионного анализа заключается в сопоставлении факторной (межгрупповой) и остаточной (внутригрупповой) дисперсий и определения на основе этого соотношения суждения о влиянии и роли изучаемого фактора.
Факторная дисперсия объясняет вариацию результативного признака под влиянием изучаемого фактора
Остаточная дисперсия - вариацию результативного признака, обусловленную влиянием прочих факторов (за исключением влияния изучаемого фактора).
Общая дисперсия
В дисперсионном анализе дисперсией принято называть сумму квадратов отклонений индивидуальных значений признака от их средней арифметической.
Определение общей дисперсии обусловленной влиянием вариации всех признаков, производится по формуле:
где - отдельные значения результативного признака; - общая средняя. |
Например, - высота каблука(1ой пары обуви и каждой), - общая средняя высота каблука
Факторная дисперсия
Факторная дисперсия представляет собой сумму квадратов отклонений частных (групповых) средних от общей средней, умноженных на число единиц в каждой группе() (в случае расчета по взвешенной формуле):
где - средние по группам |
Остаточная дисперсия
Остаточная (случайная) дисперсия есть сумма групповых сумм квадратов отклонений всех вариант результативного признака в группах от их средних значений, т.е.
Далее производится оценка достоверности влияния факторного признака на результативный
Оценка надежности
Оценка надежности влияния факторного признака на результативный проводится с помощью расчета «числа степеней свободы вариации» - V, определяемых для:
- факторной дисперсии,
- остаточной дисперсии.
Число степеней свободы для факторной дисперсии равно количеству групп минус единица:
Если выборочная совокупность достаточно велика, то разница между N и N-1 несущественна, поэтому не оказывает влияния на результат расчетов.
Число степеней свободы для остаточной дисперсии равно разности между общей численностью совокупности и числом групп:
Затем рассчитываются дисперсии на одну степень свободы вариации (такая дисперсия соответствует среднему квадратическому отклонению признака в совокупности и может быть обозначена как). В этом случае дисперсии выступают как показатели, позволяющие сравнивать группы с разной численностью.
Проверка правильности расчетов числа степеней свободы вариации может быть осуществлена по равенству
Расчет дисперсии на одну степень свободы вариации
Критерий Фишера
Отношение факторной дисперсии и остаточной, рассчитанных на одну степень свободы, позволяет определить F-критерий: , разработанный английским ученым Р.Фишером.
Теоретическое значение F-критерия
Р.Фишером было установлено распределение отношений дисперсий, а также разработаны специальные таблицы теоретических значений F-критерия при двух вероятностях: 0,05 и 0,01.
Находят по таблицам для принятого в исследовании уровня значимости с учетом числа степеней свободы для факторной и остаточной дисперсий.
5%-ному уровню значимости соответствует 95%-ный уровень вероятности,
1%-ному уровню значимости - 99%-ный уровень вероятности.
В большинстве случаев избирают 5%-ный уровень значимости.
Теоретическое значение F-критерия при заданном уровне значимости по таблицам определяют на пересечении строки и столбца, соответствующим двум степеням свободы дисперсий: по строке -остаточной; по столбцу - факторной.
Расчетное значение F-критерия сравнивают с табличным
Если, то опыт доказывает с вероятностью большей заданной влияние фактора на результативный признак;
Если , то опыт доказывает с заданной вероятностью влияние фактора на результативный признак;
Если , влияние фактора на результативный признак не доказано, но не доказано и отсутствие влияния фактора. Опыт необходимо повторить, уравнивая группы по факторам, за исключением изучаемого фактора, или увеличить количество единиц изучаемой совокупности.
Если , то рассчитывают
определяют как отношение остаточной дисперсии на одну степень свободы к факторной дисперсии на одну степень свободы:
Теоретическое значение F-критерия в данном случае определяют при заданном уровне значимости по таблицам на пересечении строки и столбца, соответствующим двум степеням свободы дисперсий: по строке -факторной; по столбцу - остаточной.
Если , то опыт достоверно доказывает отсутствие влияния фактора на результативный признак.
Принципиальная схема дисперсионного анализа
|
|
|
||
|
|
|
||
|
|
|
||
|
|
|||
|
|
|