![](/user_photo/2706_HbeT2.jpg)
- •Глава 5. Проверка статистических гипотез
- •5.1. Статистические гипотезы.
- •5.2. Статистические критерии.
- •5.3. Область принятия гипотезы. Критическая область. Критические точки
- •5.4. Нахождение критических точек
- •5.5. Проверка гипотезы о равенстве двух средних значений нормальных генеральных совокупностей
- •5.6. Проверка гипотезы о равенстве генеральной средней нормальной совокупности гипотетическому числовому значению
- •5.7. Проверка гипотез о соотношении двух дисперсий нормальных генеральных совокупностей
- •5.8. Проверка гипотезы о нормальности распределения генеральной совокупности
- •5.8.1. Критерий согласия χ 2 (“хи квадрат”) Пирсона
- •5.8.2. Метод вычисления теоретических частот нормального распределения. Пример применения критерия χ 2
- •5.9. Элементы дисперсионного анализа
- •5.9.1. Общая, факторная и остаточная суммы квадратов отклонений
- •5.9.2. Общая, факторная и остаточная дисперсии
- •5.9.3. Расчетная схема дисперсионного анализа
5.9. Элементы дисперсионного анализа
Дисперсионный анализ применяют, если требуется установить, оказывает ли некоторый качественный фактор F, который имеет k уровней F1, F2, .., Fk , существенное влияние на изучаемую величинуX . Например, если нужно выяснить, какое вещество, входящее в состав промышленных выбросов, является наиболее вредным, то факторF - это исследуемые промышленные выбросы, а уровни фактора – вещества, входящие в состав выбросов.
Основная идея дисперсионного анализа заключается в следующем: если фактор F оказывает существенное влияние на признакX, то средние значения исследуемого признакаX , соответствующие различным уровням фактораF, будут различаться между собой в большей степени, чем в случае слабого влияния фактора.
5.9.1. Общая, факторная и остаточная суммы квадратов отклонений
Пусть на нормально распределенный признак X оказывает влияние факторF, имеющийk постоянных уровней. Положим, что число измеренных значений признакаX на каждом уровне одинаково и равноm.Результаты измерений представлены в таблице 5.4. Черезxij в таблице обозначены измеренные значения признакаX (i– номер испытания,j – номер уровня фактора). Всего проведеноn = mkизмерений, гдеn – объем выборки. Каждому уровню фактора соответствует своя группа измеренных значений.
Таблица 5.4
-
Номер испытания
Уровни фактора Fj
F1
F2
…
Fk
1
2
…
m
x11
x21
…
xm1
x12
x22
…
xm2
…
…
…
…
x1k
x2k
…
xmk
Групповая средняя
гр1
гр2
…
грk
Введем по определению:
общую сумму квадратов
отклонений измеренных значений от общей
средней
Sобщ=;
(5.4)
факторную сумму квадратов отклонений групповых средних от общей средней
Sф=m
,
(5.5)
которая характеризует разброс значений признака, входящих в разные группы;
остаточную сумму квадратов отклонений измеренных значений группы от своей групповой средней
Sост=,
(5.6)
которая характеризует разброс значений Xвнутри групп.
Практически остаточную сумму легче находить по равенству
Sост =Sобщ -Sф .
С помощью элементарных преобразований можно получить более удобные для расчетов формулы:
Sобщ
=,Sф =
, (5.7)
где Pj
=
- сумма квадратов значений признака,
соответствующих уровнюFj,
Rj
=
-
сумма измеренных значений, соответствующих
уровнюFj
.
Чтобы еще больше упростить вычисления,
можно из каждого измеренного значения
вычесть одно и то же число С, примерно
равное общей средней.
Тогда, если обозначить
yij = xij – C, получим
Sобщ
=,Sф =
,
(5.8)
где Qj
=
- сумма квадратов уменьшенных значений
признакаX на
уровнеFj
,
Tj
=
-
сумма уменьшенных значений признака,
соответствующих уровнюFj
.
Для проверки формул (5.8) следует подставить
Pj
=
и
Rj
=
в соотношение (5.7).
Величина суммы Sф
отражает действие фактораF. Действительно, пусть фактор F
оказывает существенное влияние на
признакX, причем на
некотором уровнеj
это влияние оказывается более сильным,
чем на других уровнях. Тогда группа
значений признака, соответствующих
уровнюj , должна
отличаться от значений признака в
группах, соответствующих другим уровням.
Будут различаться и групповые средние,
причем квадраты их отклоненийот
общей средней будут тем больше, чем
сильнее воздействие фактора. Поэтому,
чем сильнее воздействие фактора, тем
больше значениеSф
.
Величина суммы Sост отражает влияние случайных (помимо фактораF) воздействий на признакX. Действительно, если уровень фактора не меняется, то это не значит, что измеренные на данном уровне (входящие в одну группу) значения признакаX должны быть одинаковыми. Так как случайные воздействия устранить невозможно, значения признака, входящие в одну и ту же группу, должны быть различными и должны быть рассеянными вокруг своей групповой средней. Поэтому влияние случайных причин можно выразить в виде суммы квадратов отклонений значений признака "внутри" каждой группы от соответствующих групповых средних.
Величина суммы Sобщ отражает действие и фактора и случайных причин.