
- •Глава 1. Выборочный метод.
- •§1. Основные задачи математической статистики.
- •§2. Генеральная совокупность и выборка.
- •§3. Повторные и бесповторные выборки. Репрезентативная выборка.
- •§4. Статистическое распределение выборки.
- •§5. Эмпирическая функция распределения.
- •§6. Полигон и гистограмма.
- •§7. Статистические оценки.
- •§8. Эмпирические моменты распределения случайных величин.
- •§9. Методы точечного оценивания параметров распределения.
- •§10. Критические границы.
- •§11. Основные законы распределения статистических оценок.
- •§12. Интервальные оценки параметров нормального распределения.
- •Глава 2. Проверка статистических гипотез.
- •§1. Основные понятия.
- •§2. Гипотеза о равенстве выборочной средней и гипотетического математического ожидания нормального распределения.
- •§3. Гипотеза о равенстве дисперсий двух нормальных распределений.
- •§4. Гипотеза о равенстве средних двух нормальных распределений.
- •§5. Гипотеза о вероятности появления некоторого события.
- •§6. Критерий согласия.
- •Глава 3. Многомерные случайные величины.
- •§1. Понятие о многомерных случайных величинах.
- •§2. Дискретная двумерная случайная величина.
- •§3. Непрерывная двумерная случайная величина.
- •§4. Числовые характеристики двумерной случайной величины. Ковариация случайных величин X и y. Коэффициент корреляции.
- •Глава 4. Корреляционно-регрессионный анализ.
- •§1. Корреляционная зависимость. Две основные задачи теории корреляций.
- •§2. Выборочное уравнение линейной регрессии.
- •Глава 5. Дисперсионный анализ.
- •§1. Понятие о дисперсионном анализе.
- •§2. Общая факторная и остаточная суммы квадратов отклонений.
- •§3. Общая факторная и остаточная дисперсии.
- •§4. Сравнение нескольких средних методом дисперсионного анализа.
Глава 5. Дисперсионный анализ.
§1. Понятие о дисперсионном анализе.
Пусть генеральные совокупности X1, X2, …, Xp имеют нормальное распределение, их дисперсии неизвестны, но одинаковы. Требуется при заданном уровне значимости по выборочным средним проверить нулевую гипотезу о равенстве математических ожиданий.
H0: M(X1)=M(X2)=…=M(Xp)
Для сравнения нескольких средних принимается метод, который основан на сравнении дисперсий и поэтому называется дисперсионным анализом. На практике дисперсионный анализ применяют, чтобы оценить влияние некоторого качественного фактора F, имеющего p постоянных уровней на случайную величину X. Конкретные значения фактора называются его уровнями.
Например:
X – вес урожая
F – виды удобрений
Идея дисперсионного анализа заключается в сравнении факторной дисперсии, т.е. дисперсии, обусловленной воздействием фактора F c остаточной дисперсией, которая вызвана случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на случайную величину X. В этом случае групповые средние на каждом уровне будут отличаться от общей средней. В более сложных случаях исследуют воздействие нескольких факторов на нескольких уровнях и выясняют влияние отдельных уровней и их комбинаций (многофакторный анализ). Мы рассмотрим случай однофакторного анализа, когда на случайную величину X действует один фактор F, имеющий p постоянных уровней.
§2. Общая факторная и остаточная суммы квадратов отклонений.
Пусть на нормально
распределённую случайную величину X
действует фактор F,
имеющий p
постоянных уровней, на каждом уровне q
наблюдений, всего
наблюдений xij,
i
– номер испытания (i=1,2,…,q),
j
– номер уровня фактора (j=1,2,…,p).
xij – наблюдение на j-м уровне с номером i.
-
№ наблю-дения
Уровни фактора F
F1
F2
…
Fp
1
2
…
q
x11
x21
…
Xq1
X12
x22
…
Xq2
X1p
X2p
…
Xqp
Групповые средние
Будем называть общей суммой квадратов отклонения вариант от общей средней .
Факторная сумма квадратов отклонений групповых средних от общей средней.
Остаточной суммой квадратов отклонений вариант группы от своей групповой средней.
Можно доказать, что
.
§3. Общая факторная и остаточная дисперсии.
Общую выборочную
дисперсию найдём, разделив
на число наблюдений
:
.
Эта оценка является смещённой.
Чтобы получить
несмещённую оценку общей выборочной
дисперсии:
.
Разделив
и
на соответствующее число степеней
свободы, получим факторную и остаточную
дисперсии:
и
.
§4. Сравнение нескольких средних методом дисперсионного анализа.
Пусть требуется при заданном уровне значимости проверить нулевую гипотезу о равенстве нескольких средних (p>2), нормальных в совокупности с неизвестными, но одинаковыми дисперсиями. Решение этой задачи сводится к сравнению факторной и остаточной дисперсии по критерию Фишера.
Пусть нулевая гипотеза о равенстве нескольких групповых средних верна, в этом случае факторная и остаточная дисперсии являются несмещёнными оценками неизвестной генеральной дисперсии и поэтому различаются незначимо. Если сравнить эти оценки по критерию Фишера, то очевидно, критерий укажет, что нулевую гипотезу о равенстве факторной и остаточной дисперсий следует принять.
Вывод: если гипотеза о равенстве групповых средних верна, то верна и гипотеза о равенстве факторной и остаточной дисперсий.
Пусть нулевая гипотеза о равенстве групповых средних неверна, т.е. групповые средние отличаются друг от друга значимо, тогда с возрастанием расхождения между групповыми средними будет увеличиваться факторная дисперсия, и будет увеличиваться отношение
.
. В итоге F>Fкр и, следовательно, гипотеза о равенстве факторной и остаточной дисперсий будет отвергнута.
Вывод: если гипотеза о равенстве групповых средних неверна, то неверна и гипотеза о равенстве факторной и остаточной дисперсий. Справедливо и обратное утверждение: если верна (неверна) гипотеза о дисперсиях, то верна (неверна) гипотеза о равенстве средних.
Чтобы проверить нулевую гипотезу о равенстве групповых средних нормальных совокупностей с одинаковыми дисперсиями, достаточно проверить по критерию Фишера нулевую гипотезу о равенстве факторной и остаточной дисперсий. В этом и состоит метод дисперсионного анализа.