- •Лекции по дисциплине курса «Теория вероятностей и математическая статистика»
- •Часть II
- •Введение
- •1. Закон больших чисел
- •1.2. Неравенства чебышева
- •1.3. Сходимость по вероятности
- •1.4.Теоремы чебышева
- •1.4.1.Первая теорема Чебышева.
- •1.4.2. Вторая теорема Чебышева:
- •1.5. Теорема бернулли
- •1.6. Центральная предельная теорема
- •1.7. Предельные теоремы
- •1.7.1. Локальная теорема Муавра-Лапласа.
- •1.7.2. Интегральная теорема Муавра-Лапласа.
- •2. Базовые понятия математической статистики
- •2.1. Эмпирическая функция распределения
- •2.2. Гистограмма
- •2.3. Оценки параметров распределения и их свойства
- •2.4. Оценки моментов и квантилей распределения
- •2.5. Точечная оценка параметров распределения
- •2.5.1. Сущность задачи точечного оценивания параметров
- •2.5.2. Метод максимального правдоподобия
- •2.5.3. Метод моментов
- •2.5.4. Метод квантилей
- •3. Проверка статистических гипотез
- •3.1. Сущность задачи проверки статистических гипотез
- •3.2. Типовые распределения
- •3.2.1. Нормальное распределение
- •3.2.2. Распределение χ2 (хи-квадрат)
- •3.2.3. Распределение Стьюдента
- •3.3.4. Распределение Фишера
- •3.3. Проверка гипотез о законе распределения
- •3.3.1. Критерий хи-квадрат к. Пирсона
- •3.3.2. Критерий а.Н. Колмогорова
- •3.3.3. Критерий р. Мизеса
- •4. Интервальная оценка параметров распределения
- •4.1. Сущность задачи интервального оценивания параметров
- •4.2. Общий метод построения доверительных интервалов
- •4.3. Доверительный интервал для математического ожидания
- •4.4. Доверительный интервал для дисперсии
- •4.5. Доверительный интервал для вероятности
- •5. Аппроксимация закона распределения экспериментальных данных
- •5.1. Задачи аппроксимации
- •5.2. Аппроксимация на основе типовых распределений
- •6. Обработка однотипных выборок
- •6.1. Однотипные выборки эд и задачи их обработки
- •6.2. Объединение выборок
- •6.2.1. Объединение однородных выборок
- •6.2.2. Объединение неоднородных выборок
- •6.3. Однофакторный дисперсионный анализ
- •6.3.1. Задачи дисперсионного анализа
- •6.3.2. Проверка однородности совокупности дисперсий
- •6.3.3. Сравнение факторной и остаточной дисперсий
- •7. Корреляционный и регрессионный анализ
- •7.1. Матрица данных
- •7.2. Корреляционный анализ
- •7.3. Регрессионный анализ
- •7.3.1. Постановка задачи
- •7.3.2. Выбор вида уравнения регрессии
- •7.3.4. Вычисление коэффициентов уравнения регрессии
6.3. Однофакторный дисперсионный анализ
6.3.1. Задачи дисперсионного анализа
При исследовании однотипных величин возникают задачи их сравнения. Сравнение случайных величин производится путем сопоставления законов распределения или их моментов.
Законы распределения можно сопоставить на основе критерия Вилкоксона при нулевой гипотезе Н0 о равенстве законов распределения двух случайных величин Fx = Fy и конкурирующей гипотезе Н1 в виде: Fx < Fy или Fx > Fy. В этих случаях критическая область является односторонней. Поэтому нижнюю критическую точку и квантиль распределения находят при уровне значимости a. Содержание остальных этапов проверки гипотез сохраняется. Следует отметить, принятие гипотезы Н1 о том, что
Fx < Fy , означает X > Y.
Действительно, неравенство Fx (x) < Fy(x) равносильно неравенству
P(X < x)< P(Y < x),
следовательно, X>Y.
Аналогично, если справедлива гипотеза Fx >Fy, то X<Y.
Вполне естественно сопоставление случайных величин на основе моментов проводить путем сравнения их математических ожиданий. Однофакторный дисперсионный анализ позволяет установить, оказывает ли существенное влияние некоторый фактор Φ, который имеет несколько уровней, на исследуемую случайную величину.
Задача сравнения выборок случайных величин формулируется следующим образом.
Имеются результаты наблюдений в виде совокупности слоев типа (6.1), задан уровень значимости a для проверки статистической гипотезы. В данном случае отдельные слои трактуются как выборки одной и той же случайной величины, полученные по результатам наблюдения за одним объектом при различных значениях фактора Φ (количество уровней фактора равно m).
Требуется проверить нулевую гипотезу Н0 о равенстве математических ожиданий случайных величин всех выборок. Иначе говоря, требуется установить, значимо или незначимо различаются выборочные средние значения, вычисленные для каждого слоя.
Допущения: генеральные совокупности, соответствующие каждому слою, распределены нормально; дисперсии слоев одинаковы; математические ожидания, дисперсии, законы распределения случайных величин для различных слоев неизвестны, сами случайные величины являются непрерывными. Вполне понятно, что первые два условия являются наиболее существенными и весьма ограничивают область применения методов дисперсионного анализа.
Основная идея дисперсионного анализа состоит не в сопоставлении математических ожиданий случайных величин, а в сравнении оценки "факторной дисперсии", порождаемой воздействием фактора, и оценки "остаточной дисперсии", обусловленной случайными причинами. Если различие между этими оценками значимо, то фактор оказывает существенное влияние на случайную величину, в противном случае влияние фактора несущественно. Если установлено существенное влияние фактора, то каждому слою соответствует своя оценка математического ожидания. Упорядочение значений оценок математического ожидания позволит выявить влияние фактора.
Эту же задачу можно было бы решить путем проверки нулевой гипотезы о равенстве минимального и максимального значений оценок математического ожидания, вычисленных по всем слоям. Но такое сопоставление выборок игнорирует информацию, содержащуюся во всех слоях, кроме выбранных, и поэтому нецелесообразно.
Дисперсионный анализ выполняется поэтапно. Такими этапами являются следующие:
проверка выборок на принадлежность к нормальному закону распределения. Этап необходим, когда нет априорной информации о законах распределения слоев. Сущность такой проверки была рассмотрена в разделе 2 настоящего курса лекций. Если принадлежность нормальному закону не подтвердится, то аппарат дисперсионного анализа, вообще говоря, применять нельзя. Некоторые исследователи допускают его применение при больших объемах выборок (объем каждой выборки должен быть не менее 30) независимо от вида закона распределения;
проверка равенства оценок дисперсий во всех слоях выборки (проверка однородности дисперсий). Если однородность не подтвердится, то методы дисперсионного анализа не применимы;
вычисление оценки факторной и остаточной дисперсии;
сравнение средних значений величин методом дисперсионного анализа и формирование выводов по результатам сравнения.