- •Предисловие
- •Лист студента
- •Лист рецензии
- •Раздел 1. Теория вероятностей
- •Тема 1.1. События и вероятность
- •1.1.1. Элементы комбинаторики
- •1.1.2. События
- •1.1.3. Понятие вероятности
- •1. Статистическое определение вероятности.
- •2. Классическое определение вероятности.
- •1.1.4. Алгебра событий
- •1.1.5. Теорема сложения
- •1.1.6. Условные вероятности и теорема умножения
- •1.1.7. Формула полной вероятности. Формулы Байеса
- •Тема 1.2. Повторение испытаний (схема Бернулли)
- •1.2.1. Формула Бернулли
- •1.2.2. Формула Пуассона
- •1.2.3. Локальная формула Лапласа
- •1.2.4. Интегральная формула Лапласа
- •Тема 1.3. Случайные величины
- •1.3.1. Дискретные случайные величины
- •1.3.2. Непрерывные случайные величины
- •Тема 1.4. Законы распределения случайных величин
- •1.4.1. Биномиальное распределение
- •1.4.2. Геометрическое распределение
- •1.4.3. Распределение Пуассона
- •1.4.4. Равномерное распределение
- •1.4.5. Показательное (экспоненциальное) распределение
- •1.4.6. Нормальное распределение
- •Тема 1.5. Система двух случайных величин
- •1.5.1. Дискретные двумерные случайные величины
- •1.5.2. Функция распределения двумерной случайной величины
- •Основные свойства функции распределения:
- •1.5.3. Непрерывные двумерные случайные величины
- •Свойства плотности распределения:
- •1.5.4. Независимые и зависимые случайные величины. Коэффициент корреляции
- •Свойства коэффициента корреляции
- •Тема 1.6. Закон больших чисел
- •1.6.1. Неравенства Маркова и Чебышева
- •1.6.2. Закон больших чисел
- •Теорема Чебышева
- •Закон больших чисел
- •1.6.3. Теорема Бернулли
- •Теорема Бернулли
- •1.6.4. Понятие о центральной предельной теореме
- •Центральная предельная теорема
- •Тема 1.7. Цепи Маркова
- •1.7.1. Понятие марковского случайного процесса
- •1.7.2. Цепи Маркова с дискретным временем
- •1.7.3. Цепи Маркова с непрерывным временем
- •Правила составления системы дифференциальных уравнений Колмогорова
- •Раздел 2. Математическая статистика
- •Тема 2.1. Вариационные ряды и их характеристики
- •2.1.1. Генеральная и выборочная совокупности
- •2.1.2. Вариационный ряд и его графические изображения
- •2.1.3. Числовые характеристики вариационных рядов
- •Тема 2.2. Оценка параметров генеральной совокупности
- •2.2.1. Точечные оценки параметров
- •2.2.2. Основные законы распределения статистических оценок
- •2.2.2.1. Распределение «хи-квадрат»
- •2.2.2.2. Распределение Стьюдента
- •2.2.2.3. Распределение Фишера-Снедекора
- •2.2.3. Интервальные оценки параметров
- •Тема 2.3. Проверка статистических гипотез
- •2.3.1. Основные понятия и определения
- •2.3.2. Проверка гипотезы о равенстве средних значений
- •2.3.3. Проверка гипотезы о равенстве генеральных дисперсий
- •2.3.4. Проверка гипотезы о распределении генеральной совокупности. Критерии согласия
- •Тема 2.4. Однофакторный дисперсионный анализ
- •2.4.1. Понятие о дисперсионном анализе
- •2.4.2. Факторная и остаточная дисперсии и их отыскание
- •2.4.3. Сравнение нескольких средних методом дисперсионного анализа
- •Тема 2.5. Корреляционно-регрессионный анализ
- •2.5.1. Формы представления исходных для анализа данных
- •2.5.2. Выборочный коэффициент корреляции
- •Свойства выборочного коэффициента корреляции
- •2.5.3. Выборочное корреляционное отношение
- •2.5.4. Линейная регрессия
- •2.5.5. Статистический анализ уравнения регрессии
- •Литература
Тема 2.4. Однофакторный дисперсионный анализ
2.4.1. Понятие о дисперсионном анализе
Пусть
генеральные совокупности
распределены нормально и имеют одинаковую,
хотя и неизвестную дисперсию; математические
ожидания также неизвестны, но могут
быть различными. Требуется при заданном
уровне значимости α по выборочным
средним проверить нулевую гипотезу о
равенстве всех математических ожиданий:
.
Казалось бы, что для решения поставленной задачи, т.е. для сравнения нескольких средних (p > 2), достаточно сравнить их попарно по методике подраздела 2.3.2 настоящего пособия. Однако с возрастанием числа средних возрастает и разброс различий между ними. По этой причине для сравнения нескольких средних пользуются методом, основанным на сравнении дисперсий и поэтому называемым дисперсионным анализом.
На
практике дисперсионный анализ применяют,
чтобы установить, оказывает ли существенное
влияние некоторый качественный фактор
,
который имеет
уровней
на изучаемую величину Х.
Например, если требуется выяснить, какой
именно вид удобрений наиболее эффективен
для получения наибольшего урожая с
участков одинаковой площади, то фактором
будет удобрение, а его уровнями – виды
удобрения.
Основная идея дисперсионного анализа состоит в сравнении «факторной» дисперсии, обусловленной воздействием только самого фактора, и «остаточной» дисперсии, обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает ощутимое влияние на величину Х, и в этом случае средние значений, наблюдаемых на каждом уровне фактора (групповые средние) различаются также значимо.
При этом, если установлено, что фактор оказывает существенное влияние на величину Х, и требуется выяснить, какой именно уровень фактора оказывает наибольшее воздействие, то проводят дополнительно попарное сравнение групповых средних по методике подраздела 2.3.2.
2.4.2. Факторная и остаточная дисперсии и их отыскание
Пусть
на количественный нормально распределенный
признак X
воздействует фактор
,
который имеет p
постоянных уровней. Будем полагать, что
число наблюдений на каждом уровне равно
q.
Пусть наблюдалось всего
значений
признака X,
где:
номер испытания,
номер уровня фактора. Пусть также
известны значения групповых средних:
,
а также значение общей средней:
.
Общей суммой квадратов отклонений измеренных значений от общей средней называется величина, определяемая формулой:
.
Факторной суммой квадратов отклонений групповых средних от общей средней называется величина, определяемая формулой:
.
Остаточной суммой квадратов отклонений наблюдаемых значений от групповых средних называется величина, определяемая формулой:
.
Замечание
1.
На практике обычно остаточную сумму
квадратов отклонений находят не по
приведенной формуле, а как разность
общей и факторной сумм квадратов
отклонений, т.е. по формуле:
.
Замечание 2. С помощью элементарных преобразований можно получить формулы, гораздо более удобные для практических расчетов и имеющие вид:
,
где:
и
рассчитываются для каждого уровня
фактора
,
а
.
Введенные
нами величины имеют вполне определенный
смысл. Так сумма
является характеристикой воздействия
фактора
на признак X.
Действительно, допустим, что фактор
оказывает существенное влияние на
признак X,
тогда группа наблюдаемых значений
признака на одном определенном уровне
фактора, вообще говоря, будет отличаться
от групп наблюдаемых значений признака
на других уровнях фактора. Следовательно,
будут различаться и групповые средние,
причем они будут тем больше рассеяны
вокруг общей средней, чем большим
окажется воздействие фактора.
Сумма
отражает влияние случайных воздействий
на результаты наблюдений. Действительно,
казалось бы, наблюдения одной группы
не должны различаться между собой.
Однако на признак X
кроме фактора
воздействуют и другие (в общем случае
многочисленные и малозначащие) случайные
факторы, поэтому наблюдения одной и той
же группы оказываются различными, а,
следовательно, рассеянными вокруг
групповой средней.
Подсчитав общую и факторную суммы по приведенным выше формулам, а остаточную сумму – по любой из приведенных формул, можно найти факторную и остаточную дисперсии.
Учитывая, что факторная дисперсия зависит от р составляющих и является смещенной оценкой, формулу для исправленной факторной дисперсии запишем в виде:
.
Остаточная дисперсия зависит от составляющих и также является смещенной оценкой, поэтому формулу для исправленной остаточной дисперсии запишем в виде:
.
