
- •С.Е.Игнатова математическая статистика
- •Санкт-Петербург
- •Утверждено редакционно-издательским советом сПбГиэу
- •Игнатова с.Е.
- •Содержание:
- •Предисловие
- •Введение
- •1.Генеральная совокупность, выборка и основные способы организации выборки.
- •2.Вариационный ряд и порядковые статистики.
- •3.Статистическое оценивание параметров.
- •4.Точечные оценки и их свойства (несмещенность, состоятельность и эффективность).
- •5.Основные выборочные характеристики и их свойства.
- •5.1.Генеральная и выборочная средние.
- •5.2.Групповая и общая средние.
- •5.3.Отклонение от общей средней и его свойство.
- •5.4.Генеральная и выборочная дисперсии.
- •5.5.Групповая, внутригрупповая, межгрупповая и общая дисперсии.
- •5.6.Сложение дисперсий.
- •6.Основные точечные оценки.
- •6.1.Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних.
- •6.2.Оценка генеральной дисперсии по исправленной выборочной.
- •7.Законы распределения выборочных характеристик в нормальной генеральной совокупности.
- •7.1.Число степеней свободы.
- •7.2.Распределение хи-квадрат.
- •7.3.Распределение Стьюдента.
- •7.4.Распределение Фишера-Снедекора.
- •8.Интервальные оценки и доверительные области.
- •8.1.Оценка вероятности (биноминального распределения) по относительной частоте.
- •8.2.Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении.
- •8.3.Доверительный интервал для оценки среднего квадратического отклонения нормального распределения.
- •9.Байесовское статистическое оценивание.
- •10.Статистическая проверка гипотез: основные типы гипотез и общая логическая схема статистического критерия; характеристики качества критерия.
- •10.1.Общая логическая схема статистического критерия
- •10.2.Характеристики качества критерия.
- •11.Критерии согласия и однородности, проверка гипотезы о числовых значениях параметров.
- •11.1.Критерий однородности.
- •Например, рассмотрим непараметрический критерий сдвига.
- •11.2.Критерий согласия.
- •11.3.Методика вычисления теоретических частот нормального распределения:
- •11.4.Пример обработки массива статистических данных.
- •11.5.Сравнение двух дисперсий нормальных генеральных совокупностей
- •12.Неравенство информации, метод максимального правдоподобия и метод моментов.
- •12.1.Метод максимального правдоподобия
- •12.2.Неравенство информации
- •12.3.Эмпирические моменты
- •12.4.Метод моментов.
- •13.Основы статистического исследования зависимостей.
- •13.1.Регрессионный анализ.
- •13.1.1.Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным.
- •13.1.2.Выборочный коэффициент корреляции.
- •13.1.3.Корреляционная таблица.
- •13.1.4.Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным.
- •13.1.5.Выборочное корреляционное отношение.
- •13.1.6.Свойства выборочного корреляционного отношения.
- •13.1.7.Простейшие случаи криволинейной корреляции.
- •13.1.8.Понятие о множественной корреляции.
- •13.2.Дисперсионный анализ.
- •13.2.1.Общая, факторная и остаточная суммы квадратов отклонений
- •13.2.2.Связь между общей, факторной и остаточной суммами.
- •13.2.3.Общая, факторная и остаточная дисперсии.
- •13.2.4.Сравнение нескольких средних методом дисперсионного анализа.
- •13.2.5.Неодинаковое число испытаний на различных уровнях фактора.
- •Заключение
- •Список литературы:
- •Сведения об авторе
13.2.2.Связь между общей, факторной и остаточной суммами.
Выведем важную формулу:
.
Для упрощения вывода ограничимся двумя уровнями (p=2) и двумя испытаниями на каждом уровне (q=2). Результаты испытаний (измерений) представим в виде таблицы:
Номер испытания |
Уровни фактора |
|
i |
F1 |
F2 |
1 2 |
|
|
|
|
|
Тогда имеем:
.
Вычтем и прибавим
к каждому наблюдаемому значению на
первом уровне групповую среднюю
,
а на втором
.
Выполнив возведение в квадрат, и, учитывая, что сумма всех удвоенных произведений равна нулю, получаем:
,
где
и т.д.
Тогда, имеем:
.
Что и требовалось доказать.
Следствие:
.
13.2.3.Общая, факторная и остаточная дисперсии.
Разделив суммы квадратов отклонений на соответствующее число степеней свободы, получим общую, факторную и остаточную дисперсии:
,
,
,
где p – число уровней фактора,
q – число наблюдений на каждом уровне,
(pq – 1) – число степеней свободы общей дисперсии,
(p – 1) – число степеней свободы факторной дисперсии,
p(q –1) – число степеней свободы остаточной дисперсии.
Факторная дисперсия зависит от p составляющих и является смещенной оценкой.
Формула для несмещенной оценки факторной дисперсии:
Остаточная дисперсия
зависит от
т.е.
от pq
составляющих, следовательно, для
несмещенной остаточной дисперсии
получаем формулу:
Здесь число степеней свободы по сравнению с pq уменьшено на p, т.к. в каждой группе за счет групповой средней число степеней свободы уменьшается на единицу.
Если нулевая гипотеза о равенстве средних справедлива, то все эти дисперсии являются несмещенными оценками генеральной дисперсии.
Например, учитывая, что объем выборки , заключаем, что исправленная выборочная дисперсия (которая, как известно, является несмещенной оценкой генеральной дисперсии) равна:
Заметим, что число
степеней свободы
остаточной дисперсии равно разности
между числами степеней свободы и
факторной дисперсией.
Действительно:
.
13.2.4.Сравнение нескольких средних методом дисперсионного анализа.
Поставим задачу:
Проверить при заданном уровне значимости
нулевую гипотезу о равенстве нескольких
средних нормальных совокупностей с
неизвестными, но одинаковыми дисперсиями.
Покажем, что решение этой задачи сводится к сравнению факторной и остаточной дисперсий по критерию Фишера-Снедекора.
Пусть нулевая гипотеза о равенстве средних (далее будем называть их групповыми) справедлива. В этом случае факторная и остаточная дисперсии являются несмещенными оценками неизвестной генеральной дисперсии, и, следовательно, различаются незначительно. Если сравнить эти оценки по критерию F, то, очевидно, критерий укажет, что нулевую гипотезу о равенстве факторной и остаточной дисперсий следует принять.
Таким образом, если гипотеза о равенстве групповых средних правильна, то верна и гипотеза о равенстве факторной и остаточной дисперсий.
Пусть нулевая
гипотеза о равенстве групповых средних
ложна. В этом случае с возрастанием
расхождения между групповыми средними
увеличивается факторная дисперсия, а
вместе с ней и величина
В итоге
окажется больше
и, следовательно, гипотеза о равенстве
дисперсий будет отвергнута.
Таким образом, если гипотеза о равенстве групповых средних ложна, то ложна и гипотеза о равенстве факторной и остаточной дисперсий.
Легко доказать от противного справедливость обратных утверждений: из правильности (ложности) гипотезы о дисперсиях следует правильность (ложность) гипотезы о средних.
Вывод: Для того чтобы проверить нулевую гипотезу о равенстве групповых средних нормальных совокупностей с одинаковыми дисперсиями, достаточно проверить по критерию F нулевую гипотезу о равенстве факторной и остаточной дисперсий.
В этом и состоит метод дисперсионного анализа.
Заметим, что если
то справедлива гипотеза о равенстве
групповых средних а, значит, нет надобности
прибегать к критерию
.
Если нет уверенности в справедливости предположения о равенстве дисперсий рассматриваемых р совокупностей, то это предположение следует проверить предварительно, по другому критерию.
Пример: Произведено по четыре испытания на каждом их трех уровней. Результаты приведены в таблице. Методом дисперсионного анализа при уровне значимости 0,05 проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.
i |
F1 |
F2 |
F3 |
1 2 3 4 |
51 52 56 57 |
52 54 56 58 |
42 44 50 52 |
|
54 |
55 |
47 |
Решение: Составим расчетную таблицу. Пользуясь таблицей, и, учитывая что число уровней фактора р = 3, число испытаний на каждом уровне q = 4, найдем общую и факторную суммы квадратов отклонений.
i |
F1 |
F2 |
F3 |
|||
|
|
|
|
|
|
|
1 |
51 |
1 |
52 |
0 |
42 |
100 |
2 |
52 |
0 |
54 |
4 |
44 |
64 |
3 |
56 |
16 |
56 |
16 |
50 |
4 |
4 |
57 |
25 |
58 |
36 |
52 |
0 |
|
54 |
- |
55 |
- |
47 |
= 52 |
|
4 |
- |
9 |
- |
25 |
|
=
226,
= 4
(4
+ 9 + 25) = 152,
=266
– 152 = 144,
=
76,
Теперь сравним факторную и остаточную дисперсии по критерию F:
Учитывая, что число
степеней свободы числителя
,
а число степеней свободы знаменателя
и уровень значимости α = 0,05, по таблице
находим критическую точку:
Так как
>
гипотезу о равенстве групповых средних
отвергаем. Другими словами, групповые
средние «в целом» различаются значимо.
Если требуется сравнить средние попарно,
то следует воспользоваться критерием
Стьюдента.