- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
3.4. Критерии согласия
Пусть – случайная величина, возможные значения которой образуют генеральную совокупность. Известно [3], что случайную величину можно задать как функцией распределения , так и плотностью распределения (в случае непрерывной случайной величины). Предполагается, что после проведения независимых испытаний, будет получена выборка . До проведения испытаний элементы выборки можно считать независимыми случайными величинами , распределение которых такое же как у генеральной совокупности . Иногда нулевую гипотезу о предполагаемом законе распределения случайной величины удается сформулировать на основании теоретических предпосылок. Можно также сначала построить гистограмму. Затем подобрать теоретическое распределение, график плотности вероятности которого после сдвига и изменения масштаба примерно совпадает с гистограммой. Например, гистограмма, приведенная на рисунке 2.4.3, по форме похожа на график плотности нормального распределения, показанный на рисунке 2.3.1. Следовательно, можно предположить, что выборка, представленная в таблице 2.4.5, извлечена из генеральной совокупности с нормальным распределением. Для того, чтобы полностью задать предполагаемое теоретическое распределение, по выборке вычисляются точечные оценки параметров генеральной совокупности (например, и для нормального закона).
Пусть из генеральной совокупности извлечена выборка объемом n. Является ли расхождение между эмпирическим и предполагаемым теоретическим распределениями существенным (значимым)? Или такое расхождение можно объяснить случайностью, присущей любой выборке. Проверка нулевой гипотезы о том, что предполагаемое теоретическое распределение не противоречит выборке, осуществляется при помощи специально подобранной случайной величины с известным распределением. Такая величина должна принимать малые значения при большом сходстве между эмпирической и теоретической функциями распределения. Величина U характеризует степень расхождения между и , и ее принято называть критерием согласия.
Для выборки случайная величина принимает конкретное значение . Если вероятность того, что случайная величина , вычисленная при условии справедливости гипотезы , принимает значения равные (а тем более большие) мала, то теоретическая функция распределения подобрана плохо и гипотеза отвергается. Для того чтобы принять решение, следует ли считать вероятность малой, заранее задается ее предельное значение . Величина (обычно 0,1; 0,05; 0,01) называется уровнем значимости.
Для упрощения вычислений существуют таблицы величин , при которых . Чем больше значение , тем хуже согласуется гипотеза с экспериментальными данными. Если , то гипотеза отвергается. В этом случае считается, что выбранную функцию распределения нельзя использовать для описания генеральной совокупности, так как экспериментальные данные ей не соответствуют. С помощью любого критерия согласия нельзя доказать гипотезу , можно лишь подтвердить, что она не противоречит экспериментальным данным или отвергнуть, как маловероятное событие. Отметим, что критерий согласия является частным случаем статистического критерия значимости.