
- •Введение
- •Часть 1. Элементы теории вероятностей
- •§ 1. Случайная величина. Задание законов ее распределения
- •§ 2. Числовые характеристики случайной величины
- •§ 3. Законы распределения вероятностей дискретных случайных величин
- •Равномерное распределение вероятностей дискретной случайной величины
- •2. Биномиальное распределение вероятностей дискретной случайной величины
- •3. Закон распределения Пуассона
- •4. Гипергеометрическое распределение вероятностей дискретной случайной величины
- •5. Геометрическое распределение вероятностей дискретной случайной величины
- •§ 4. Законы распределения вероятностей непрерывных случайных величин
- •1. Равномерное распределение вероятностей непрерывной случайной величины
- •2. Экспоненциальное (показательное) распределение вероятностей непрерывной случайной величины
- •3. Нормальное распределение вероятностей непрерывной случайной величины
- •4. Распределения, связанные с нормальным распределением
- •5. Распределение Вейбулла
- •§ 5. Оценка отклонения теоретического распределения от нормального. Асимметрия и эксцесс
- •Часть 2. Элементы математической статистики
- •§ 1. Выборка и ее распределение
- •§ 2. Статистические оценки
- •1. Несмещенные, эффективные и
- •3. Другие характеристики вариационного ряда.
- •4. Эмпирические моменты
- •5. Асимметрия и эксцесс эмпирического распределения
- •6. Число степеней свободы
- •7. Точечная и интервальная оценки
- •8. Доверительный интервал для оценки математического ожидания нормального распределения при известном и в случае неизвестного
- •9. Доверительный интервал для оценки среднего
- •§ 3. Проверка статистических гипотез
- •§ 4. Проверка гипотезы о распределении генеральной совокупности. Критерий Пирсона. Критерий Колмогорова
- •Часть 3. Примеры анализа экспериментальных данных
- •§ 1. Общие положения
- •§ 2. Составление вариационного ряда. Графическое представление результата. Нахождение среднего значения и дисперсии
- •§ 3. Проверка гипотезы о распределении Вейбулла
- •І. Применение критерия Пирсона
- •Іі. Применение критерия Колмогорова
- •§ 4. Проверка гипотезы о показательном распределении случайной величины
- •І. Применение критерия Пирсона
- •Іі. Применение критерия Колмогорова
- •§ 5. Проверка гипотезы о нормальном распределении случайной величины
- •І. Применение критерия Пирсона
- •Іі. Применение критерия Колмогорова
- •§ 6. Замечания
- •§ 7. Применение вычислительной техники
- •Задания и варианты данных для лабораторной работы
- •Часть 4. Применение элементов математической статистики
- •§ 1. Применение элементов математической статистики для оценки надежности машин
- •§ 2. Применение элементов математической статистики при обосновании параметров зерноочистительной машины
- •Заключение
- •Приложения
- •Значения коэффициентов вариации для различных законов распределения
- •Критерий Колмогорова
- •Значения коэффициентов распределения Вейбулла
- •Значения чисел в зависимости от
- •Отклонения
- •Библиографический список
- •§4. Законы распределения вероятностей непрерывных
§ 4. Проверка гипотезы о распределении генеральной совокупности. Критерий Пирсона. Критерий Колмогорова
Прогнозы
о значениях, которые может иметь случайная
величина точны и обоснованы, если
известен ее закон распределения.
Приближенное представление о плотности
распределения случайной величины дает
гистограмма, построенная по опытным
данным. Сравнивая ее с графиком плотности
известных распределений, можно выбрать
подходящий закон распределения. В
некоторых случаях, зная физическую
природу факторов, влияющих на значения
случайной величины, можно сделать
теоретическое обоснование вида закона
распределения. Так, например, известно,
что если отказы изделия устранимы
(изделие можно отремонтировать), то
продолжительность работы изделия
(наработка) до капитального ремонта при
коэффициенте вариации
%
имеет распределение, близкое к нормальному,
а при
30%-60%- к распределению Вейбулла. Наработка
изделия на отказ, вызванный мгновенным
повреждением (например, прокол шины)
при
00%,
неплохо описывается показательным
распределением и т.д.
Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А.
Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Имеется несколько критериев согласия: хи-квадрат Пирсона, Смирнова, Колмогорова и др. Ограничимся описанием применения критерия Пирсона и критерия Колмогорова.
Предположим,
что закон распределения выбран, т.е.
принята нулевая гипотеза
:
данные выборки являются значениями
случайной величины с плотностью
(или с функцией распределения
).
Рассмотрим методику проверки гипотезы по критерию хи-квадрат Пирсона.
1. Подсчитаем опытное значение .
Для этого:
а) По данным выборки строим интервальный вариационный ряд (при выборе интервалов соблюдаем условия: интервалы должны заполнять всю область значений , не пересекаться и содержать не менее чем по пять результатов). Первая строка вариационного ряда представляет собой, выписанные в возрастающем порядке, интервалы значений признака, а вторая – частоты (число появлений) значений из рассматриваемого интервала.
Таблица 3
Интервалы |
|
|
… |
|
Частоты |
|
|
… |
|
б) Используя нулевую
гипотезу, находим вероятности
попадания значения
в
интервалы при одном опыте:
или
Подсчитываем
теоретические частоты
попаданий значений
в интервалы при
повторных и независимых опытах.
г) Вычисляем опытные значения критерия
Оказывается,
является значением случайной величины,
распределение которой при больших
(при
)
мало отличается от распределения
случайной величины
с
степенями свободы, где
- число интервалов, а
- число параметров предполагаемого
распределения. Так, для показательного
распределения
,
для нормального распределения
.
Распределение описывает распределение суммы квадратов независимых случайных величин, каждая из которых имеет нормальное распределение с параметрами 0 и 1.
Распределение
затабулировано. В таблице распределения
для значений уровня значимости
и числа степеней свободы
указаны числа
,
для которых
.
2.
Выбираем уровень значимости
и строим критическую область. Значимыми
значениями критерия хи-квадрат являются
большие положительные значения
.
Поэтому критическая область имеет вид
.
Границу
критической области находим из таблицы
распределения
по уровню значимости
и числу степеней свободы
(Приложение
3).
3. Делаем вывод по правилу:
а)
Гипотеза
принимается, если
не попало в критическую область;
б) Гипотеза отклоняется, если попало в критическую область.
В последнем случае следует подобрать другой подходящий закон распределения и снова провести проверку его согласия с опытными данными.
Критерий хи-квадрат применяется к довольно разнообразным случаям проверки статистических гипотез. Однако, его приложение, например, к поверке соответствия между гипотетическим и фактически наблюдаемым распределениями существенно зависит от сделанного довольно произвольно подразделения результатов наблюдений на группы; в силу этого результаты проверки гипотезы несколько условны. Сама группировка, т.е. объединение наблюдаемого материала в группы, связана с некоторой потерей имевшейся в первоначальных данных информации. Эти обстоятельства заставляют проявлять известную осторожность, и показания критерия хи-квадрат рекомендуется дополнять показаниями других критериев.
Рассмотрим методику проверки гипотезы по критерию Колмогорова.
На
практике кроме критерия Пирсона часто
используется критерий Колмогорова, в
котором в качестве меры расхождения
между теоретическим и эмпирическим
распределениями рассматривается
максимальное значение абсолютной
величины разности между эмпирической
функцией распределения
и
соответствующей теоретической функцией
распределения
:
,
называемое статистикой критерия Колмогорова (D-статис-тикой).
Доказано,
что какова бы ни была функция распределения
непрерывной случайной величины Х,
при неограниченном увеличении числа
наблюдений
вероятность неравенства
стремиться к пределу
.
Задавая уровень значимости α, из соотношения
Можно
найти соответствующее критическое
значение
.
В таблице приводятся критические
значения
критерия Колмогорова для некоторых α.
Схема применения критерия следующая:
Строятся эмпирическая функция распределения и предполагаемая теоретическая функция распределения
Определяется мера расхождения между теоретическим и эмпирическим распределением
и вычисляется величина
.
Если вычисленное значение λ окажется больше критического , определенного на уровне значимости α, то нулевая гипотеза
о том, что случайная величина Х имеет заданный закон распределения, отвергается. Если
, то считают, что гипотеза не противоречит опытным данным.
Критерий Колмогорова
достаточно часто применяется на практике
благодаря своей простоте. Однако в
принципе его применение возможно лишь
тогда, когда теоретическая функция
распределения
задана
полностью. Но такой случай на практике
встречается весьма редко. Обычно из
теоретических соображений известен
лишь вид функции распределения, а ее
параметры определяются по эмпирическим
данным. При применении критерия Пирсона
это обстоятельство учитывается
соответствующим уменьшением числа
степеней свободы. Такого рода правок в
критерии Колмогорова не предусмотрено.
Поэтому, если при неизвестных значениях
параметров применить Критерий Колмогорова,
взяв за значения параметров их оценки,
то получим завышенное значение вероятности
,
а значит, большее критическое значение
.
В результате есть риск в ряде случаев
принять нулевую гипотезу
о законе распределения случайной
величины как правдоподобную, в то время
как на самом деле она противоречит
опытным данным.
В заключении отметим, что при проверке ряда гипотез, например, гипотез о законе распределения на заданном уровне значимости, контролируется лишь ошибка первого рода (возможность отвергнуть правильную гипотезу), но нельзя сделать вывод о степени риска, связанного с принятием неверной гипотезы, т.е. с возможностью совершения ошибки второго рода.
В Части 3 данного пособия приведены примеры использования критериев Пирсона и Колмогорова.