- •Введение
- •1. Основные понятия теории вероятностей Операции над событиями
- •Частость наступления события
- •Свойства частости
- •Аксиоматика теории вероятности Построение вероятностного пространства
- •Теорема о продолжении меры
- •Определение вероятностного пространства
- •Классическое определение вероятности
- •Условная вероятность
- •Обоснование формулы условной вероятности в общем случае
- •Независимые события
- •Формула сложения вероятностей
- •Формула полной вероятности
- •Формула Байеса
- •Композиция испытаний
- •Композиция n испытаний
- •Композиция n независимых испытаний
- •Биномиальное распределение
- •Случайная величина Теорема Колмогорова
- •Дискретные случайные величины
- •Вероятностные характеристики дискретных случайных величин
- •Свойства математического ожидания
- •Производная функция
- •Первая модель распределения Пуассона
- •Вторая модель распределения Пуассона
- •Непрерывные случайные величины
- •Свойства плотности вероятности
- •Второе эквивалентное определение плотности вероятности
- •Вероятностные характеристики непрерывных случайных величин
- •Распределение Гаусса - нормальное
- •Функция Лапласа
- •Неравенство Чебышева
- •Многомерные случайные величины
- •Аксиоматика. Формальная вероятностная модель
- •Двумерные случайные величины
- •Двумерные непрерывные случайные величины
- •2. Основы математической статистики
- •2.1. Основные понятия математической статистики
- •Интервальная группировка и представление выборочных данных
- •Числовые характеристики распределения выборки
- •Точечные статистические оценки параметров распределения
- •2.1.5.3. "Исправленная" дисперсия и "исправленное" среднее квадратическое отклонение
- •Интервальные статистические оценки параметров распределения (доверительные интервалы)
- •2.1.6.3. Доверительный интервал для математического ожидания нормального распределения случайной величины
- •Основные законы распределения, используемые в статистических исследованиях
- •Асимметрия и эксцесс распределения
- •2.2. Основные методы математической статистики
- •2.2.1. Проверка статистических гипотез
- •Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий Колмогорова
- •2.2.2. Исследование статистических различий между двумя выборками
- •Список использованных источников
- •Содержание Справочные материалы
- •Значения функции
- •Значения нормально распределенной случайной величины z
- •На интервале [0,1]
- •Значения функции
- •Табличные (критические) значения функции распределения χ2
Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий Колмогорова
Для изучаемой переменной выдвигается статистическая гипотеза : имеет нормальный закон распределения. Исходным материалом для проверки являются выборочные данные (выборка). На заданном уровне значимости требуется установить, согласуется ли выдвинутая гипотеза с выборочными данными или противоречит им.
Проверка гипотезы
нормальности по критерию Колмогорова
основана на сравнении между собой
эмпирической функции распределения
,
полученной по данным выборки объема
,
и гипотетической (теоретической) функции
распределения
нормального закона. Близость между ними
оценивается статистикой Колмогорова:
.
В качестве
эмпирической функции распределения
выбирается кумулятивная кривая; при
этом предполагается, что выборка
предварительно сгруппирована в
интервальный статистический ряд, причем
объем выборки
,число
интервалов группировки
.
Гипотетическая функция распределения имеет вид:
.
Практически
значения эмпирической функции
распределения
вычисляются в узлах
кумулятивной кривой, следовательно,
статистика
принимает вид
,
где
– есть накопленная к концу
-го
интервала интервальная относительная
частота;
.
Соответствующее значение гипотетической
функции распределения
приближенно может быть найдено по
формуле
.
Здесь
– функция распределения стандартного
нормального закона
,
выражаемая формулой
.
Специальная таблица
значений функции
для положительных x
приведена в прил. 1.3
Для отрицательных значений аргумента
x
следует применять свойство:
.
Описанные выше
вычисления наблюдаемого значения
статистики Колмогорова
удобно организовывать в форме расчетной
таблицы следующего вида:
|
|
|
|
|
|
|
|
|
|
При этом
предполагается, что предварительно
найдены выборочная средняя
и "исправленное" среднее квадратическое
отклонение
.
Критическую точку
статистики Колмогорова
находим по специальной таблице.4
В случае, если
и
,
удобно использовать следующую формулу:
.
Критерий (разрешающее правило) проверки гипотезы нормальности состоит в следующем:
1. Если
,
то гипотеза
сохраняется (т.е. она согласуется с
данной выборкой).
2. Если же
,
то гипотеза
отвергается (т.е. она противоречит данной
выборке).
Последнее означает, что изучаемая переменная не является нормально распределенной.
Пример Дан интервальный статистический ряд:
|
50–53 |
53–56 |
56–59 |
59–62 |
62–65 |
65–68 |
|
|
1 |
2 |
11 |
21 |
11 |
4 |
Требуется на
заданном уровне значимости
с помощью критерия Колмогорова проверить
гипотезу
о том, что данная выборка извлечена из
нормально распределенной генеральной
совокупности.
Здесь
,
,
,
,
.
В соответствии с вышеизложенным составим расчетную таблицу
|
|
|
|
|
|
|
|
|
|
1 |
50–53 |
1 |
0,02 |
0,02 |
–2,3790 |
0,0087 |
0,0113 |
0,0113 |
|
2 |
53–56 |
2 |
0,04 |
0,06 |
–1,4348 |
0,0764 |
–0,0164 |
0,0164 |
|
3 |
56–59 |
11 |
0,22 |
0,28 |
–0,4909 |
0,3121 |
–0,0321 |
0,0321 |
0,0321 |
4 |
59–62 |
21 |
0,42 |
0,70 |
0,4531 |
0,6736 |
0,0264 |
0,0246 |
|
5 |
62–65 |
11 |
0,22 |
0,92 |
1,3971 |
0,9192 |
0,0008 |
0,0008 |
|
6 |
65–68 |
4 |
0,08 |
1,00 |
2,3411 |
0,9904 |
0,0096 |
0,0096 |
|
|
– |
50 |
1,00 |
– |
– |
– |
– |
– |
– |
Таким образом,
наблюдаемое значение статистики
Колмогорова
=0,0321.
Далее определяем критическую точку статистики Колмогорова:
.
Сравниваем
и
и применяем разрешающее правило
.
Так как
<
,
то выдвинутая гипотеза
сохраняется; откуда делаем статистический
вывод о том, что данная выборка согласуется
с предположением о нормальном распределении
изучаемой переменной .
Критерий согласия Пирсона ( χ2 )
проверки гипотезы о нормальном распределении
Рассмотрим классический статистический метод решения задачи, поставленной в предыдущем пункте.
Пусть сформирована выборка некоторого объема , проведена интервальная группировка и получен интервальный статистический ряд.
Условия применимости
метода Пирсона следующие:
все
.
Если в некоторых интервалах последнее
требование не выполняется, то рекомендуется
эти интервалы объединить с соседними.
Проверка гипотезы нормальности по критерию Пирсона так же основана на сравнении эмпирического и гипотетического распределений, точнее, на сравнении эмпирических и теоретических интервальных частот. Мера близости между ними оценивается следующей статистикой Пирсона:
,
где – интервальные (эмпирические) частоты;
–
интервальные
теоретические частоты;
– теоретические
вероятности попадания переменной
в
-й
интервал
группировки,
.
При этом теоретические вероятности рассчитываются в предположении нормальности распределения случайной величины .
Стандартными в
теории вероятностей преобразованиями
устанавливается, что теоретические
вероятности
можно приближенно выразить следующей
формулой:
,
где
.
Здесь
есть плотность стандартного нормального
стандартного распределения
(0,1).
Специальная таблица
значений функции
для неотрицательных
приведена в прил.2.5
Вычисления
наблюдаемого значения статистики
Пирсона
удобно организовать в форме расчетной
таблицы.
|
|
|
|
|
|
|
|
– |
( – )2 |
|
1…m |
|
|
|
|
|
|
|
|
|
|
∑ |
– |
– |
n |
– |
– |
1 |
n |
– |
– |
|
В развернутых
курсах математической статистики
доказывается, что (при условии
справедливости выдвинутой гипотезы
)
статистика
имеет классическое распределение
Пирсона
с
степенями свободы.
По таблице квантилей распределения (табл.П5)6 для заданного уровня значимости и числа степеней свободы определяем критическую точку - распределения в соответствии с равенством:
,
где
(порядок квантили).
Критерий Пирсона (разрешимое правило) проверки гипотезы нормальности заключается в следующем:
1. Если
,
то гипотеза
сохраняется (согласуется с данной
выборкой).
2. Если же
,
то гипотеза
решительно отвергается.
Пример.
Используя условия примера п. 2.2.1.3,
проверить гипотезу о нормальном
распределении с помощью критерия
.
Для вычисления
заполняем расчетную таблицу:
|
|
|
|
|
|
|
|
|
|
|
1 |
50–53 |
51,5 |
1 |
2,851 |
0,0069 |
0,0065 |
0,325 |
0,675 |
0,4556 |
1,4018 |
2 |
53–56 |
54,5 |
2 |
1,907 |
0,0644 |
0,0608 |
3,040 |
–1,040 |
1,0816 |
0,3558 |
3 |
56–59 |
57,5 |
11 |
0,963 |
0,2516 |
0,2375 |
11,875 |
–0,875 |
0,7656 |
0,0645 |
4 |
59–62 |
60,5 |
21 |
0,019 |
0,3989 |
0,3766 |
18,830 |
2,170 |
4,7089 |
0,2501 |
5 |
62–65 |
63,5 |
11 |
0,925 |
0,2589 |
0,2444 |
12,220 |
–1,220 |
1,4884 |
0,1218 |
6 |
65–68 |
66,5 |
4 |
1,869 |
0,0694 |
0,0655 |
3,275 |
0,725 |
0,5256 |
0,1605 |
∑ |
– |
– |
50 |
– |
– |
0,9913 |
49,565 |
– |
- |
2,3545 |
Следовательно,
наблюдаемое значение статистики Пирсона
=2,355.
Далее определяем
критическую точку статистики Пирсона
при
,
–3=3,
.
Сравнивая
и
,
обнаруживаем, что
.
В соответствии с разрешающим правилом критерия Пирсона заключаем, что выдвинутая гипотеза нормальности сохраняется, т.е. согласуется с данной выборкой.
