- •В.А. Павский
- •Оглавление
- •Часть 1. Понятие случайного события и его вероятности……..9
- •Часть 2. Случайные величины и функции распределения…….52
- •Часть 3. Предельные теоремы…………………………………………….130
- •Часть 4. Элементы математической статистики………………..141
- •Введение
- •Часть 1. Понятие случайного события и его вероятности
- •Операции над событиями
- •Кроме того, если выполнено условие
- •Следствия из аксиом
- •Из определения сразу следует, что
- •Элементы комбинаторики
- •Пример 5. Сколько существует размещений с повторениями при выборкеkшаров изn?
- •1.3 Вычисление вероятностей событий
- •1.3.1 Классический метод вычисления вероятностей
- •Пример.Поnящикам случайно распределяютсяnшаров. Считая, что ящики и шары различимы, найти вероятности следующих событий:
- •1.3.2 Геометрический метод вычисления вероятностей
- •1.3.3 Статистическое определение вероятности
- •1.3.4 Условная вероятность
- •Произвольны, причем рв.
- •Формула (6) считается определением, ниоткуда не выводится и является отражением здравого смысла. Поясним это на примере геометрического изображения событий (рис. 3).
- •Теорема умножения.ПустьА,в,тогда
- •1.4 Формула полной вероятности и формула Байеса (Bayes) Формула полной вероятности
- •Применяя теорему умножения получим
- •Применяя (9), получим
- •Формула Байеса
- •Вероятности ,, называютапостериорнымивероятностями гипотезВk, поскольку оценка происходит после того, как событиеАпроизошло.
- •1.5 Независимые испытания
- •1.6 Локальная теорема Муавра – Лапласа
- •Интегральная теорема Муавра-Лапласа
- •Функция - табулирована, ее значения приведены в табл. 4 приложения.
- •Сравнивая решение задачи п.1.5. А), б), можно предположить, что, так как – наивероятнейшее число, с большой вероятностью реализуется событие40k60, с центром в точкеk0:
- •1.8 Формула Пуассона
- •Часть 2. Случайные величины и функции распределения
- •Например, к дискретным случайным величинам относятся:
- •Свойства функции распределения.
- •Свойства плотности
- •Примеры основных распределений
- •2.1 Числовые характеристики случайных величин
- •2.1.1 Математическое ожидание, мода, медиана
- •Моменты
- •Свойства дисперсии
- •2.2 Вычисление числовых характеристик стандартных распределений
- •1. Биномиальное распределение.
- •Приложения нормального распределения
- •2.3 Функции от случайных величин
- •2.3.1 Функции от одного случайного аргумента
- •2.3.2 Многомерные случайные величины
- •2.3.3 Условные законы распределения
- •2.3.4 Моменты многомерных случайных величин
- •Свойства коэффициента корреляции
- •2.3.5 Случайные процессы
- •2.3.5.1 Марковские процессы
- •2.3.5.2 Непрерывные цепи Маркова
- •2.3.5.3 Потоки событий
- •2.3.6 Основы теории массового обслуживания
- •Часть 3. Предельные теоремы
- •Вместо (111), часто используют неравенство
- •3.1 Закон больших чисел
- •3.2 Центральные предельные теоремы
- •Часть 4. Элементы математической статистики
- •4.1 Оценка функций распределения
- •Свойства эмпирической функции распределения
- •4.2 Точечные оценки неизвестных параметров законов распределения
- •Итак, пусть имеем выборку (122). Для оценки математического ожидания
- •4.3 Доверительный интервал
- •Окончательно
- •4.4 Проверка статистической однородности
- •Заключение
- •Обозначения
- •Приложение
- •Значения некоторых числовых величин
- •Продолжение таблицы 5
- •Продолжение таблицы 7
- •Библиографический список
Свойства эмпирической функции распределения
1)
2)
имеет ступенчатый вид, непрерывна слева по определению,
если
если
Видно, что свойства эмпирической функции распределения вполне аналогичны теоретической.
Для оценки эмпирической функции распределения теоретической используют критерий Колмогорова А.Н.
Теорема. Если функция F(x) непрерывна, то
при n,
где
Функция называется функцией Колмогорова 2. Её значения табулированы и приведены в приложении (табл. 5).
Замечание. Из теоремы следует, что критерий Колмогорова применим для оценки только непрерывных распределений.
Пусть требуется проверить гипотезу Но о том, что случайная величина имеет своей функцией распределения непрерывную функцию F(x). Проведем n независимых испытаний и построим эмпирическую функцию Согласно теореме Гливенко [2] есть приближение к функции .
Величина есть мера отклонения Пусть такое, что , где . Если можно считать, что в единичном испытании практически невозможно произойти событию, вероятность которого равна , то мы приходим к следующему критерию проверки гипотезы Н0 (Критерий Колмогорова).
Выдвигаем гипотезу Н0: F(x) – функция распределения исследуемой сл. в. .
Находим
Вычисляем
По таблице находим .
Если достаточно велико (больше 0,2),
то гипотезу Н0 принимаем.
Пример 1. При концентрировании молочного сырья проницаемость растворителя через мембрану является случайной величиной , распределенной по эмпирическому закону:
.
Таблица 12
(мин) |
5 |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
0,135 |
0,26 |
0,36 |
0,45 |
0,518 |
0,57 |
0,628 |
0,648 |
0,735 |
50 |
55 |
60 |
65 |
70 |
75 |
80 |
0,78 |
0,72 |
0,83 |
0,85 |
0,875 |
0,892 |
0,91 |
Требуется, используя критерий Колмогорова, подобрать теоретическую функцию распределения сл. в. при числе опытов n = 16.
Решение. Из практических соображений есть основание считать, что искомой функцией является экспоненциальное распределение:
,
Составим таблицу значений теоретической функции распределения.
(мин) |
5 |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
10-3F() |
139 |
259 |
362 |
451 |
528 |
593 |
650 |
700 |
741 |
50 |
55 |
60 |
65 |
70 |
75 |
80 |
777 |
808 |
835 |
858 |
878 |
895 |
909 |
Максимальный разброс Dn при = 55 мин. равен: , тогда . По табл. 5 приложения находим, при значение Так как 0 1 ,2, то гипотезу об экспоненциальности распределения проницаемости принимаем.
Рис. 33 демонстрирует приближение эмпирической функции экспоненциальной.
Рис. 33
Критерий Колмогорова обладает наглядностью и простотой, однако, для его применения необходимо знать не только вид теоретической функции распределения, но и значения всех, входящих в неё, параметров. Заметим, что такая ситуация редко встречается на практике.
Другим критерием проверки гипотезы, о соответствии эмпирической функции распределения теоретической, является критерий 2 (Пирсона).
Пусть имеем табл. 11. Требуется проверить согласование экспериментальных данных с гипотсзой о том, что случайная величина имеет теоретическое распределение F(x).
Находим теоретические вероятности попадания случайной величины в каждый интервал табл. 11:
р1, р2, …, рк.
Меру расхождения 2 вычисляем по формуле Пирсона 3:
.
Распределение 2 зависит от объема выборки n и числа степеней свободы r:
.
Во всех случаях имеем одно ограничение: значит, число степеней свободы Если в теоретическом распределении присутствует один параметр (например ), то число степеней свободы Если два параметра, (например, ), то число степеней свободы и. т. д.
Зададим доверительную вероятность р. Гипотеза о законе распределенияF(x) принимается, на уровне значимостир, если
.
При использовании критерия 2 желательно, чтобы объем выборки был достаточно велик (n>50), а число интервалов к 5.
Пример 2. Для проверки соответствия опытных данных экспоненциальному распределению примера 1, применим критерий 2. Объем выборки n = 16, число степеней свободы r = 16-2 = 14. Будем считать, что число интервалов к = 16.
Взяв середину интервалов из табл. 12, получим следующую таблицу:
Таблица 13
i |
2,5 |
7,5 |
12,5 |
17,5 |
22,5 |
27,5 |
32,5 | ||||||||||
0,135 |
0,125 |
0,1 |
0,09 |
0,068 |
0,082 |
0,048 | |||||||||||
iрi |
0,338 |
0,938 |
1,250 |
1,575 |
1,530 |
2,255 |
1,560 | ||||||||||
|
| ||||||||||||||||
37,5 |
42,5 |
47,5 |
52,5 |
57,5 |
62,5 |
67,5 |
72,5 |
77,5 |
| ||||||||
0,052 |
0,04 |
0,04 |
0,03 |
0,02 |
0,02 |
0,025 |
0,017 |
0,018 |
| ||||||||
1,950 |
1,700 |
1,900 |
1,575 |
1,150 |
1,250 |
1,688 |
1,233 |
1,395 |
|
Из табл. 13 находим: .
Для теоретической функции распределения , гдезначения вероятностейрi найдем из формулы:
или
Результат сведем в таблицу:
|
2,5 |
7,5 |
17,5 |
22,5 |
27,5 |
32,5 |
pi |
0,193 |
0,349 |
0,576 |
0,658 |
0,724 |
0,778 |
0,0174 |
0,00536 |
0,0012 |
0,0024 |
0,0034 |
0,00067 |
37,5 |
42,5 |
47,5 |
52,5 |
57,5 |
62,5 |
67,5 |
72,5 |
77,5 |
0,821 |
0,855 |
0,884 |
0,906 |
0,924 |
0,949 |
0,951 |
0,960 |
0,968 |
0,019 |
0,001 |
0,0051 |
0,0024 |
0,00022 |
0,0017 |
0,0014 |
0,00071 |
0,00125 |
Составим сумму
= 16 0,0829 = 1,326.
Зададим доверительную вероятность р=0,95.
По таблицам приложения (табл. 6), при n - r = 16 – 2 = 14 степеней свободы, определяем значение 2 = 23,7,а так как , то с вероятностью р = 0,95 гипотеза, о соответствии эмпирической функции теоретической, принимается.
Упражнение. Решить пример для случая, когда число интервалов к = 8.
Замечание. В предлагаемых примерах соответствие настолько хорошее, что вызывает сомнение в том, что эмпирические данные не подтасованы. В практических приложениях уже при 0,3 гипотезу можно считать правдоподобной, тем более, если критерий Колмогорова дает аналогичный результат.
Замечание. Следует заметить, что для критерия Колмогорова параметр 0,03 взят интуитивно, а для критерия 2, он получен по опытным данным. Если бы мы для поверки гипотезы использовали бы 0,03 в критерии 2, то соответствие было бы еще лучше. Следовательно, можно поставить задачу о нахождении интервала допустимых значений параметра , которая рассматривается ниже.
Как видно, для применения критерия Пирсона, необходимо иметь достаточно большой объем выборки, да и его использование, по сравнению с критерием Колмогорова, достаточно громоздко. Тем не менее, применение критерия Пирсона обладает тем преимуществом, что числовые значения параметров теоретической функции распределения можно получить из имеющейся выборки, то есть заранее нам достаточно знать только общий вид теоретической функции распределения, причем любой случайной величины. Критерий Колмогорова в этом смысле более жесткий. Желательно при проверке гипотезы о соответствии теоретической функции распределения эмпирическим данным, применять оба критерия.
Задача нахождения теоретической функции распределения требует проведения достаточно большого числа опытов, а также, по крайней мере, общего вида искомой функции. Такая ситуация далеко не всегда встречается на практике.
Чаще всего имеется выборка относительно малого объема или вид теоретической функции распределения неизвестен.
В этом случае обычно вычисляют числовые характеристики случайных величин (моменты, вероятности и т. д.).