- •Государственное образовательное учреждение высшего профессионального образования
- •Кафедра информатики и прикладной математики математика ч. 2 Теория вероятностей и элементы математической статистики
- •Санкт-Петербург
- •Информация о дисциплине
- •1.1. Предисловие
- •Содержание дисциплины и виды учебной работы
- •Объем дисциплины и виды учебной работы
- •Перечень видов практических занятий и контроля:
- •2. Рабочие учебные материалы
- •2.1. Рабочая программа (объем 150 часов) Введение
- •Раздел 1. Случайные события (50 часов)
- •Тематический план дисциплины для студентов очно-заочной формы обучения
- •Тематический план дисциплины для студентов заочной формы обучения
- •2.3. Структурно-логическая схема дисциплины
- •Математика ч.2. Теория вероятностей и элементы математической статистики Теория
- •Раздел 1 Случайные события
- •Раздел 3 Элементы математической статистики
- •Раздел 2 Случайные величины
- •2.5. Практический блок
- •2.6. Балльно-рейтинговая система
- •Информационные ресурсы дисциплины
- •Библиографический список Основной:
- •3.2. Опорный конспект по курсу “ Математика ч.2. Теория вероятностей и элементы математической статистики” введение
- •Раздел 1. Случайные события
- •1.1. Понятие случайного события
- •1.1.1. Сведения из теории множеств
- •1.1.2. Пространство элементарных событий
- •1.1.3. Классификация событий
- •1.1.4. Сумма и произведение событий
- •1.2. Вероятности случайных событий.
- •1.2.1. Относительная частота события, аксиомы теории вероятностей. Классическое определение вероятности
- •1.2.2. Геометрическое определение вероятности
- •Вычисление вероятности события через элементы комбинаторного анализа
- •1.2.4. Свойства вероятностей событий
- •1.2.5. Независимые события
- •1.2.6. Расчет вероятности безотказной работы прибора
- •Формулы для вычисления вероятности событий
- •1.3.1. Последовательность независимых испытаний (схема Бернулли)
- •1.3.2. Условная вероятность события
- •1.3.4. Формула полной вероятности и формула Байеса
- •Раздел 2. Случайные величины
- •2.1. Описание случайных величин
- •2.1.1. Определение и способы задания случайной величины Одним из основных понятий теории вероятности является понятие случайной величины. Рассмотрим некоторые примеры случайных величин:
- •Чтобы задать случайную величину, надо указать ее закон распределения. Случайные величины принято обозначать греческими буквами ,,, а их возможные значения – латинскими буквами с индексамиxi,yi,zi.
- •2.1.2. Дискретные случайные величины
- •Рассмотрим события Ai , содержащие все элементарные события , приводящие к значению XI:
- •Пусть pi обозначает вероятность события Ai :
- •2.1.3. Непрерывные случайные величины
- •2.1.4. Функция распределения и ее свойства
- •2.1.5. Плотность распределения вероятности и ее свойства
- •2.2. Числовые характеристики случайных величин
- •2.2.1. Математическое ожидание случайной величины
- •2.2.2. Дисперсия случайной величины
- •2.2.3. Нормальное распределение случайной величины
- •2.2.4. Биномиальное распределение
- •2.2.5. Распределение Пуассона
- •Раздел 3. Элементы математической статистики
- •3.1. Основные определения
- •Гистограмма
- •3.3. Точечные оценки параметров распределения
- •Основные понятия
- •Точечные оценки математического ожидания и дисперсии
- •3.4. Интервальные оценки
- •Понятие интервальной оценки
- •Построение интервальных оценок
- •Основные статистические распределения
- •Интервальные оценки математического ожидания нормального распределения
- •Интервальная оценка дисперсии нормального распределения
- •Заключение
- •Глоссарий
- •4. Методические указания к выполнению лабораторных работ
- •Библиографический список
- •Лабораторная работа 1 описание случайных величин. Числовые характеристики
- •Порядок выполнения лабораторной работы
- •Лабораторная работа 2 Основные определения. Систематизация выборки. Точечные оценки параметров распределения. Интервальные оценки.
- •Понятие статистической гипотезы о виде распределения
- •Порядок выполнения лабораторной работы
- •Ячейка Значение Ячейка Значение
- •5. Методические указания к выполнению контрольной работы Задание на контрольную работу
- •Методические указания к выполнению контрольной работы События и их вероятности
- •Случайные величины
- •Среднее квадратическое отклонение
- •Элементы математической статистики
- •6. Блок контроля освоения дисциплины
- •Вопросы для экзамена по курсу « Математика ч.2. Теория вероятностей и элементы математической статистики»
- •Продолжение таблицы в
- •Окончание таблицы в
- •Равномерно распределенные случайные числа
- •Содержание
- •Раздел 1. Случайные события………………………………………. 18
- •Раздел 2 . Случайные величины ..………………………… ….. 41
- •Раздел 3. Элементы математической статистики ............... . 64
- •4. Методические указания к выполнению лабораторных
- •5. Методические указания к выполнению контрольной
Элементы математической статистики
Перед тем как приступить к решению второй половины третьей задачи, следует изучить такие понятия, как: выборка, случайные числа; случайные числа распределенные по определенному закону; эмпирические (экспериментальные) ряд и функция распределения; оценки параметров распределения; метод жребия моделирования дискретной величины; критерии Пирсона оценки достоверности гипотезы; доверительные вероятности и интервалы. Следует разобрать примеры 5.10, 5.11.
Коротко рассмотрим, в чем заключается метод жребия моделирования дискретной случайной величины. Пусть событие Аможет произойти с вероятностьюр, и пусть очередное значение случайного числа –ri(случайное число – значение непрерывной случайной величины, равномерно распределенной в интервале [0,1]). Еслиri р, то оно принадлежит интервалу, поэтому считаем, что событиеАнаступило. Еслиriр, то считается, что событиеАне наступило.
Поскольку значения случайной величины ни что иное как случайные события, процедура моделирования дискретной случайной величины с заданным законом распределения аналогична моделированию случайного события.
Пусть дискретная случайная величина задана теоретическим рядом распределения.
|
х1 |
х2 |
х3 |
… |
хn |
pi |
р(х1) |
р(х2) |
р(х3) |
… |
р(хn) |
Присваиваем случайной величине значениех1, если значение случайного числаrip(х1), значениех2, еслиp(х1)<rip(х1)+p(х2), т.е. в общем случае, если, то случайной величинеприсваивается значениехm .
Пример 5.10. Дискретная случайная величина задана рядом распределения, приведенным в табл. 5.3.
Таблица 5.3
хi |
0 |
5 |
10 |
15 |
pi |
0.6189 |
0.0896 |
0.2547 |
0.0368 |
1. Построить модель этой случайной величины для партии из 25 приборов (методом жребия получить её 25 значений); найти экспериментальные ряд и функцию распределения, построить их графики.
2. Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
3. С помощью критерия Пирсона оценить соответствие экспериментального распределения теоретическому при уровнях значимости 1=0.01,2= 0.05.
Решение.1. Приступим к построению модели данной случайной величины. Этот процесс будем осуществлять методом жребия с помощью случайных чиселrj, т.е. значений случайной величины равномерно распределенной в интервале. Эти значения приведены в табл.Д Приложения. Моделируемые значения случайной величины обозначимZj (j = 1, 2, …, 25). Заметим, что каждое из них следует рассматривать как случайную величину.
Для рассматриваемой случайной величины правило моделирования заключается в том, чтобы определить какое значение будет принимать случайная величина в зависимости от попадания случайного числа в интервал.
примет значение:
0, если rj0.6189,
5, если 0.6189 rj<0.7085,
10, если 0.7085 rj < 0.9631,
15, если ri=0.9631.
Для удобства использования правило можно свести в табл. 5.4 или изобразить на рис. 5.7.
Таблица 5. 4
Интервал |
zj | |
1 |
0;0.619 |
0 |
2 |
0.619; 0.708 |
5 |
3 |
0.708; 0.963 |
10 |
4 |
0.963; 1.000 |
15 |
Z=0Z=5Z=10 Z=15
Рис. 5.7
Замечание.Поскольку в табл. 5.4 даны только 2 знака мантиссы, значения границ интервалов округлили до трех знаков после запятой.
Приступая к моделированию , возьмем первое число из табл. Д Приложения. Для того, чтобы начало было случайным, воспользуемся днем рождения решающего задачу. Допустим, он родился 9 марта. Поэтому начнем с 9-й строки 3-го столбца. Это число 67, следовательно, r1 = 0.67, оно принадлежит второму интервалу , поэтомух1 = 5. Таким образом, найдена стоимость ремонта первого прибора. Аналогично моделируются стоимости остальных приборов. Далее случайные числа будем выбирать двигаясь, например, по строкам влево или вправо. Второе число 43, т.е. r2 = 0.43, оно из интервала , поэтомух2=0. Сведем процесс нахождения реализаций в табл. 5.5.
Таблица 5.5
j |
rj |
Интервал |
zj |
j |
rj |
Интервал |
zj |
1 |
0.67 |
0.619;0.708 |
5 |
13 |
0.35 |
0;0.619 |
0 |
2 |
0.43 |
0;0.619 |
0 |
14 |
0.98 |
0.965;1.000 |
15 |
3 |
0.97 |
0.963;1.000 |
15 |
15 |
0.95 |
0.708;0.963 |
10 |
4 |
0.04 |
0;0.619 |
0 |
16 |
0.11 |
0;0.619 |
0 |
5 |
0.43 |
0;0.619 |
0 |
17 |
0.68 |
0.6194;0.708 |
5 |
6 |
0.62 |
0.619;0.708 |
5 |
18 |
0.77 |
0.708;0.963 |
10 |
7 |
0.76 |
0.705;0.963 |
10 |
19 |
0.12 |
0;0.619 |
0 |
8 |
0.59 |
0;0.619 |
0 |
20 |
0.17 |
0;0.619 |
0 |
9 |
0.63 |
0.619;0.708 |
5 |
21 |
0.17 |
0;0.619 |
0 |
10 |
0.57 |
0;0.619 |
0 |
22 |
0.68 |
0.619;0.708 |
5 |
11 |
0.33 |
0;0.619 |
0 |
23 |
0.33 |
0;0.619 |
0 |
12 |
0.21 |
0;0.619 |
0 |
24 |
0.73 |
0.708;0.963 |
10 |
|
|
|
|
25 |
0.79 |
0.708;0.963 |
10 |
Найдем экспериментальный ряд распределения, для чего подсчитаем частоты mi, равные числу приборов с данной стоимостью ремонта, т.е. числу появлений значений хj, вычислим их относительные частоты, т.е. оценки вероятностей р= , и занесем результаты в табл. 5.6.
Таблица 5.6
xi |
0 |
5 |
10 |
15 |
|
mi |
13 |
5 |
5 |
2 |
25 |
р |
0.52 |
0.20 |
0.20 |
0.08 |
1.00 |
Найдем экспериментальную функцию распределения F*(х)=:
F*(х)=.
Построим экспериментальные многоугольник распределения и функцию распределения (рис. 5.8). Для наглядности сравнения теоретической и экспериментальной кривых построим штриховыми линиями теоретические кривые.
Рис. 5.8
2. Найдем оценки числовых характеристик. Для вычисления оценок математического ожидания, дисперсии и среднего квадратического отклонения воспользуемся формулами:
, (5.8)
где k– число различных значений случайной величины;
(5.9)
или
. (5.10)
Поскольку формулы (5.9) и (5.10) дают смещенную оценку дисперсии, несмещенную оценку найдем по формуле
. (5.11)
Замечание.При больших значенияхnкоэффициенточень близок к единице, и можно считать оценку, вычисленную по формулам (5.9) или (5.10), оценкой несмещенной дисперсии.
Вычисления запишем в табл. 5.7.
Таблица 5.7
xi |
0 |
5 |
10 |
15 |
|
|
p |
0.52 |
0.20 |
0.20 |
0.08 |
1.00 |
|
|
0 |
1.00 |
2.00 |
1.20 |
4.20 |
= m* |
|
0 |
5.00 |
20.00 |
18.00 |
43.00 | |
|
|
|
|
|
17.64 | |
|
|
|
|
|
25.36 |
|
,
.
Сравнив полученные результаты с теоретическими (см. пример 5.5), видим, что экспериментальные характеристики отличаются от полученных из исходного ряда распределения. Для того чтобы получить более близкие результаты, следует существенно увеличить число реализаций случайной величины (например в два раза).
3. Проверим соответствие закона распределения полученной случайной величины F * (х) заданному закону распределенияF(x), используя критерий Пирсона.
Для этого определяется случайная величина
,
где k – число значений случайной величины;
mi – число появлений значений случайной величины;
pi – теоретическая вероятность значения;
n– объем моделируемой выборки (npi – ожидаемое число появлений значенияхiприnреализациях случайной величины). Величина2, называемая “хи-квадрат”, служит показателем того, насколько хорошо согласуются моделируемое и ожидаемое распределения.
В статистических расчетах число степеней свободы для дискретной случайной величины определяется как r = k – - 1, гдеk– число значений слу-чайной величины,– число параметров, которые были вычислены по результатам наблюдений.
Введем понятие «критическое значение» C = следующим образом:
если при проверяемой гипотезе вероятность события {χ2.>C} мала, Р(χ2.С) =, тоС называется «критическим значением», а– «уровнем значимости» критерияχ2. Уровень значимости является вероятностью отвергнуть правильную гипотезу. Выбор его определяется решаемой задачей. Как правило, полагают= 0.01 или= 0.05, т.е. в одном или пяти случаях из ста может быть отвергнута правильная гипотеза. Критические значения в зависимости от объема выборки и уровня значимости приведены в табл. С Приложения А.
В рассматриваемой задаче число k = 4, поэтому число степеней свободы
r = 4 - 1 = 3. По указанной таблице найдем критические числаС1(для1 = 0.01) иС2(для2 = 0.05): ими будутС1 = 11,3 иС2 = 7,8.
Найдем значение χ2. Все вычисления выполним в таблице 5.8 (n= 25, значениеnpiвычислим с точностью до одного знака после запятой).
Таблица 5.8
i |
хi |
mi |
npi |
mi- npi | |
1 |
0 |
13 |
15.5 |
-2.5 |
0.403 |
2 |
5 |
5 |
2.2 |
2.8 |
3.536 |
3 |
10 |
5 |
6.4 |
-1.4 |
0.306 |
4 |
15 |
2 |
0.9 |
1.1 |
1.344 |
|
- |
25 |
25.0 |
0.0 |
5.617=2 |
При уровне значимости 2 = 0.05 событие {χ2 >C2} не произошло (5.617 < 7.8); полученное распределение не противоречит предполагаемому.
При менее жестких требованиях, т.е. при = 0.01, событие {χ2>C1} тем более не произошло, и в этом случае можно считать, что гипотеза о распределении случайной величины с заданным законом распределения не противоречит смоделированным значениям случайной величины.
Пример 5.11. Из выборки в 15 элементов нормальной генеральной совокупности найдены оценки математического ожидания= -1.5 и несмещенной дисперсииs2= 1.21. Найти точность оценки математического ожидания и доверительный интервал, соответствующие доверительной вероятности= 0.98.
Определить эти же величины для выборки в 40 элементов, если оценки оказались такими же.
Решение.Истинные математическое ожиданиеmи дисперсия2данного нормального распределения не известны, поэтому воспользуемся формулами=t иI = (m*-;m* +) = ,
где – предельная ошибка,
I – доверительный интервал, соответствующий доверительной вероятности,
t – значения квантиля распределения Стьюдента для числа степеней свободыk = n-1. В данной задаче число степеней свободыk = 14, а доверительная вероятность = 0,98. По таблице А Приложения значение квантилей распределения Стьюдента находитсяt=2,62449. Тогда предельная ошибка=2.62449и доверительный интервалI0.98 =(-1.5-0.75;-1.5+0.75) =
=(-2.25; -0.75). Полученный результат позволяет утверждать, что с вероятностью 0.98 математическоеожидание рассматриваемой случайной величины принадлежит интервалу (-2.25;-0.75).
При выборке 40 элементов в связи с тем, что с увеличением числа степеней свободы распределение Стьюдента быстро приближается к нормальному, воспользуемся формулами z для вычисления предельной ошибки оценки математического ожидания иI = (m* -;m* +) =
= (m*-z; m*+z) для вычисления доверительного интервала.
В этих формулах z находится как корень уравнения Ф(z) = по таблице значений нормированной функции распределения нормального закона (табл. В Приложения).z называется квантилью порядка нормированного нормального распределения.
Вычислив == 0.99, входим с этим значением функции в табл.В Приложения и находим её аргумент, равный 2,327.
Таким образом, точность оценки =, а доверительный интервалI0.98 = (-1.5–0.405; -1.5+0.405) = (-1.905; -1.045).
Заметим, что увеличение объема выборки существенно сузило доверительный интервал.