- •Кафедра информатики и прикладной математики математика
- •Часть 2
- •Теория вероятностей и элементы математической статистики учебно - методический комплекс
- •Санкт-Петербург
- •Информация о дисциплине
- •1.1. Предисловие
- •Содержание дисциплины и виды учебной работы Объем дисциплины и виды учебной работы
- •Перечень видов практических занятий и контроля:
- •2. Рабочие учебные материалы
- •2.1. Рабочая программа (объем 150 часов) Введение
- •Раздел 1. Случайные события (50 часов)
- •Раздел 2. Случайные величины ( 60 часов)
- •Раздел 3. Элементы математической статистики (40 часов)
- •2.2. Тематический план занятий Тематический план дисциплины
- •Тематический план дисциплины для студентов очно-заочной формы обучения
- •Тематический план дисциплины для студентов заочной формы обучения
- •2.3. Структурно-логическая схема дисциплины Математика ч.2. Теория вероятностей и элементы математической статистики Теория
- •Раздел 1 Случайные события Раздел 3 Элементы математической Статистики
- •Раздел 2 Случайные величины
- •2.4. Временной график изучения дисциплины
- •2.5. Практический блок Практические занятия (очно-заочная форма обучения)
- •Практические занятия (заочная формы обучения)
- •Практические занятия (очная форма обучения)
- •Лабораторные работы (очно-заочная форма обучения)
- •Лабораторные работы (очная форма обучения)
- •Лабораторные работы (заочная форма обучения)
- •2.6. Бально-рейтинговая система
- •Информационные ресурсы дисциплины
- •Библиографический список Основной:
- •3.2. Опорный конспект по курсу “ Математика ч.2. Теория вероятностей и элементы математической статистики” введение
- •Раздел 1. Случайные события
- •1.1. Понятие случайного события
- •1.1.1. Сведения из теории множеств
- •1.1.2. Пространство элементарных событий
- •1.1.3. Классификация событий
- •1.1.4. Сумма и произведение событий
- •1.2. Вероятности случайных событий.
- •1.2.1. Относительная частота события, аксиомы теории вероятностей. Классическое определение вероятности
- •1.2.2. Геометрическое определение вероятности
- •Вычисление вероятности события через элементы комбинаторного анализа
- •1.2.4. Свойства вероятностей событий
- •1.2.5. Независимые события
- •1.2.6. Расчет вероятности безотказной работы прибора
- •Формулы для вычисления вероятности событий
- •1.3.1. Последовательность независимых испытаний (схема Бернулли)
- •1.3.2. Условная вероятность события
- •Вероятность произведения событий
- •1.3.4. Формула полной вероятности и формула Байеса
- •Раздел 2. Случайные величины
- •2.1. Описание случайных величин
- •2.1.1. Определение и способы задания случайной величины Одним из основных понятий теории вероятности является понятие случайной величины. Рассмотрим некоторые примеры случайных величин:
- •2.1.2. Дискретные случайные величины
- •Рассмотрим события Ai , содержащие все элементарные события , приводящие к значению XI:
- •Пусть pi обозначает вероятность события Ai :
- •2.1.3. Непрерывные случайные величины
- •2.1.4. Функция распределения и ее свойства
- •2.1.5. Плотность распределения вероятности и ее свойства
- •2.2. Числовые характеристики случайных величин
- •2.2.1. Математическое ожидание случайной величины
- •2.2.2. Дисперсия случайной величины
- •2.2.3. Нормальное распределение случайной величины
- •2.2.4. Биномиальное распределение
- •2.2.5. Распределение Пуассона
- •Раздел 3. Элементы математической статистики
- •3.1. Основные определения
- •Систематизация выборки
- •Гистограмма
- •3.3. Точечные оценки параметров распределения
- •Основные понятия
- •Точечные оценки математического ожидания и дисперсии
- •3.4. Интервальные- оценки
- •Понятие интервальной оценки
- •Построение интервальных оценок
- •Основные статистические распределения
- •Интервальные оценки математического ожидания нормального распределения
- •Интервальная оценка дисперсии нормального распределения
- •4. Методические указания к выполнению лабораторных работ
- •Выполнение лабораторных работ в ms Excel
- •Лабораторная работа 1 статистическое оценивание параметров распределения
- •Порядок выполнения лабораторной работы
- •Лабораторная работа 2 проверка гипотезы о законе распределения. Критерий пирсона
- •Понятие статистической гипотезы о виде распределения
- •Порядок выполнения лабораторной работы
- •Ячейка Значение Ячейка Значение
- •5. Методические указания к выполнению контрольной работы Задание на контрольную работу
- •Методические указания к выполнению контрольной работы События и их вероятности
- •Случайные величины
- •Среднее квадратическое отклонение
- •Элементы математической статистики
- •6. Блок контроля освоения дисциплины Репетиционные вопросы Тест № 1
- •Вопрос 10
- •Вопрос 14
- •Вопрос 15
- •Вопрос 16
- •Вопрос 17
- •Вопрос 18
- •Вопрос 19
- •Вопрос 20
- •Тест № 2
- •Вопрос 1
- •Вопрос 7
- •Вопросы для экзамена по курсу «Теория вероятностей и элементы математической статистики»
- •Глоссарий
- •Продолжение таблицы в
- •Окончание таблицы в
- •Равномерно распределенные случайные числа
- •Содержание
- •Раздел 1. Случайные события………………………………………. 18
- •Раздел 2 . Случайные величины ..………………………… ….. 42
- •Раздел 3. Элементы математической статистики ............... 65
- •4. Методические указания к выполнению лабораторных
- •5. Методические указания к выполнению контрольной
Элементы математической статистики
Перед тем как приступить к решению второй половины третьей задачи, следует изучить такие понятия, как: выборка, случайные числа; случайные числа распределенные по определенному закону; эмпирические (экспериментальные) ряд и функция распределения; оценки параметров распределения; метод жребия моделирования дискретной величины; критерии Пирсона оценки достоверности гипотезы; доверительные вероятности и интервалы. Следует разобрать примеры 5.10, 5.11.
Коротко рассмотрим, в чем заключается метод жребия моделирования дискретной случайной величины. Пусть событие А может произойти с вероятностью р, и пусть очередное значение случайного числа – ri (случайное число – значение непрерывной случайной величины, равномерно распределенной в интервале [0,1]). Если ri р , то оно принадлежит интервалу , поэтому считаем, что событие А наступило. Если riр, то считается, что событие А не наступило.
Поскольку значения случайной величины ни что иное как случайные события, процедура моделирования дискретной случайной величины с заданным законом распределения аналогична моделированию случайного события.
Пусть дискретная случайная величина задана теоретическим рядом распределения.
|
х1 |
х2 |
х3 |
… |
хn |
pi |
р(х1) |
р(х2) |
р(х3) |
… |
р(хn) |
Присваиваем случайной величине значение х1, если значение случайного числа rip(х1), значение х2, если p(х1)<rip(х1)+p(х2), т.е. в общем случае, если , то случайной величине присваивается значение хm .
Пример 5.10. Дискретная случайная величина задана рядом распределения, приведенным в табл. 5.3.
Таблица 5.3
хi |
0 |
5 |
10 |
15 |
pi |
0.6189 |
0.0896 |
0.2547 |
0.0368 |
1. Построить модель этой случайной величины для партии из 25 приборов (методом жребия получить её 25 значений); найти экспериментальные ряд и функцию распределения, построить их графики.
2. Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
3. С помощью критерия Пирсона оценить соответствие экспериментального распределения теоретическому при уровнях значимости 1=0.01, 2= 0.05.
Решение. 1. Приступим к построению модели данной случайной величины. Этот процесс будем осуществлять методом жребия с помощью случайных чисел rj, т.е. значений случайной величины равномерно распределенной в интервале . Эти значения приведены в табл.Д Приложения. Моделируемые значения случайной величины обозначим Zj (j = 1, 2, …, 25). Заметим, что каждое из них следует рассматривать как случайную величину.
Для рассматриваемой случайной величины правило моделирования заключается в том, чтобы определить какое значение будет принимать случайная величина в зависимости от попадания случайного числа в интервал.
примет значение:
0, если rj 0.6189,
5, если 0.6189 rj 0.7085,
10, если 0.7085 rj 0.9631,
15, если ri 0.9631.
Для удобства использования правило можно свести в табл. 5.4 или изобразить на рис. 5.7.
Таблица 5. 4
|
Интервал |
zj |
1 |
0;0.619 |
0 |
2 |
0.619; 0.708 |
5 |
3 |
0.708; 0.963 |
10 |
4 |
0.963; 1.000 |
15 |
Z=0 Z=5 Z=10 Z=15
Рис. 5.7
Замечание. Поскольку в табл. 5.4 даны только 2 знака мантиссы, значения границ интервалов округлили до трех знаков после запятой.
Приступая к моделированию , возьмем первое число из табл. Д Приложения. Для того, чтобы начало было случайным, воспользуемся днем рождения решающего задачу. Допустим, он родился 9 марта. Поэтому начнем с 9-й строки 3-го столбца. Это число 67, следовательно, r1 = 0.67, оно принадлежит второму интервалу , поэтому х1 = 5. Таким образом, найдена стоимость ремонта первого прибора. Аналогично моделируются стоимости остальных приборов. Далее случайные числа будем выбирать двигаясь, например, по строкам влево или вправо. Второе число 43, т.е. r2 = 0.43, оно из интервала , поэтому х2=0. Сведем процесс нахождения реализаций в табл. 5.5.
Таблица 5.5
j |
rj |
Интервал |
zj |
j |
rj |
Интервал |
zj |
1 |
0.67 |
0.619;0.708 |
5 |
13 |
0.35 |
0;0.619 |
0 |
2 |
0.43 |
0;0.619 |
0 |
14 |
0.98 |
0.965;1.000 |
15 |
3 |
0.97 |
0.963;1.000 |
15 |
15 |
0.95 |
0.708;0.963 |
10 |
4 |
0.04 |
0;0.619 |
0 |
16 |
0.11 |
0;0.619 |
0 |
5 |
0.43 |
0;0.619 |
0 |
17 |
0.68 |
0.6194;0.708 |
5 |
6 |
0.62 |
0.619;0.708 |
5 |
18 |
0.77 |
0.708;0.963 |
10 |
7 |
0.76 |
0.705;0.963 |
10 |
19 |
0.12 |
0;0.619 |
0 |
8 |
0.59 |
0;0.619 |
0 |
20 |
0.17 |
0;0.619 |
0 |
9 |
0.63 |
0.619;0.708 |
5 |
21 |
0.17 |
0;0.619 |
0 |
10 |
0.57 |
0;0.619 |
0 |
22 |
0.68 |
0.619;0.708 |
5 |
11 |
0.33 |
0;0.619 |
0 |
23 |
0.33 |
0;0.619 |
0 |
12 |
0.21 |
0;0.619 |
0 |
24 |
0.73 |
0.708;0.963 |
10 |
|
|
|
|
25 |
0.79 |
0.708;0.963 |
10 |
Найдем экспериментальный ряд распределения, для чего подсчитаем частоты mi, равные числу приборов с данной стоимостью ремонта, т.е. числу появлений значений хj, вычислим их относительные частоты, т.е. оценки вероятностей р = , и занесем результаты в табл. 5.6.
Таблица 5.6
xi |
0 |
5 |
10 |
15 |
|
mi |
13 |
5 |
5 |
2 |
25 |
р |
0.52 |
0.20 |
0.20 |
0.08 |
1.00 |
Найдем экспериментальную функцию распределения F*(х)= :
F*(х)= .
Построим экспериментальные многоугольник распределения и функцию распределения (рис. 5.8). Для наглядности сравнения теоретической и экспериментальной кривых построим штриховыми линиями теоретические кривые.
Рис. 5.8
2. Найдем оценки числовых характеристик. Для вычисления оценок математического ожидания, дисперсии и среднего квадратического отклонения воспользуемся формулами:
, (5.8)
где k – число различных значений случайной величины;
(5.9)
или
. (5.10)
Поскольку формулы (5.9) и (5.10) дают смещенную оценку дисперсии, несмещенную оценку найдем по формуле
. (5.11)
Замечание. При больших значениях n коэффициент очень близок к единице, и можно считать оценку, вычисленную по формулам (5.9) или (5.10), оценкой несмещенной дисперсии.
Вычисления запишем в табл. 5.7.
Таблица 5.7
xi |
0 |
5 |
10 |
15 |
|
|
p |
0.52 |
0.20 |
0.20 |
0.08 |
1.00 |
|
|
0 |
1.00 |
2.00 |
1.20 |
4.20 |
= m* |
|
0 |
5.00 |
20.00 |
18.00 |
43.00 |
|
|
|
|
|
|
17.64 |
|
|
|
|
|
|
25.36 |
|
,
.
Сравнив полученные результаты с теоретическими (см. пример 5.5), видим, что экспериментальные характеристики отличаются от полученных из исходного ряда распределения. Для того чтобы получить более близкие результаты, следует существенно увеличить число реализаций случайной величины (например в два раза).
3. Проверим соответствие закона распределения полученной случайной величины F * (х) заданному закону распределения F(x), используя критерий Пирсона.
Для этого определяется случайная величина
,
где k – число значений случайной величины;
mi – число появлений значений случайной величины ;
pi – теоретическая вероятность значения;
n – объем моделируемой выборки (npi – ожидаемое число появлений значения хi при n реализациях случайной величины). Величина 2, называемая “хи-квадрат”, служит показателем того, насколько хорошо согласуются моделируемое и ожидаемое распределения.
В статистических расчетах число степеней свободы для дискретной случайной величины определяется как r = k – - 1, где k – число значений слу-чайной величины, – число параметров, которые были вычислены по результатам наблюдений.
Введем понятие «критическое значение» C = следующим образом:
если при проверяемой гипотезе вероятность события {χ2.>C} мала, Р(χ2.С) = , то С называется «критическим значением», а – «уровнем значимости» критерия χ2. Уровень значимости является вероятностью отвергнуть правильную гипотезу. Выбор его определяется решаемой задачей. Как правило, полагают = 0.01 или = 0.05, т.е. в одном или пяти случаях из ста может быть отвергнута правильная гипотеза. Критические значения в зависимости от объема выборки и уровня значимости приведены в табл. С Приложения А.
В рассматриваемой задаче число k = 4, поэтому число степеней свободы
r = 4 - 1 = 3. По указанной таблице найдем критические числа С1 (для 1 = 0.01) и С2 (для 2 = 0.05): ими будут С1 = 11,3 и С2 = 7,8.
Найдем значение χ2. Все вычисления выполним в таблице 5.8 (n = 25, значение npi вычислим с точностью до одного знака после запятой).
Таблица 5.8
i |
хi |
mi |
npi |
mi- npi |
|
1 |
0 |
13 |
15.5 |
-2.5 |
0.403 |
2 |
5 |
5 |
2.2 |
2.8 |
3.536 |
3 |
10 |
5 |
6.4 |
-1.4 |
0.306 |
4 |
15 |
2 |
0.9 |
1.1 |
1.344 |
|
- |
25 |
25.0 |
0.0 |
5.617=2 |
При уровне значимости 2 = 0.05 событие {χ2 > C2} не произошло (5.617 < 7.8); полученное распределение не противоречит предполагаемому.
При менее жестких требованиях, т.е. при = 0.01, событие { χ2>C1} тем более не произошло, и в этом случае можно считать, что гипотеза о распределении случайной величины с заданным законом распределения не противоречит смоделированным значениям случайной величины.
Пример 5.11. Из выборки в 15 элементов нормальной генеральной совокупности найдены оценки математического ожидания = -1.5 и несмещенной дисперсии s2= 1.21. Найти точность оценки математического ожидания и доверительный интервал, соответствующие доверительной вероятности = 0.98.
Определить эти же величины для выборки в 40 элементов, если оценки оказались такими же.
Решение. Истинные математическое ожидание m и дисперсия 2 данного нормального распределения не известны, поэтому воспользуемся формулами = t и I = (m*- ; m* + ) = ,
где – предельная ошибка,
I – доверительный интервал, соответствующий доверительной вероятности ,
t – значения квантиля распределения Стьюдента для числа степеней свободы k = n-1.
В данной задаче число степеней свободы k = 14, а доверительная вероятность = 0,98. По таблице А Приложения значение квантилей распределения Стьюдента находится t=2,62449. Тогда предельная ошибка =2.62449 и доверительный интервал I0.98 =(-1.5-0.75;-1.5+0.75) =
=(-2.25; -0.75). Полученный результат позволяет утверждать, что с вероятностью 0.98 математическое ожидание рассматриваемой случайной величины принадлежит интервалу (-2.25;-0.75).
При выборке 40 элементов в связи с тем, что с увеличением числа степеней свободы распределение Стьюдента быстро приближается к нормальному, воспользуемся формулами z для вычисления предельной ошибки оценки математического ожидания и I = (m* - ; m* + ) =
= (m*- z; m*+ z) для вычисления доверительного интервала.
В этих формулах z находится как корень уравнения Ф(z) = по таблице значений нормированной функции распределения нормального закона (табл. В Приложения). z называется квантилью порядка нормированного нормального распределения.
Вычислив = = 0.99, входим с этим значением функции в табл.В Приложения и находим её аргумент, равный 2,327.
Таким образом, точность оценки = , а доверительный интервал I0.98 = (-1.5–0.405; -1.5+0.405) = (-1.905; -1.045).
Заметим, что увеличение объема выборки существенно сузило доверительный интервал.