- •Основы Теории вероятностей и математической статистики
- •Содержание
- •Программа курса
- •I. Элементы теории вероятностей
- •II. Элементы математической статистики
- •Рекомендуемая литература
- •Основные теоретические сведения Элементы теории вероятностей
- •1. Основные понятия. Классическое определение вероятности.
- •2. Вероятность суммы и произведения событий
- •3. Случайные величины и их характеристики
- •4. Законы распределения случайных величин
- •5. Локальная и интегральная формулы Муавра-Лапласа
- •Элементы математической статистики
- •1. Вариационные ряды и их характеристики
- •2. Выборочный метод. Статистические оценки параметров генеральной совокупности
- •3. Проверка статистических гипотез
- •4. Элементы корреляционного анализа
- •Образцы решения задач
- •I Элементы теории вероятностей
- •II Элементы математической статистики
- •Алгоритм выполнения задания
- •Алгоритм выполнения задания
- •Приложение 1. Таблица значений функции
- •Приложение 2. Таблица значений функции
- •Приложение 3. Критические точки распределения 2
- •Основы теории вероятностей и математической статистики
- •443086 Самара, Московское шоссе, 34
II Элементы математической статистики
7. Статистическая обработка результатов измерений
Дан протокол измерений случайной величины Х. Для этой случайной величины требуется:
а) составить интервальную таблицу частот,
б) получить точечные оценки для математического ожидания и дисперсии,
в) найти доверительный интервал для математического ожидания,
г) построить гистограмму,
д) аппроксимировать гистограмму теоретическим нормальным законом распределения,
е) с помощью критерия 2 проверить согласованность теоретического и статистического законов распределений.
Алгоритм выполнения задания
I Простейшая статистическая обработка:
1) Упорядочить вариационный ряд (т. е. записать все значения вариант в порядке возрастания) (таблица 7.1).
2) Найти размах: R = Xmax – Xmin .
3) Подобрать количество разрядов (интервалов):
k = 1+3,32lg(n) = 1,44ln(n)+1, где п – объем выборки (количество разрядов должно быть целым числом).
4) Построить интервальную таблицу частот. Для этого находят длину интервала x = R/k (если R не делится нацело на k, то можно слегка расширить диапазон значений случайной величины) и границы интервалов – точки 1, ..., k+1, где i = 1 + (i–1)x. Затем подсчитывают частоты mi – количество значений случайной величины (вариант), попавших на каждый интервал.
В таблицу 7.2 заносят границы
интервалов (i;
i+1),
среднее значение варианты на каждом
интервале
,
частоты mi
и относительные частоты (частости)
(столбцы 1-4).
II Вычисление числовых характеристик (точечных выборочных оценок):
1) Вычислить выборочное среднее – оценку для математического ожидания.
2) Вычислить выборочную дисперсию – оценку для дисперсии.
3) Вычислить стандартное отклонение – оценку для среднего квадратичного отклонения.
III Построение доверительного интервала для математического ожидания а:
1) Зная доверительную
вероятность (надежность) ,
найти по таблице значений функции
Лапласа
(см. Приложение 1) соответствующее
значение t, для
которого
.
2) Вычислить предельную
ошибку
,
где s – стандартное отклонение, п – объем выборки.
3) Записать доверительный интервал для математического ожидания
.
IV Построение гистограммы
Для построения гистограммы
относительных частот вычисляют высоты
столбцов гистограммы
(удобно добавить их в таблицу 7.2 –
столбец 5), на оси абсцисс отмечают точки
1, ..., k+1
и над каждым интервалом (i;
i+1)
строят прямоугольник высотой hi.
В результате получается ступенчатая
фигура, верхний контур которой
приблизительно соответствует графику
плотности распределения исследуемой
случайной величины (рис.1).
V Аппроксимация гистограммы нормальным законом распределения:
1) Составить таблицу
значений теоретического нормального
закона с параметрами а =
,
= s:
.
Для удобства расчетов можно
а) найти значения
;
б) по таблице Приложения 1 из
[1] найти
;
в) вычислить
(таблица 7.3).
2) Построить график теоретической кривой
На рис. 1 отметить точки с
координатами (
;
) и соединить их плавной
кривой.
3) Сделать вывод о согласованности статистического распределения (гистограммы) с теоретическим нормальным законом распределения, проанализировав полученный рисунок.
VI Проверка согласованности статистического и теоретического распределений:
1) Вычислить статистику 2 : ,
где
;
– функция Лапласа (см. Приложение 1).
2) Определить число степеней свободы r = k – 3.
3) Анализ результатов. Выбрав уровень значимости (например, = 0,05), в таблице критических точек распределения 2 (Приложение 3), найти 2кр.
Если 2 < 2кр, то можно принять гипотезу о нормальном распределении, т. е. полученный теоретический закон хорошо аппроксимирует статистическое распределение.
Если 2 > 2кр, то гипотеза о выборе теоретического закона отвергается, т.е. полученный закон не согласуется с экспериментальными данными.
Пример 7
Записав исходные данные в порядке возрастания, получили следующий упорядоченный вариационный ряд (таблица 7.1):
Таблица 7.1. Упорядоченный вариационный ряд
95 |
112 |
118 |
122 |
127 |
97 |
113 |
119 |
123 |
127 |
98 |
113 |
119 |
123 |
128 |
101 |
114 |
119 |
123 |
128 |
102 |
114 |
119 |
123 |
128 |
102 |
114 |
120 |
123 |
129 |
103 |
115 |
120 |
124 |
129 |
105 |
115 |
120 |
124 |
130 |
105 |
115 |
120 |
124 |
131 |
106 |
115 |
120 |
125 |
131 |
107 |
115 |
121 |
125 |
131 |
107 |
116 |
121 |
125 |
132 |
108 |
116 |
121 |
125 |
132 |
109 |
116 |
121 |
125 |
132 |
109 |
117 |
121 |
126 |
133 |
109 |
117 |
121 |
126 |
134 |
110 |
117 |
121 |
126 |
134 |
111 |
117 |
122 |
126 |
135 |
111 |
117 |
122 |
127 |
137 |
111 |
118 |
122 |
127 |
141 |
Найдем размах R = 141 – 95 = 46.
Так как объем выборки п = 100, а количество разрядов должно быть целым числом, то удобно брать k = 7 или k = 8. Расширим диапазон значений вариант до промежутка (94; 142) и выберем k = 8.
Тогда длина интервала x = (142 – 94)/8 = 6.
Построим интервальную таблицу частот (таблица 7.2, столбцы 1-4). В ту же таблицу занесем вычисленные значения высот столбцов гистограммы.
Таблица 7.2. Интервальная таблица частот
Границы интервалов (i , i+1) |
Среднее значение
|
Частота
mi |
Относительная частота wi |
Высота столбца гистограммы hi |
94 – 100 |
97 |
3 |
0,03 |
0,0050 |
100 – 106 |
103 |
7 |
0,07 |
0,0117 |
106 – 112 |
109 |
11 |
0,11 |
0,0183 |
112 – 118 |
115 |
20 |
0,20 |
0,0333 |
118 – 124 |
121 |
28 |
0,28 |
0,0467 |
124 – 130 |
127 |
19 |
0,19 |
0,0317 |
130 – 136 |
133 |
10 |
0,10 |
0,0167 |
136 – 142 |
139 |
2 |
0,02 |
0,0033 |
Вычислим числовые характеристики.
Выборочное среднее:
=
= (97.3+103.7+109.11+115.20+121.28+127.19+133.10+139.2)/100 = 119,2.
Выборочная дисперсия:
=
= ((97 – 119,2)2.3 + (103 – 119,2)2.7 + (109 – 119,2)2.11 +
+ (115 – 119,2)2.20 + (121 – 119,2)2.28 + (127 – 119,2)2.19 +
+ (133 – 119,2)2.10 + (139 – 119,2)2.2)/99 = 87,48.
Стандартное отклонение:
= 9,35.
Найдем доверительный интервал для математического ожидания.
Пусть доверительная вероятность
= 0,95. Тогда
по таблице Приложения находим, что если
Ф(t) = 0,475 , то
t = 1,96. Вычислим
предельную ошибку
= 1,96.9,35/10 = 1,833.
Таким образом, границы доверительного интервала 119,2 – 1,833 и 119,2 + 1,833, т.е. доверительный интервал для математического ожидания имеет вид (117,367; 121,033).
Составим таблицу значений теоретического нормального закона
(таблица 7.3).
Таблица 7.3. Теоретическая плотность распределения вероятностей
Среднее значение
|
|
|
|
97 |
–2,37 |
0,0241 |
0,0026 |
103 |
–1,73 |
0,0893 |
0,0096 |
109 |
–1,09 |
0,2203 |
0,0236 |
115 |
–0,45 |
0,3605 |
0,0386 |
121 |
0,19 |
0,3918 |
0,0419 |
127 |
0,83 |
0,2827 |
0,0302 |
133 |
1,48 |
0,1334 |
0,0143 |
139 |
2,12 |
0,0422 |
0,0045 |
Построим гистограмму и кривую теоретического нормального распределения (рис. 1).
Из рисунка видно, что теоретическая нормальная кривая хорошо аппроксимирует статистический закон распределения.
Р
ис.
1. Гистограмма и теоретическая кривая
Проверим согласованность статистического и выбранного теоретического распределения с помощью критерия 2 .
Вычислим значения pi (таблица 7.4).
Таблица 7.4. Расчет критерия 2
Границы интервалов (i , i+1) |
Частота
mi |
|
|
94 – 100 |
3 |
Ф(-2,05) – Ф(-2,69) = 0,0166 |
1,082 |
100 – 106 |
7 |
Ф(-1,41) – Ф(-2,05) = 0,0592 |
0,197 |
106 – 112 |
11 |
Ф(-0,77) – Ф(-1,41) = 0,1413 |
0,693 |
112 – 118 |
20 |
Ф(-0,13) – Ф(-0,77) = 0,2284 |
0,353 |
118 – 124 |
28 |
Ф(0,51) – Ф(-0,13) = 0,2470 |
0,441 |
124 – 130 |
19 |
Ф(1,155) – Ф(0,51) = 0,180 |
0,055 |
130 – 136 |
10 |
Ф(1,797) – Ф(1,155) = 0,088 |
0,164 |
136 – 142 |
2 |
Ф(2,44) – Ф(1,797) = 0,0286 |
0,259 |
|
|
|
= 3,244 |
Вычислим статистику:
= 3,244.
Подсчитаем число степеней свободы: r = 8 – 3 = 5.
Выбрав уровень значимости = 0,05, в таблице (Приложение 3) найдем 2кр(5; 0,05) = 11,1. Так как 2 = 3,244 < 11,1 = 2кр, то можно принять гипотезу о нормальном распределении, т. е. в данном случае полученный теоретический закон хорошо аппроксимирует статистическое распределение.
8. Оценка корреляционной зависимости между наблюдаемыми величинами
По данной корреляционной таблице (таблица 8.1.) найти коэффициент корреляции и выборочное уравнение прямой регрессии Y на X.
