- •Содержание
- •Раздел 2. Математическая статистика. 100
- •Предисловие
- •Раздел 1. Теория вероятностей
- •Случайные события. Вероятность
- •2. Геометрический способ задания вероятности.
- •3. Дискретный способ задания вероятности.
- •4. Статистический способ задания вероятности.
- •Свойства вероятностей. Условная вероятность. Независимость событий. Теоремы сложения и умножения вероятностей
- •Формула полной вероятности. Формулы Байеса (теорема гипотез)
- •Случайные величины
- •Дискретные случайные величины
- •Законы распределения дискретных случайных величин
- •Непрерывные случайны величины.
- •Законы распределения непрерывной случайной величины
- •Предельные теоремы и закон больших чисел
- •Двумерные случайные величины
- •Случайные функции. Цепи Маркова
- •Раздел 2. Математическая статистика.
- •2.1. Выборочные статистики
- •2.2. Статистическое оценивание.
- •Для дискретной случайной величины
- •Если и при , то - состоятельная оценка параметра .
- •2.3 Статистические решения
- •2.3.1. Статистическая гипотеза. Проверка гипотезы о среднем значении при известной и неизвестной дисперсиях.
- •2.3.2. Проверка гипотез о дисперсии.
- •2.3.3. Проверка гипотезы о равенстве значений двух средних из нормально распределенных генеральных совокупностей
- •2.4. Критерии согласия.
- •Литература
- •Ответы, указания и решения
- •Теория вероятностей
- •Случайные события. Вероятность
- •Свойства вероятностей. Условная вероятность. Независимость событий. Теоремы сложения и умножения вероятностей
- •Формула полной вероятности. Формулы Байеса (теорема гипотез)
- •Случайные величины Дискретные случайные величины
- •Закон распределения дискретных случайных величин
- •Непрерывные случайные величины
- •Законы распределения непрерывной случайной величины
- •Предельные теоремы и законы больших чисел
Раздел 2. Математическая статистика.
В основе законов распределения случайных величин, событий, основных теорем теории вероятностей лежит эксперимент, т.е. каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные. Поэтому математическая статистика занимается разработкой методов сбора, описания и анализа экспериментальных данных, получаемых в результате наблюдений массовых случайных явлений. При этом можно выделить три этапа, присутствующие в любом приложении статистических методов:
сбор данных;
обработка данных;
статистические выводы - прогнозы и решения.
2.1. Выборочные статистики
Статистические
распределения.
Исходным материалом математического
исследования является статистическая
совокупность, которая образует выборку.
Если X
- изучаемая случайная величина, то
возможное множество значений случайной
величины
составляют генеральную
совокупность,
а наблюдаемые значения случайной
величины
– выборку.
Распределение выборки, задаваемое интервальным статистическим рядом (табл. 1.1) или таблицей относительных частот (табл. 1.2), называется эмпирическим распределением случайной величины X.
Таблица 1.1
Интервалы
наблюденных значений непрерывной
случайной величины
|
|
|
|
… |
|
Относительные частоты
|
|
|
|
… |
|
Интервальный статистический ряд распределения представленный графически, называется гистограммой (рис. 1.1):
Рис. 1.1
Площадь каждого прямоугольника равна соответствующей относительной частоте. А площадь всей гистограммы равна единице.
Таблица 1.2
Наблюденные значения дискретной случайной величины, xi |
x1 |
x2 |
x3 |
… |
xk |
Относительные частоты, |
|
|
|
… |
|
|
Ломаная
линия с вершинами в точках
или точках
,
называется частотным
многоугольником
(полигоном частот) или полигоном
относительных частот (рис.1.2):
Рис 1.2
Эмпирической
функцией распределения
называется относительная частота
события {X<
}
в данной выборке значений случайной
величины X,
т.е.
где
mx
– число значений xi,
меньших x,
n
– объем выборки. Значения эмпирической
функции распределения принадлежат
отрезку
,
т.е.
.
Эмпирическая функция распределения удовлетворяет следующим свойствам:
– неубывающая
функция;– кусочно-постоянная непрерывная слева функция;
Если x<x1 то
и если x>xk
, то
.
Эмпирическая
функция распределения
сходится по вероятности к функции
распределения
генеральной совокупности, т.е.
,
где
.
Основные числовые характеристики эмпирического распределения. Среднее арифметическое:
(1.1)
Медиана:
,
или
где
средняя
варианта, если число вариант нечетно;
средние
варианты, если число вариант четно, или
,
,
(1.2)
где
– нижняя граница интервала, в котором
лежит медиана; l
– длина интервала;
сумма
частот во всех интервалах, предшествующих
медианному;
- частота медианного интервала.
Мода:
,
где варианта xk
имеет наибольшую частоту;
или
,
(1.3)
где
- нижняя граница интервала, в котором
лежит мода; l
–длина интервала;
- относительные частоты, соответствующие
модальному, предшествующему и последующему
интервалам.
Статистическая дисперсия:
;
(1.4)
;
Среднее статистическое квадратическое отклонение (стандартная ошибка):
;
.
(1.5)
Вариационный
размах:
.
(1.6)
Среднее абсолютное (линейное) отклонение:
.
(1.7)
Коэффициенты вариации:
.
(1.8)
Начальный момент k-го порядка:
.
(1.9)
Центральный момент k-го порядка:
.
(1,10)
Асимметрия:
.
(1.11)
Эксцесс:
.
(1.12)
Задачи
1.1. Для статистической совокупности данных, характеризующих затраты на 1 денежную единицу продукции (работ, услуг) за год по 100 предприятиям г. Минска:
61,55 |
61,59 |
62,09 |
63,08 |
63,97 |
64,74 |
65,07 |
67,12 |
68,10 |
69,38 |
70,21 |
70,21 |
70,36 |
71,25 |
71,86 |
72,00 |
72,39 |
72,41 |
72,46 |
72,50 |
72,80 |
72,84 |
73,44 |
74,93 |
75,46 |
75,65 |
77,13 |
77,37 |
77,64 |
77,86 |
90,93 |
78,03 |
78,28 |
78,74 |
78,97 |
79,07 |
79,10 |
79,34 |
79,34 |
19,39 |
79,40 |
79,49 |
79,70 |
80,02 |
80,26 |
80,56 |
80,65 |
80,69 |
81,13 |
81,32 |
81,40 |
81,54 |
81,85 |
82,27 |
82,71 |
82,74 |
82,78 |
83,03 |
83,05 |
83,59 |
83,68 |
83,74 |
83,78 |
83,96 |
84,98 |
85,18 |
85,32 |
85,64 |
85,71 |
85,64 |
86,01 |
86,03 |
86,11 |
86,11 |
86,48 |
86,94 |
86,98 |
87,38 |
87,47 |
87,59 |
87,89 |
88,03 |
88,04 |
88,11 |
88,24 |
88,89 |
90,34 |
90,40 |
90,58 |
90,73 |
90,76 |
92,51 |
92,72 |
92,94 |
94,58 |
95,06 |
95,73 |
96,11 |
96,34 |
96,55 |
|
|
|
|
|
построить эмпирическое распределение, эмпирическую функцию распределения. Вычислить числовые характеристики.
Решение. Составим ряд распределения, характеризующий затраты в денежных единицах на 1 ден. ед. продукции (работ, услуг) по 100 предприятиям.
Каждое индивидуальное измерение затрат представлено отдельно, поэтому эти данные называют несгруппированными дискретными данными. Следовательно, исследуемая случайная величина X является дискретной случайной величиной. Дискретные данные также могут быть подвергнуты группировке. В результате группировки данных облегчается их интерпретация, хотя при этом частично теряется точность.
Определим длину интервала по формуле:
.
Вычислим частоты mi и относительные частоты wi вариант, принадлежащих каждому интервалу. Результат сведем в таблицу 1.3
Таблица 1.3
Затраты на 1 ден. ед. продукции, ден. ед. |
Количество предприятий, mi |
Относительная частота, wi |
Накопленная
частота,
|
[61,55-66,55) |
7 |
0,07 |
0,07 |
[66,55-71,55) |
7 |
0,07 |
0,14 |
[71,55-76,55) |
12 |
0,12 |
0,26 |
[76,55-81,55) |
26 |
0,26 |
0,52 |
[81,55-86,55) |
23 |
0,23 |
0,75 |
[86,55-91,55) |
16 |
0,16 |
0,91 |
[91,55-96,55] |
9 |
0,09 |
1,00 |
Затраты по предприятиям, составляющие интервальный ряд распределения, представим графически. Построим гистограмму и полигон (рис 1.3, 1.4 соответственно).
Рис. 1.3
Рис. 1.4
Используя накопленные относительные частоты, составляем кумулянту (эмпирическую функцию распределения):
График эмпирической функции распределения показан на рис 1.5.
Рис 1.5
Вычислим числовые характеристики затрат (в денежных единицах) на 1 ден. ед. продукции (работ, услуг) по данным 100 предприятий г. Минска.
Среднее арифметическое для несгруппированных данных
Если
данные представлены в виде интервального
статистического ряда распределения,
то среднюю точку
каждого интервала выбирают в качестве
представителя всех вариант, входящих
в состав интервала. Значение средней
точки каждого интервала умножают на
частоту интервала, суммируют эти
произведения и делят на объем выборки:
Как уже отмечалось, группировка всегда сопровождается потерей точности, что и подтверждает вычисление среднего арифметического. Поэтому остальные числовые характеристики вычислим по не сгруппированным данным.
Не сгруппированные данные образуют дискретный вариационный ряд, содержащий четное число вариант, поэтому медиана равна полусумме средних вариант:
.
Такие исходные не сгруппированные данные не имеют моды.
Но если рассмотреть интервальный статистический ряд распределения (таблица 1.3), то модальным интервалом будет интервал (76,55;81,55), имеющий наибольшую частоту и тогда моду вычислим по формуле (1.3):
.
С теоретической точки зрения наиболее подходящей мерой колеблемости ряда распределения служит статистическая дисперсия:
.
Среднее статистическое квадратичное отклонение - величина абсолютная, она выражается в тех же единицах, что и сами затраты:
Пределы изменения затрат характеризует размах:
R=96,55-61,55=35,0.
Вычисляем безразмерные показатели вариации - коэффициенты вариации:
;
;
.
Значение коэффициента вариации Vs показывает, что совокупность исходных данных однородна.
Выяснение общего характера распределения предполагает вычисление показателей асимметрии и эксцесса. Асимметрия:
отрицательна, следовательно, распределение характеризуется незначительной левосторонней асимметрией.
Эксцесс:
отрицательный, следовательно, распределение затрат более плосковершинное по сравнению с нормальным.
Ошибки асимметрии и эксцесса SAs=0,23774, SEx=0,45475 удовлетворяют неравенствам:
,
откуда следует, что асимметрия и эксцесс незначительны в распределении затрат.
В задачах 1.2 – 1.4 построить эмпирическое распределение, его графическое представление, эмпирическую функцию распределения и вычислить числовые характеристики выборки: среднее арифметическое, моду, медиану, статистическую дисперсию, среднее статистическое квадратическое отклонение, вариационный размах, среднее абсолютное (линейное) отклонение, коэффициенты вариации, асимметрию и эксцесс.
1.2. Число построенных квартир (тысяч) различными организациями приводятся в таблице 1.4
Таблица 1.4
Государственными предприятиями и организациями |
Жилищно-строительными кооперативами |
Индивидуальными застройщиками |
Колхозами |
Кооперативными, арендными, общественными организациями
и другими организациями |
50,4 |
8,0 |
28,2 |
2,9 |
0,2 |
52,5 |
8,2 |
21,9 |
2,9 |
0,4 |
51,3 |
9,1 |
21,6 |
3,3 |
0,4 |
58,8 |
8,5 |
21,8 |
3,5 |
0,4 |
53,2 |
7,5 |
20,4 |
4,2 |
0,3 |
53,7 |
6,4 |
18,7 |
5,0 |
0,4 |
50,1 |
6,5 |
15,2 |
4,1 |
0,3 |
53,7 |
6,5 |
13,1 |
4,6 |
0,5 |
54,8 |
7,0 |
11,6 |
5,0 |
0,3 |
54,6 |
6,1 |
11,0 |
6,0 |
0,2 |
58,3 |
6,5 |
8,9 |
6,2 |
0,5 |
59,7 |
8,1 |
8,0 |
7,0 |
0,3 |
59,4 |
7,4 |
7,6 |
7,5 |
0,2 |
59,4 |
9,6 |
6,9 |
7,3 |
0,3 |
61,0 |
10,2 |
6,4 |
8,9 |
0,3 |
61,1 |
11,1 |
5,8 |
9,9 |
0,6 |
61,7 |
11,8 |
6,3 |
11,8 |
0,5 |
71,0 |
13,8 |
5,7 |
8,9 |
0,3 |
67,5 |
11,4 |
5,7 |
7,9 |
0,2 |
69,7 |
12,0 |
5,9 |
6,5 |
0,3 |
63,3 |
10,8 |
8,3 |
5,4 |
1,3 |
66,2 |
7,3 |
4,4 |
3,9 |
2,1 |
52,7 |
7,0 |
3,9 |
3,3 |
4,1 |
36,0 |
11,2 |
4,2 |
3,0 |
4,7 |
30,8 |
8,3 |
5,3 |
1,6 |
4,9 |
15,8 |
3,5 |
4,7 |
0,9 |
2,4 |
13,4 |
15,1 |
5,9 |
0,6 |
3,2 |
1.3. Поезда метро идут строго по расписанию с интервалом в 5 минут. В результате измерения получена выборка времени (в секундах) ожидания поезда для 15 студентов, каждый из которых выходит на перрон в случайный момент времени:
38; 61; 60; 42; 52; 51; 34; 65; 72; 80; 92; 90; 104; 102; 79.
1.4. Число автомобилей, подъезжающих на заправку в течении часа в различное время суток характеризуется выборкой:
6-7; 7-8; 8-9; 9-10; 10-11; 11-12; 12-13; 13-14; 14-15; 15-16 ; 16-17; 17-18;
12 20 40 37 28 15 21 17 18 11 8 25
18-19; 19-20; 20-21; 21-22; 22-23.
30 20 11 10 10
В задачах 1.5-1.14 построить интервальный статистический ряд распределения (если он не задан), гистограмму, полигон относительных частот, эмпирическую функцию распределения, вычислить числовые характеристики выборки: среднее арифметическое, медиану, моду, статистическую дисперсию и среднее квадратическое отклонение, вариационный размах, среднее абсолютное (линейное) отклонение, коэффициенты вариации.
1.5. Интервальный ряд распределения:
Таблица 1.5
Границы интервалов,
|
10-20 |
20-30 |
30-40 |
40-50 |
50-60 |
60-70 |
70-80 |
Частоты, mi |
10 |
20 |
70 |
180 |
120 |
80 |
20 |
1.6. Интервальный ряд распределения:
Таблица 1.6
Границы интервалов,
|
18-20 |
20-22 |
22-24 |
24-26 |
26-28 |
28-30 |
30-32 |
32-34 |
Частоты, mi |
10 |
20 |
70 |
180 |
120 |
80 |
20 |
50 |
1.7. Результаты измерения емкости затвор – сток у 96 полевых транзисторов:
1,9 |
3,1 |
1,3 |
0,7 |
3,2 |
1,1 |
2,9 |
2,7 |
2,7 |
4,0 |
3,1 |
3,9 |
1,7 |
3,2 |
0,9 |
0,8 |
3,1 |
1,2 |
2,6 |
1,9 |
2,3 |
3,2 |
1,3 |
2,8 |
4,1 |
1,3 |
2,4 |
4,5 |
2,5 |
0,9 |
1,4 |
1,6 |
2,2 |
3,1 |
2,1 |
2,5 |
1,5 |
1,1 |
2,3 |
4,3 |
2,1 |
0,7 |
1,2 |
1,5 |
1,8 |
2,9 |
2,5 |
2,1 |
0,8 |
0,9 |
1,7 |
4,1 |
4,3 |
2,6 |
0,9 |
0,8 |
1,2 |
2,1 |
1,8 |
3,1 |
3,2 |
2,9 |
1,1 |
3,2 |
4,5 |
2,1 |
3,1 |
5,1 |
1,1 |
1,9 |
1,3 |
2,6 |
0,9 |
3,1 |
0,9 |
3,1 |
3,3 |
2,8 |
2,5 |
4,0 |
4,3 |
1,1 |
2,5 |
3,5 |
2,1 |
3,8 |
4,6 |
3,8 |
2,3 |
3,9 |
2,4 |
4,1 |
4,2 |
0,9 |
3,7 |
3,9 |
1.8. Распределение скорости автомобилей на одном из участков автомагистрали:
64 |
66 |
90 |
101 |
10 |
120 |
102 |
90 |
101 |
100 |
65 |
67 |
91 |
104 |
101 |
117 |
106 |
95 |
100 |
95 |
63 |
69 |
89 |
103 |
109 |
118 |
107 |
94 |
110 |
97 |
61 |
72 |
89 |
102 |
111 |
119 |
110 |
93 |
100 |
99 |
62 |
77 |
94 |
102 |
115 |
120 |
109 |
95 |
100 |
99 |
67 |
81 |
94 |
103 |
117 |
120 |
110 |
100 |
90 |
105 |
71 |
83 |
95 |
110 |
119 |
115 |
111 |
100 |
90 |
107 |
72 |
91 |
99 |
111 |
120 |
116 |
112 |
100 |
90 |
101 |
67 |
94 |
99 |
115 |
120 |
117 |
105 |
100 |
105 |
104 |
65 |
95 |
100 |
120 |
117 |
118 |
107 |
100 |
107 |
105 |
1.9. Распределение общего времени (в минутах) на ожидание и обслуживание автомобилей на заправочной станции:
8 |
7 |
7 |
8 |
10 |
11 |
9 |
12 |
10 |
12 |
15 |
15 |
14 |
16 |
20 |
19 |
17 |
16 |
20 |
15 |
8 |
6 |
7 |
9 |
10 |
11 |
9 |
10 |
13 |
14 |
15 |
14 |
15 |
20 |
18 |
19 |
16 |
18 |
19 |
16 |
7 |
6 |
8 |
9 |
10 |
11 |
9 |
12 |
13 |
14 |
15 |
13 |
15 |
19 |
18 |
18 |
17 |
17 |
20 |
15 |
7 |
6 |
8 |
10 |
10 |
10 |
12 |
12 |
13 |
14 |
15 |
14 |
15 |
19 |
18 |
17 |
18 |
17 |
20 |
15 |
6 |
6 |
7 |
10 |
10 |
9 |
12 |
12 |
12 |
15 |
15 |
14 |
15 |
19 |
18 |
17 |
19 |
17 |
19 |
15 |
1.10. Как изменятся числовые характеристики выборки, если результаты наблюдения увеличить или уменьшить одновременно в m раз?
1.11. Распределение времени наработки на отказ приборов некоторого типа:
1,31 |
0,48 |
0,76 |
1,71 |
1,20 |
0,54 |
0,20 |
0,67 |
0,62 |
0,15 |
0,05 |
0,78 |
0,24 |
0,29 |
1,47 |
1,11 |
0,67 |
0,99 |
1,02 |
0,51 |
0,65 |
1,56 |
0,16 |
0,49 |
1.12. Производство кожаной обуви в Республике Беларусь (в млн. пар):
Таблица 1.7
t, годы |
Yi , млн. пар |
t, годы |
Yi , млн. пар |
1977 |
42 |
1989 |
45,3 |
1978 |
41,8 |
1990 |
46,8 |
1979 |
41,2 |
1991 |
45,3 |
1980 |
41,5 |
1992 |
37,2 |
1981 |
41,3 |
1993 |
33,4 |
1982 |
42 |
1994 |
26,4 |
1983 |
42,2 |
1995 |
13 |
1984 |
43,1 |
1996 |
11,4 |
1985 |
44,2 |
1997 |
15,6 |
1986 |
44,8 |
1998 |
16,2 |
1987 |
45,3 |
1999 |
16,5 |
1988 |
46,9 |
|
|
1.13. Динамический ряд, характеризующий изменение значения денежных агрегатов (в условных денежных единицах):
Таблица 1.8
год |
Y |
Год |
Y |
01.01.97 |
5109,5 |
01.08.98 |
26459,0 |
01.02.97 |
5261,7 |
01.09.98 |
27803,3 |
01.03.97 |
7553,0 |
01.10.98 |
28563,3 |
01.04.97 |
9223,8 |
01.11.98 |
26603,3 |
01.05.97 |
10031,4 |
01.12.98 |
29837,7 |
01.06.97 |
12360,4 |
01.01.99 |
31483,2 |
01.07.97 |
13032,5 |
01.02.99 |
39381,0 |
01.08.97 |
12676,1 |
01.03.99 |
39995,3 |
01.09.97 |
12981,8 |
01.04.99 |
40343,7 |
01.10.97 |
13351,2 |
01.05.99 |
47337,7 |
01.11.97 |
12054,2 |
01.06.99 |
48812,8 |
01.12.97 |
131,86 |
01.07.99 |
60232,4 |
01.01.98 |
14454.8 |
01.08.99 |
65328,2 |
01.02.98 |
15610,4 |
01.09.99 |
67134,1 |
01.03.98 |
16883,2 |
01.10.99 |
72487,2 |
01.04.98 |
19887,1 |
01.11.99 |
66044,1 |
01.05.98 |
20484.1 |
01.12.99 |
73073,0 |
01.06.98 |
24988,2 |
01.01.00 |
74311,1 |
01.07.98 |
27196,9 |
|
|
1.14. Динамические ряды, характеризующие урожайность зерна (таблица 1.9) и валовой сбор зерна (таблица 1.10) в Республике Беларусь:
Таблица 1.9
Год |
Урожайность зерна в РБ (центнеров с 1 гектара) |
Год |
Урожайность зерна в РБ (центнеров с 1 гектара) |
1990 |
26,6 |
1997 |
23,6 |
1991 |
24,2 |
1998 |
18,3 |
1992 |
26,8 |
1999 |
14,5 |
1993 |
27,7 |
2000 |
19,1 |
1994 |
22,4 |
2001 |
19,9 |
1995 |
20,4 |
2002 |
24,7 |
1996 |
21,7 |
2003 |
24,2 |
Таблица 1.10
год |
Валовой сбор зерна в РБ (тыс. тонн) |
Год |
Валовой сбор зерна в РБ (тыс. тонн) |
1990 |
7035 |
1997 |
6420 |
1991 |
6295 |
1998 |
4830 |
1992 |
7230 |
1999 |
3645 |
1993 |
7508 |
2000 |
4856 |
1994 |
6097 |
2001 |
5153 |
1995 |
5502 |
2002 |
5990 |
1996 |
5792 |
2003 |
5448,8 |
