Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 792

.pdf
Скачиваний:
2
Добавлен:
30.04.2022
Размер:
586.08 Кб
Скачать

ФГБОУ ВПО «Воронежский государственный технический университет»

Кафедра высшей математики и физико-математического моделирования

307 - 2011

ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ СТАТИСТИКУ

МЕТОДИЧЕСКИЕ УКАЗАНИЯ для организации самостоятельной работы

по курсу "Высшая математика" для студентов специальностей 280103 "Защитавчрезвычайныхситуациях",

280101 "Безопасностьжизнедеятельностивтехносфере" и направления 280200 "Защитаокружающейсреды"

очной формы обучения

Воронеж 2011

Составитель канд. физ.-мат. наук И.Н. Пантелеев

УДК 51 (075)

Введение в математическую статистику: методические указания для организации самостоятельной работы по курсу "Высшая математика" для студентов специальностей 280103 "Защита в чрезвычайных ситуациях", 280101 "Безопасность жизнедеятельности в техносфере " и направления 280200 "Защита окружающей среды" очной формы обучения / ФГБОУ ВПО «Воронежский государственный технический университет»; сост. И.Н. Пантелеев. Воронеж, 2011. 48 с.

Настоящие методические указания предназначены в качестве руководства для организации самостоятельной работы

по курсу "Высшая математика" по разделу «Теория вероятностей и матстатистика» для студентов специальностей

280103 (ЧС), 280101 (БЖ) и направления 280200 (ЗС) в 4

семестре. В работе приведен теоретический материал, необходимый для выполнения заданий и решения типовых примеров.

Методические указания подготовлены на магнитном носителе в текстовом редакторе Microsoft Word 2003 и

содержатся в файле Vmfmm_VvStat.pdf.

Ил.10. Библиогр.: 8 назв.

Рецензент канд. физ.-мат. наук, доц. В.В. Ломакин Ответственный за выпуск зав. кафедрой д-р физ.-мат. наук, проф. И.Л. Батаронов

Иэдается по решению редакционно-издательского совета Воронежского государственного технического университета

© ФГБОУ ВПО «Воронежский государственный технический университет», 2011

1. Основные понятия математической статистики

. Все объекты данной совокупности называют

генеральной совокупностью.

Выборочной совокупностью (выборкой) называют совокупность случайно отобранных для обследования из генеральной совокупности объектов.

Если случайно отобранный объект возвращается обратно в генеральную совокупность, то выборка называется повторной. Если же не возвращается, то выборка называется без повторной.

Случайная бесповторная выборка имеет место тогда, когда из генеральной совокупности берется сразу нужное количество объектов.

Любой результат, вычисленный по данным выборки, имеет погрешность, которая называется ошибкой репрезентативности (или представительности).

Ошибка репрезентативности характеризует величину расхождения между результатами выборочного метода и соответствующими данными по генеральной совокупности.

Изменение изучаемого признакаxi данной статистической

совокупности называется его вариацией.

Наблюдаемые значения объекта (признака) xi ,

извлеченного при выборке из генеральной совокупности,

называют вариантами.

Варианты принято группировать по отдельным значениям признака (дискретная группировка) или по интервалам изменения признака (интервальная группировка).

Вариационным рядом называется последовательность вариант или интервалов вариации, расположенных в возрастающем порядке.

Число наблюдений объекта ni при выборке называется частотой. Отношение частоты к объему выборки ni / n = Mi

называется относительной частотой.

Представленная в виде таблицы совокупность вариант и соответствующих им частот или относительных частот называется статистическим распределением выборки.

. Пусть известно статистическое распределение частот количественного (дискретного или непрерывного) признака X.

Функцией распределения выборки или эмпирической функцией распределения называется функция F*(x),

определяющая относительную частоту события Х<х для каждого значения х:

F (х) = nnх ,

где nх — число вариант, при которых значение признака

меньше х, n — объем выборки.

Свойства эмпирической функции распределения:

1)функция F (х) —неубывающая;

2)значения функции F (х) принадлежат отрезку [0,1];

3)если х1 — наименьшая варианта, а хk — наибольшая, то

эмпирическая функция F (х) =0 при х х1 и F (х) =1 при

хi хk .

. Геометрическая иллюстрация статистического распределения представляется графическим изображением вариационных рядов: полигоном, гистограммой, кумулянтой и огивой.

При построении полигона частот на оси абсцисс прямоугольной системы координат откладывают варианты xi ,а на оси ординат — соответствующие им частоты ni .

Ломаная линия, соединяющая точки (хi,ni ) , называется

полигоном частот . Если по оси ординат откладывать относительные частоты wi — соответствующие вариантам xi ,

то ломаная линия, соединяющая точки (хi, wi ) , называется

полигоном относительных частот.

2

Гистограмма — графическое изображение интервального вариационного ряда. В случае непрерывного распределения признака в некотором интервале, интервал разбивают на несколько частичных интервалов длины h и находят суммы частот ni в каждом частичном интервале. При построении

гистограммы на оси абсцисс откладывают интервалы значений признака h, и на каждом из них, как на основании, строят прямоугольник с высотой равной отношению ni / h , где ni

частота вариант i-го интервала; ni / h — плотность частоты.

Площадь гистограммы частот равна сумме всех частот, т. е. объему выборки.

Если высоты прямоугольников равны wi / h — плотности

относительных частот, то ступенчатая фигура, состоящая из этих прямоугольников, называется гистограммой относительных частот.

Накопленной частотой в точке xi называется суммарная

частота элементов статистической совокупности со значениями признака, меньшими чем xi .

Если на оси ординат откладывать накопленные частоты yi (х) , а на оси абсцисс соответствующие границы интервалов

xi , то ломаная линия, соединяющая точки xi , yi (х) ,

называется кумулянтой.

Если на оси абсцисс откладывать накопленные частоты, а на оси ординат границы интервалов или значение признака, то ломаная линия, соединяющая точки ( yi (х), хi ), называется

огивой. Кумулятивным рядом называется ряд накопленных частот yi (х) члены которого соответствуют границам

интервалов или значениям признака.

1.1.Выборка задана в виде распределения частот

xi

2

4

ni

1

3

6

9

11

7

 

 

5

4

 

 

 

3

Написать распределение относительных частот.

Построить: а) полигон частот; б) полигон относительных частот; в) найти эмпирическую функцию и построить ее график.

Решение. Найдем объем выборки n = 1+3+7+5+4 = 20

Деля частоты на объем выборки, находим относительные частоты

w1 = 201 = 0,05 ; w2 = 203 = 0,15; w3 = 207 = 0,35;

w4 = 205 = 0, 25; w5 = 204 = 0, 2;

Распределение относительных частот примет вид

xi

2

4

wi

0,05

0,15

6

9

11

0,35

 

 

0,25

0,2

 

 

 

5

Проверка: wi = 0,05 +0,15 +0,35 +0, 25 +0, 2 =1.

i=1

а) На оси абсцисс отложим варианты xi а на оси ординат— соответствующие частоты ni (рис. 1).

Соединив последовательно точки (хi,ni ) прямыми, получим искомый полигон частот.

Рис.1

4

б) На оси абсцисс отложим варианты хi , а на оси ординат - соответствующие им относительные частоты wi (рис. 2).

Рис. 2

Соединив последовательно точки (хi, wi ) прямыми, получим искомый полигон относительных частот.

в) Наименьшая варианта равна 2, следовательно, F*(х)=0 прих 2 .

Значение Х< 4, а именно х1 = 2 , наблюдалось один раз, следовательно, F*(х)= 1/20=0,05 при 2 < х 4 .

Значения Х<6, а именно х1 = 2 , х2 =4 , наблюдались 1+3=4 раза, следовательно, F*(х)= 4/ 20 = 0,2 при 4 < х 6 .

Значения

Х< 9, а именно х1 =2,

х2 =4, х3 =6, наблюдались

1+3+7=11 раз, следовательно, F*(х)= 11/20 = 0,55 при 6 < х 9 .

Значения Х< 11, а именно х1 =2, х2 =4, х3 =6 и х4 =9,

наблюдались

1+3+7+5= 16 раз,

следовательно

F*(х)=16/20 = 0,8 при 9 < х 11.

Так как х = 11 — наибольшая варианта, то, согласно свойств эмпирической функции распределения, получим

F*(x)=1 при х<11.

Отсюда, искомая функция распределения примет вид

5

0

0,05

0, 2 F *(х) =

0,55

0,8

1

График функции распределения показан на рис.3.

Рис.3

1.2. По данному распределению выборки

Интервалхi

хi+1

2-6

6-10

10-14

14-18

18-22

Частота ni

 

4

6

10

25

5

построить:

а)гистограмму частот;

 

 

 

 

б)гистограмму относительных частот.

 

Решение. а) Нетрудно решить, что длина интервалов

равна h=4. Тогда плотности частот равны

 

 

 

n1

=1 ;

n2

=1,5 ;

n3

= 2,5 ;

n4

= 6, 25 ;

n5

=1, 25 .

 

h

h

h

h

h

 

 

 

 

 

 

На оси абсцисс построим заданные интервалы (рис. 4).

6

Рис.4 Над этими интервалами параллельно оси абсцисс проведем

отрезки на расстояниях, равных соответствующим плотностям частоты n / h и построим ступенчатую фигуру из прямоугольников, которая и будет искомой гистограммой частот.

б) Найдем сначала объем выборки

n = ni = 4 +6 +10 +25 +5 = 50.

Относительные частоты будут

w1 = 504 = 0,08 ; w2 = 506 = 0,12 ; w4 = 5025 = 0,5; w5 = 505 = 0,1.

Плотности относительных частот будут:

w1

=

0,08

= 0,02 ;

 

w2

=

0,12

= 0,03;

 

w3

=

0, 2

= 0,05 ;

4

 

 

h

4

h

4

h

 

w4

 

0,5

 

 

w5

 

0,1

 

 

 

 

 

 

=

= 0,125 ;

=

= 0,025 .

 

 

 

 

 

4

h

4

 

 

 

 

 

h

 

 

 

 

 

 

 

 

 

 

 

На оси абсцисс откладываем частичные интервалы (рис.5).

Рис.5

7

Над частичными интервалами параллельно оси абсцисс проведем отрезки на расстояниях, равных соответствующим плотностям относительно частот Wi / h .

1.3. В магазине за день проданы рубашки следующих размеров

40 37 39 42 40 39 38 40 41 36

41 41 40 39 41 40 37 43 40 39

39 38 40 37 40 38 42 41 40 42

41 40 38 39 41 40 41 41

Написать дискретный вариационный ряд и построить полигон.

Решение. Различные значения признака (размеры рубашек) располагаем в порядке их возрастания и под каждым из этих значений записываем их частоту, тогда вариационный ряд примет вид

хi

36

37

38

39

40

41

42

43

ni

1

3

4

6

11

9

3

1

На оси абсцисс отложим варианты хi , на оси ординат

соответствующие им частоты. Полигон распределения показан на рис. 6.

Рис.6

8

1.4. В течение дня измерялось напряжение тока в электросети (в). При этом были получены следующие значения:

209 215 215 232 220 220 218 220 221

222 224 227 217 226 212 221 225 219

220 222 216 223 218 230 211 219 227

226 220 219 216 232 215 219 218 223

По этим данным написать: а) интервальный вариационный ряд с равными интервалами в три деления; б) построить гистограмму; в) написать кумулятивный ряд; г) построить кумулянту и огиву.

Решение. а) Разобьем диапазон изменения напряжений на равные интервалы и составим таблицу, в первой строке которой расположим в порядке возрастания интервалы, а во второй значения подсчитанных частот

Интервал

209

212

215

218

221

224

227

230

хi хi+1

-

-

-

-

-

-

-

-

 

212

215

218

221

224

227

230

233

ni

2

1

6

11

6

4

3

3

γi

2

3

9

20

26

30

33

36

б) Гистограмма распределения показана на рис.7.

Рис.7

9