Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УПП2КУРС / 1 семестр / матан / Основные понятия математической статистики

.pdf
Скачиваний:
559
Добавлен:
18.09.2019
Размер:
267.05 Кб
Скачать

Пожидаев А.В., Вылегжанин И.А. Математика: Курс лекций для студентов технических специальностей. Ч. IV. – Новосибирск: Изд-во СГУПСа, 2009. – 138 с.

Лекция

Основные понятия математической статистики. Генеральная совокупность и выборка. Генеральные и выборочные характеристики. Вариационный ряд. Эмпирическая функция распределения. Полигон частот и гистограмма. Эмпирические законы распределения.

Основные понятия математической статистики

Предмет математической статистики. Статистические ряды

Математическая статистика занимается разработкой методов регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений.

Рассмотрим формулировки некоторых основных задач математической статистики. 1) Задача определения закона распределения.

Известна некоторая, достаточно обширная совокупность значений неизвестной случайной величины. По данной совокупности требуется определить закон распределения этой случайной величины.

2) Задача нахождения параметров распределения

Известна некоторая, достаточно обширная совокупность значений неизвестной случайной величины. По данной совокупности требуется определить математическое ожидание, дисперсию и, возможно, моменты более высоких порядков случайной величины.

3) Задача проверки правдоподобия гипотез

Выдвигается какая-либо гипотеза, касающаяся неизвестной случайной величины, для которой известна некоторая совокупность значений. Например, это может быть гипотеза о подчинении случайной величины некоторому закону распределения, или гипотеза о зависимости двух наблюдаемых случайных величин.

Первичным статистическим материалом в математической статистике является совокупность значений случайной величины, полученных в результате наблюдения (выборка). Обычно эта совокупность значений оформляется в виде таблицы, называемой (дискретным)

статистическим рядом частот:

Х

 

x1

 

x2

 

 

x3

xk 1

 

xk

 

n

 

n1

 

n2

 

 

n3

 

nk 1

 

nk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni раз в результате

где xi

-

значение

случайной

величины

X ,

 

принятое

n = n1 + n2

+n3 +... + nk

наблюдений. Величины ni называются частотами. Обычно простой

статистический ряд частот записывается так, что x1 < x2

<... < xk .

Определение:

величина ωi =

ni

называется относительной частотой значения xi .

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

Аналогично статистическому ряду частот можно составить статистический ряд относительных частот:

1

Пожидаев А.В., Вылегжанин И.А. Математика: Курс лекций для студентов технических специальностей. Ч. IV. – Новосибирск: Изд-во СГУПСа, 2009. – 138 с.

Х

x1

 

x2

 

 

x3

 

 

 

 

xk 1

xk

 

 

 

 

ω

ω1

 

ω2

 

ω3

 

 

 

 

ωk 1

ωk

 

 

 

 

Замечание: ω1 +ω2

+... +ωk =1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Действительно: ω +ω

2

+... +ω

k

=

n1

+

n2

+... +

nk

=

n1 +n2 +... +nk

=

n

=1 .

 

 

 

 

 

 

1

 

 

 

 

n

 

n

 

 

n

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

При достаточно большом числе наблюдений, особенно, когда наблюдения производятся над непрерывной случайной величиной, статистические ряды становятся неудобной формой записи статистического материала – она становится громоздкой и мало наглядной. В этом случае строятся интервальные статистические ряды: весь диапазон наблюдений делится на интервалы [xi , xi+1 ) равной длины и подсчитывается количество наблюдений ni , попавших в

каждый интервал [xi , xi+1 ).

Интервальным статистическим рядом частот называется ряд

 

 

 

 

 

 

Х

[x1 , x2 )

[x2 , x3 )

[x3 , x4 )

[xk 1 , xk ]

n

n1

n2

n3

nk 1

Аналогично можно построить интервальный статистический ряд относительных частот

 

 

 

 

 

 

Х

[x1 , x2 )

[x2 , x3 )

[x3 , x4 )

[xk 1 , xk ]

n

ω1

ω2

ω3

ωk 1

где ωi = nni , n = n1 + n2 + n3 +... + nk 1 .

Пример В результате наблюдений над дискретной случайной величиной X получены следующие целые значения: 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6.

Составить статистический ряд частот и статистический ряд относительных частот. Решение: Составим статистический ряд частот

Х

1

2

3

4

5

6

n

2

4

7

8

3

1

Составим статистический ряд относительных частот: n = 2 + 4 +7 +8 +3 +1 = 25

ω =

2

 

= 0,08 ,

ω

2

=

4

 

= 0,16 ,

ω

3

=

7

= 0,28 ,

ω

4

=

8

= 0,32 ,

ω

5

=

3

= 0,12 ,

 

 

 

 

 

 

 

 

 

1

25

 

 

 

 

25

 

 

25

 

 

25

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ω6 =

 

1

 

= 0,04 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Х

 

 

 

 

1

 

2

 

 

 

3

4

 

 

 

5

6

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

0,08

0,16

 

 

0,28

0,32

 

 

0,12

0,04

 

 

 

 

 

 

 

 

 

2

Пожидаев А.В., Вылегжанин И.А. Математика: Курс лекций для студентов технических специальностей. Ч. IV. – Новосибирск: Изд-во СГУПСа, 2009. – 138 с.

Эмпирическая функция распределения

Определение: Эмпирической функцией распределения случайной величины X называется

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F * (x) =

nx

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где nx - число значений случайной величины X , меньших, чем x .

 

 

 

 

 

 

 

 

Замечание: Пусть дан статистический ряд частот случайной величины X :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Х

 

 

 

 

x1

 

 

 

 

x2

 

 

 

 

x3

 

 

 

 

 

 

xk 1

 

 

 

xk

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n1

 

 

 

 

n2

 

 

 

n3

 

 

 

 

 

 

 

nk 1

 

 

 

nk

 

 

 

 

 

 

 

 

 

 

 

и x1

< x2

<... < xk . Тогда nx

= 0 и на всем промежутке (−∞; x1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эмпирическая функция распределения равна нулю: F * (x) = 0 .

 

 

 

 

 

 

 

 

 

 

 

Пусть теперь x [x ; x

2

), тогда n

x

= n

и F * (x) =

n1

=ω

на интервале [x ; x

2

).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

n

1

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При

x [x

2

; x

3

)

 

будет

 

 

n

x

= n + n

2

и

 

F * (x) =

n1 + n2

=ω +ω

2

,

при x [x

; x

4

):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

n

 

1

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

x

= n + n

2

+ n

3

, F * (x) =

n1 + n2 + n3

=ω +ω

2

+ω

3

и т. д.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При x [x

 

;):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

n

x

= n

+ n

2

+ n

3

+... + n

k

 

и F * (x) =ω +ω

2

+ω

3

+... +ω

k

=1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

Значит, эмпирическая функция распределения является кусочно-постоянной функцией и обладает следующими свойствами:

1) F * (x) - неубывающая функция

2) lim F * (x) = 0 , lim F * (x) =1

x→−∞ x→∞

 

 

 

 

 

 

0

при

x (−∞; x1 )

 

 

 

 

 

 

 

 

 

ω1

 

при

x [x1; x2 )

 

 

 

 

 

 

 

 

 

 

 

 

 

F

*

 

 

ω1

+ω2

 

при

x [x2 ; x3 )

 

)

 

(x) = ω

 

+ω

2

+ω

3

при

 

x [x

; x

4

 

 

 

1

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

.................................

 

 

 

 

 

 

 

 

 

1

при

x

[x

 

;)

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример: Дан статистический ряд частот случайной величины:

X

1

 

 

4

 

 

6

 

 

 

 

 

n

10

 

 

15

 

 

25

 

 

 

 

 

Найти эмпирическую функцию распределения и построить ее график.

Решение: n =10 +15 + 25 = 50 , ω =

10

= 0,2 , ω =

15

= 0,3 , ω

3

=

25

= 0,5 .

 

 

 

 

1

50

1

50

 

50

 

 

 

 

 

 

 

 

3

Пожидаев А.В., Вылегжанин И.А. Математика: Курс лекций для студентов технических специальностей. Ч. IV. – Новосибирск: Изд-во СГУПСа, 2009. – 138 с.

0

при

x (−∞;1)

 

0,2

при

x [1;4)

 

F * (x) =

0,5

при

x [4;6)

 

 

1

при

x [6; )

 

Рис. 26 Пример: эмпирическая функция распределения

Полигон и гистограмма

Для наглядного геометрического восприятия простого статистического ряда частот и ряда относительных частот используются полигон частот и полигон относительных частот – аналоги многоугольника распределения, рассмотренного в теории вероятностей.

Определение: Пусть дан простой статистический ряд частот:

Х

x1

x2

x3

xk 1

xk

n

n1

n2

n3

nk 1

nk

Ломаная, соединяющая точки (xi , ni ) и (xi+1 , ni+1 ) при i =1,2,..., n называется полигоном

частот случайной величины X .

Определение: Пусть дан простой статистический ряд относительных частот:

Х

x1

x2

x3

xk 1

xk

ω

ω1

ω2

ω3

ωk 1

ωk

Ломаная, соединяющая точки (xi ,ωi ) и (xi+1 ,ωi+1 ) при i =1,2,..., n называется полигоном

относительных частот случайной величины X .

Пример: Построить полигоны частот и относительных частот по ряду распределения

X

1

4

6

n

10

15

25

Решение:

4

Пожидаев А.В., Вылегжанин И.А. Математика: Курс лекций для студентов технических специальностей. Ч. IV. – Новосибирск: Изд-во СГУПСа, 2009. – 138 с.

Рис. 27 Пример: полигоны частот и относительных частот

Для наглядного геометрического восприятия интервального статистического ряда относительных частот используется понятие гистограммы.

Определение: Пусть дан интервальный статистический ряд относительных частот с интервалами одинаковой длины h :

 

 

 

 

 

 

Х

[x1 , x2 )

[x2 , x3 )

[x3 , x4 )

[xk 1 , xk ]

n

ω1

ω2

ω3

ωk 1

Гистограммой называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы [x1 , x2 ), [x2 , x3 ), [x3 , x4 ),…, [xk 1 , xk ], а высоты равны отношениям

ω1

,

ω2

,

ω3

,…,

ωk 1 .

h

 

h

 

h

 

h

Пример: построить гистограмму относительных частот для интервального ряда распределения

 

 

 

 

 

 

 

 

 

 

 

 

 

Х

[1,2)

[2,3)

 

[3,4)

[4,5)

[5,6)

 

[6,7)

[7,8)

[8,9)

[9,10)

 

ω

0,01

0,03

 

0,05

0,12

 

0,29

 

0,3

0,11

0,05

0,04

 

Решение:

h =1,

поэтому

высоты

прямоугольников

будут равны соответствующим

относительным частотам.

5

Пожидаев А.В., Вылегжанин И.А. Математика: Курс лекций для студентов технических специальностей. Ч. IV. – Новосибирск: Изд-во СГУПСа, 2009. – 138 с.

Рис. 28 Пример: гистограмма

Замечание 1: Сумма площадей прямоугольников гистограммы равна 1.

Действительно: S = S1 + S2 +... + Sk 1

=

ω1

h +

ω2

h +... +

ωk 1

h =

h

h

h

 

 

 

 

 

=ω1 +ω2 +... +ωk 1 =1 .

 

 

 

 

 

 

 

Замечание 2: с увеличением числа k гистограмма будет все более и более приближаться к графику плотности распределения случайной величины.

6