Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие по МС.docx
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
725.35 Кб
Скачать

2.Вариационный ряд и порядковые статистики.

Пусть из генеральной совокупности извлечена выборка, причем значение интересующего нас признака х1 наблюдалось n1 раз, х2 – n2 раз, …, хк – nк раз и = n – объем выборки.

Определение: Наблюдаемые значения xi называют вариантами, а последовательность вариант, записанных в возрастающем порядке, – вариационным рядом. Числа наблюдений ni называют частотами, а их отношение к объему выборки wi относительными частотами.

= wi

Определение: Статистическим распределением выборки называют перечень вариант и соответствующих им частот.

Пример: Дано статистическое распределение частот выборки обьема n = 20:

xi

2

6

12

ni

3

10

7

Написать распределение относительных частот.

Решение: Найдем относительные частоты: w1 = = 0,15;

w2 = = = 0,5; w3 = = 0,35. Получаем искомое статистическое распределение относительных частот:

xi

2

6

12

wi

0,15

0,5

0,35

Варианты могут быть записаны в виде точечных значений или в виде интервалов (частичных интервалов) непрерывных значений. В первом случае вариационный ряд называется дискретным (точечным), во втором – интервальным. Для частичного интервала выбирают длину h, определяемую условиями задачи или рассчитывают по формуле:

При этом значение признака, находящегося на границе частичных интервалов обычно относят к правой границе частичного интервала.

На практике считается, что правильно составленный вариационный ряд содержит от 6 до 15 частичных интервалов.

Часто интервальный вариационный ряд заменяют дискретным вариационным рядом, выбирая средние значения (середины) интервалов.

Статистическое распределение выборки можно задать не только с помощью таблицы, но и аналитически – с помощью эмпирической функции распределения.

Определение: Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события X < x:

F*(х) = ,

где nx число вариант, меньших х, а n – объём выборки.

Заметим, что функцию распределения F(х) генеральной совокупности называют теоретической функцией распределения. F(х) определяет вероятность, т.е. P(X<x), а F*(х) – относительную частоту этого же события.

F*(х) обладает всеми свойствами F(x).

Пример: Построить эмпирическую функцию распределения по данному распределению выборки:

хi

2

6

10

ni

12

18

30

Решение. Объём выборки n = 12+18+30 = 60. Наименьшая варианта равна 2, следовательно F*(х) = 0 при x ≤ 2 .

Значение X < 6, а именно х1 = 2, наблюдалось 12 раз, следовательно, F*(х) = = 0,2 при 2 < X ≤ 6.

Значения X < 10, а именно х1 = 2 и х2 = 6 наблюдались 12+18= 30 раз, следовательно, F*(х) = = 0,5 при 6 < x ≤ 10.

Т. к. х = 10 – наибольшая варианта, то F*(х) = 1 при х > 10.

F*(х)= 0 при x

0,2 при 2 < х ≤ 6

0,5 при 6 < x ≤ 10

1 при x > 10.

Построим график этой функции. Он имеет ступенчатый вид:

F(x)

1

0,5

0,2

0 1 2 3 4 5 6 7 8 9 10 x

Статистическое распределение выборки можно задать и графически – с помощью полигона или гистограммы.

Определение: Полигоном частот называют ломанную, отрезки которой соединяют точки (х1; n1 ), (x2; n2), ... , (xk; nk).

Определение: Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (х1; w1), (x2; w2), …, (xk; wk).

W

w3

w4

w2

w1

x1 x2 x3 x4 X

В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длинной h и находят для каждого частичного интервала частоту ni – сумму частот вариант, попавших в данный i-ый интервал.

Определение: Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению (плотность частоты).

Заметим, что площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

h = = n

Пример: Статистическое распределение задано с помощью интервального вариационного ряда, частичные интервалы которого имеют длину h = 5.

Частичный интервал

Сумма частот вариант частичного интервала ni

Плотность частоты

5-10

10-15

15-20

20-25

25-30

30-35

35-40

4

6

16

36

24

10

4

0,8

1,2

3,2

7,2

4,8

2

0,8

Построим гистограмму частот:

7 ,2

3 ,2

0 ,8

0 5 10 15 20 25 30 35 40 Х

Определение: Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны отношению wi / h (плотность относительной частоты).

Заметим, что площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

h = = 1

Определение: Модой называют варианту, которая имеет наибольшую частоту.

Пример:

хi

1

7

9

ni

10

14

6

Очевидно, =7.

Определение: Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант.

Если число вариант нечетно, т.е. n = 2k+1, то = .

Если число вариант четно, т.е. n=2k, то = .

Пример: Для вариационного ряда 2, 3, 5, 6, 7 ; Для вариационного ряда 2, 3, 5, 6, 7, 9 = 5,5.

Определение: Размахом варьирования R называют разность между наибольшей и наименьшей вариантами:

R =

Пример: Для ряда 1, 3, 4, 5, 6, 10 размах равен R = 10-1 = 9.

Размах является простейшей характеристикой рассеяния вариационного ряда.

Определение: Любую функцию случайной выборки называют статистикой.