Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
курсовая по статистике.doc
Скачиваний:
4
Добавлен:
01.03.2025
Размер:
5.81 Mб
Скачать

1. 4. Ранжирование выборочных данных, вычисление моды и медианы

Используя исходные данные, записываем все заданные значения выборки в виде неубывающей последовательности значений случайной величины X, представленные в табл.1.4.1

Таблица 1.4.1

Ранжированный ряд

1

-1,3646

11

-0,0290

21

0,5983

31

0,9868

41

1,2608

51

1,9901

2

-0,6640

12

-0,0211

22

0,6528

32

0,9887

42

1,2617

52

2,0641

3

-0,6636

13

0,0586

23

0,7238

33

0,9950

43

1,2809

53

2,0727

4

-0,5175

14

0,1924

24

0,7253

34

0,9992

44

1,3165

54

2,2134

5

-0,4095

15

0,2879

25

0,7360

35

1,0097

45

1,3255

55

2,2698

6

-0,3335

16

0,2964

26

0,7424

36

1,0714

46

1,3966

56

2,2765

7

-0,2705

17

0,4197

27

0,7506

37

1,1034

47

1,4855

57

2,2781

8

-0,2566

18

0,4522

28

0,7546

38

1,1737

48

1,4998

58

2,7701

9

-0,1746

19

0,4588

29

0,8669

39

1,2189

49

1,6204

59

2,8634

10

-0,1190

20

0,4774

30

0,8839

40

1,2431

50

1,6804

60

3,1363

Интервал [-1,3646; 3,1363], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.

По формуле Стерджеса длина частичного интервала равна:

h = (Xmax - Xmin)/(1+3,322*lg(n) = 4,5009/6,91 = 0,65

Для удобства и простоты расчётов следует округлять величину h. В нашем случае выбираем h =0,7 и вычисляем границы интервалов.

За начало первого интервала принимаем значение

x0 = Xmin – h/2 = -1,3646 – 0,7/2 = -1,3646 - 0,35 = -1,7146,

которое округляется до x0 = -1,7. Далее вычисляем границы интервалов.

x1 =x0 +h=-1,7 + 0,7 = -1,0

x2=x1 + h = -1,0+0,7=-0,3 x3=x2 + h =-0,3+0,7=0,4 x4=x3 + h = 0,4+0,7=1,1 x5=x4+ h = 1,1+0,7=1,8 x6=x5+ h =1,8+0,7=2,5 x7=x6+ h= 2,5+0,7=3,2

Вычисление границ заканчивается, как только выполняется неравенство

xn > Xmax , то есть x7 =3,2 > Xmax = 3,1363 .

После определения частичных интервалов, определяют экспериментальные частоты ni равные числу членов вариационного ряда попадающих в этот интервал:

xi-1≤ x(s) < xi ,

где xi-1, xi - границы i-го интервала,

x(s) - значения вариационного ряда.

Набор частот n1,n2,…,nk должен удовлетворять равенству:

n1 + n2 + …+ nk = = n

Относительной частотой Wi называют долю наблюдений попадающих в рассматриваемый интервал:

Wi =

Плотность распределения относительных частот определяют как отношение относительных частот к величине интервала:

( )= Wi /h = ni/(nh) ,

где =(xi-1 + xi)/2 является серединой интервала [xi-1;xi) .

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h , а высоты равны эмпирической плотности распределения:

= ( ) = ni/(nh) ,

где i=1,2,…,k .

Площадь i-го прямоугольника равна отношению количества случайных величин, попавших в i-ый интервал, к их общему количеству:

Si = h = h ni/(nh) =

Площадь гистограммы относительных частот равна сумме площадей прямоугольников :

S = = = 1

Таким образом, функция ( ) является статистическим аналогом плотности распределения случайной величины Х , реализации которой получают при статистическом наблюдении.

Полигоном частот называется ломаная линия, отрезки которой соединяют середины горизонтальных отрезков, образующих прямоугольники в гистограмме.

Полигоном относительных частот называется ломаная линия с вершинами в точках ( =(xi-1 + xi)/2 ; = ni/(nh) ) .

По результатам вычислений составляем табл.1.4.2: значения выборочной функции плотности. В первой строке таблицы помещаем частичные интервалы, во второй строке — середины интервалов, в третьей строке записаны частоты - количество элементов выборки, попавших в каждый частичный интервал, в четвертой строке записаны относительные

частоты, в пятой строке записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности.

Таблица 1.4.2

Значения выборочной функции плотности

[xi-1;xi)

[-1,7; -1,0)

[-1,0;

-0,3)

[-0,3;0,4)

[0,4;1,1)

[1,1;1,8)

[1,8;2,5)

[2,5;3,2)

= (xi-1 + xi)/2

-1,35

-0,65

0,05

0,75

1,45

2,15

2,85

ni

1

5

10

20

14

7

3

Wi= ni/n

0,01667

0,08333

0,16667

0,33333

0,23333

0,11667

0,05

( )= ni/(nh)

0,02381

0,11905

0,23810

0,47619

0,33333

0,16667

0,07143

По результатам вычислений функции плотности, представленной в табл. 1.4.2 можно сделать вывод, что мода имеет один локальный максимум в окрестностях точки х=0,75 с частотой ni=20.

Оценку медианы находим, используя вариационный ряд для которого n=2k=60 и k=30

Me = (x(k) + x(k+1) ) = (x(30) + x(31) ) = (0,8839 + 0,9868) = 0,9354

Сравнение оценок медианы Ме = 0,9354 и оценки математического ожидания =0,9018 показывает, что они отличаются на 3,73 процента.