Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
статистика курсовик.docx
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.61 Mб
Скачать

1.4. Ранжирование выборочных данных, вычисление моды и медианы

Используя исходные данные, запишем все заданные значения выборки

в виде неубывающей последовательности значений случайной величины X, представленные в табл.1.2.

Таблица 1.2 - Ранжированный ряд

1

31,17

11

37,85

21

40,29

31

42,33

41

44,09

51

47,95

2

31,84

12

37,89

22

40,38

32

42,41

42

44,1

52

48,32

3

34,68

13

38,29

23

40,87

33

42,93

43

44,21

53

48,36

4

34,83

14

38,35

24

41,26

34

42,94

44

44,26

54

49,06

5

35,41

15

38,96

25

41,61

35

42,97

45

44,33

55

49,34

6

35,95

16

39,43

26

41,62

36

43,04

46

44,4

56

49,38

7

36,33

17

39,47

27

41,67

37

43,35

47

44,8

57

49,39

8

36,64

18

39,48

28

41,71

38

43,4

48

45,42

58

51,85

9

36,71

19

40,09

29

41,75

39

43,51

49

45,49

59

52,31

10

37,12

20

40,26

30

41,77

40

43,86

50

46,4

60

53,68

Интервал [31,17; 53,68], содержащий все элементы выборки, разобьём на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.

По формуле Стерджеса длина частичного интервала равна:

(1.14)

Вычисляем границы интервалов:

За начало первого интервала принимаем значение

(1.15)

Далее вычисляем границы интервалов:

Вычисление границ заканчивается, как только выполняется неравенство , то есть .

После определения частичных интервалов, определяем экспериментальные частоты ni , равные числу членов вариационного ряда, попадающих в этот интервал:

xi-1 ≤ x(s) < xi , (1.16)

где xi-1, xi – границы i-го интервала; x(s) – значения вариационного ряда.

Набор частот n1,n2,…, nk должен удовлетворять равенству:

n1 + n2 +…+ nk = = n (1.17)

Относительной частотой Wi называют долю наблюдений, попадающих

в рассматриваемый интервал:

Wi = (1.18)

Плотность распределения относительных частот определим как

отношение относительных частот к величине интервала:

, (1.19)

где является серединой интервала [xi-1; xi).

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны эмпирической плотности распределения:

͡pi = , (1.20)

где i=1,2,…, k.

Площадь i-го прямоугольника равна доле случайных величин, попавших в i-й интервал:

Si = ͡pi h = (1.21)

Площадь гистограммы относительных частот равна сумме площадей прямоугольников:

S = (1.22)

Таким образом, функция является статистическим аналогом плотности распределения случайной величины Х, реализации которой получают при статистическом наблюдении. Полигоном частот называется ломаная линия, отрезки которой соединяют середины горизонтальных отрезков, образующих прямоугольники в гистограмме.

Полигоном относительных частот называется ломаная линия с вершинами в точках: , ͡pi (1.23)

По результатам вычислений составим табл.1.3 значений выборочной функции плотности. В первую строку таблицы поместим частичные интервалы, во вторую строку – середины интервалов, в третью строку запишем частоты – количество элементов выборки, попавших в каждый частичный интервал, в четвёртую строку запишем относительные частоты, в пятую строку запишем значения плотности относительных частот или значения выборочной, экспериментальной функции плотности.

Таблица 1.3 - Значения выборочной функции плотности

[29,54; 32,8)

[32,8; 36,06)

[36,06; 39,32)

[39,32; 42,58)

[42,58; 45,84)

[45,84; 49,1)

[49,1; 52,36)

[52,36; 55,62)

31,17

34,43

37,69

40,95

44,21

47,47

50,73

53,99

2

4

9

17

17

4

6

1

0,0333

0,0667

0,15

0,2833

0,2833

0,0667

0,1

0,0167

0,0102

0,0204

0,0460

0,0869

0,0869

0,0204

0,0307

0,0051

По результатам вычислений функции плотности, представленной в таблице 1.3 можно сделать вывод, что в интервалах [39,32; 42,58) и [42,58; 45,84) больше всего элементов – по 17 в каждом. Объедим эти интервалы в один и вычислим моду: мода имеет один локальный максимум в окрестностях точки х = 44,21 с частотой ni = 18.

Оценку медианы находим, используя вариационный ряд, для которого n = 2k = 60 и k = 30:

(1.24)

Сравнение оценок медианы = 42,05 и оценки математического ожидания показывает, что они отличаются на 0,997%.