
- •Министерство культуры рОссийской федерации
- •"Санкт-петербургский государственный университет
- •1. Статистическая обработка данных
- •1.1. Постановка задачи. Цель работы. Исходные данные
- •Постановка задачи
- •1.2. Вычисление основных выборочных характеристик по заданной выборке
- •1.4. Результаты ранжирования выборочных данных и вычисление моды и медианы
- •1.5. Параметрическая оценка функции плотности распределения
- •1.6. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона
- •2. Анализ динамики численности населения России
- •3. Статистика государственных финансов
- •3.1. Предмет и задачи статистики государственных финансов
- •3.2 Понятие о государственных финансах, их состав
- •3.3. Понятие бюджетной классификации и ее состав
- •3.4. Система показателей статистики государственных финансов и государственного бюджета
1.4. Результаты ранжирования выборочных данных и вычисление моды и медианы
Используя исходные данные, записываем все заданные значения выборки в виде неубывающей последовательности значений случайной величины Х. Данный ранжированный ряд представлен в таблице 4.
Таблица 4.
Ранжированный ряд
1 |
5,2468 |
11 |
7,1258 |
21 |
7,5954 |
31 |
7,978 |
41 |
8,4438 |
51 |
8,8752 |
2 |
6,6645 |
12 |
7,1419 |
22 |
7,6157 |
32 |
7,9971 |
42 |
8,482 |
52 |
8,949 |
3 |
6,6779 |
13 |
7,276 |
23 |
7,6193 |
33 |
8,0685 |
43 |
8,5386 |
53 |
9,0461 |
4 |
6,7004 |
14 |
7,3442 |
24 |
7,7021 |
34 |
8,0819 |
44 |
8,5396 |
54 |
9,1023 |
5 |
6,7492 |
15 |
7,3893 |
25 |
7,745 |
35 |
8,0862 |
45 |
8,5411 |
55 |
9,1354 |
6 |
6,8215 |
16 |
7,4158 |
26 |
7,7537 |
36 |
8,1151 |
46 |
8,6183 |
56 |
9,1543 |
7 |
6,831 |
17 |
7,4347 |
27 |
7,8543 |
37 |
8,252 |
47 |
8,6217 |
57 |
9,608 |
8 |
6,8576 |
18 |
7,435 |
28 |
7,8666 |
38 |
8,3811 |
48 |
8,6817 |
58 |
9,8659 |
9 |
6,8972 |
19 |
7,4701 |
29 |
7,8769 |
39 |
8,402 |
49 |
8,6915 |
59 |
10,1269 |
10 |
7,0205 |
20 |
7,49 |
30 |
7,9105 |
40 |
8,4229 |
50 |
8,8564 |
60 |
10,1338 |
Интервал [5,2468; 10,1338], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.
По формуле Стерджеса длина частичного интервала равна:
Для удобства и простоты расчетов выбираем h = 0,7 и вычисляем последовательно границы интервалов.
За начало первого интервала принимаем значение:
Далее вычисляем границы интервалов.
= 4,8968 + 0,7 = 5,5968
= 5,5968 + 0,7 = 6,2968
= 6,2968 + 0,7 = 6,9968
= 6,9968 + 0,7 = 7,6968
= 7,6968 + 0,7 = 8,3968
= 8,3968 + 0,7 = 9,0968
= 9,0968 + 0,7 = 9,7968
= 9,7968 + 0,7 = 10,4968
Вычисление границ заканчивается, как только выполняется неравенство Xn > Xmax, то есть X8 = 10,4968 > Xmax = 10,1338.
По результатам вычислений составляем таблицу. В первой строке таблицы помещаем частичные интервалы, на второй строке – середины интервалов, в третьей строке записано количество элементов выборки, попавших в каждый интервал – частоты, в четвертой строке записаны относительные частоты и в пятой строке записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности. Значения выборочной функции плотности представлены в таблице 5.
По результатам вычислений функции плотности, представленной в таблице 5., можно сделать вывод, что мода имеет 1 локальный максимум в окрестности точки х = 8,7468 и с частотой по n = 15.
Оценку медианы находим, используя вариационный ряд:
Так как n = 2k, k = n / 2 = 60 / 2 = 30
Сравнение оценок
медианы
и оценки математического ожидания
показывает, что они отличаются на 0,56%.
Таблица 5.
Значение выборочной функции и плотности
[xi-1; xi) |
|
ni |
|
|
[4,8968; 5,5968) |
5,2468 |
1 |
0,0166 |
0,0238 |
[5,5968; 6,2968) |
5,9468 |
0 |
0 |
0 |
[6,2968; 6,9968) |
6,6468 |
8 |
0,1333 |
0,1905 |
[6,9968; 7,6968) |
7,3468 |
14 |
0,2333 |
0,3333 |
[7,6968; 8,3968) |
8,0468 |
15 |
0,25 |
0,3571 |
[8,3968; 9,0968) |
8,7468 |
15 |
0,25 |
0,3571 |
[9,0968; 9,7968) |
9,4468 |
4 |
0,0666 |
0,0952 |
[9,6968; 10.4968) |
10,1468 |
3 |
0,05 |
0,0714 |