
- •Введение
- •1. Статистическая обработка результатов выборочных наблюдений.
- •1.1.Постановка задачи
- •1.2.Вычисление основных числовых характеристик выборочных наблюдений
- •1.3. Результаты вычисления интервальных оценок для математического ожидания и дисперсии
- •1. 4. Ранжирование выборочных данных, вычисление моды и медианы
- •1.5. Параметрическая оценка функции плотности распределения
- •1.6. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона
- •2. Аналитические показатели изменения уровней ряда динамики
- •3. Статистика рынка труда
- •3.1. Экономически активное население
- •Экономическая активность населения России
- •3.2. Трудовые ресурсы, методы расчета численности трудовых ресурсов
- •3.3. Коэффициенты занятости
- •3.4. Понятие и виды безработицы
- •3.5. Коэффициенты безработицы
- •Заключение
- •Список литературы
1. 4. Ранжирование выборочных данных, вычисление моды и медианы
Используя исходные данные, записываем все заданные значения выборки в виде неубывающей последовательности значений случайной величины X, представленные в табл.1.4.1
Таблица 1.4.1
Ранжированный ряд
|
|||||||||||||
1 |
-1,3646 |
11 |
-0,0290 |
21 |
0,5983 |
31 |
0,9868 |
41 |
1,2608 |
51 |
1,9901 |
||
2 |
-0,6640 |
12 |
-0,0211 |
22 |
0,6528 |
32 |
0,9887 |
42 |
1,2617 |
52 |
2,0641 |
||
3 |
-0,6636 |
13 |
0,0586 |
23 |
0,7238 |
33 |
0,9950 |
43 |
1,2809 |
53 |
2,0727 |
||
4 |
-0,5175 |
14 |
0,1924 |
24 |
0,7253 |
34 |
0,9992 |
44 |
1,3165 |
54 |
2,2134 |
||
5 |
-0,4095 |
15 |
0,2879 |
25 |
0,7360 |
35 |
1,0097 |
45 |
1,3255 |
55 |
2,2698 |
||
6 |
-0,3335 |
16 |
0,2964 |
26 |
0,7424 |
36 |
1,0714 |
46 |
1,3966 |
56 |
2,2765 |
||
7 |
-0,2705 |
17 |
0,4197 |
27 |
0,7506 |
37 |
1,1034 |
47 |
1,4855 |
57 |
2,2781 |
||
8 |
-0,2566 |
18 |
0,4522 |
28 |
0,7546 |
38 |
1,1737 |
48 |
1,4998 |
58 |
2,7701 |
||
9 |
-0,1746 |
19 |
0,4588 |
29 |
0,8669 |
39 |
1,2189 |
49 |
1,6204 |
59 |
2,8634 |
||
10 |
-0,1190 |
20 |
0,4774 |
30 |
0,8839 |
40 |
1,2431 |
50 |
1,6804 |
60 |
3,1363 |
Интервал [-1,3646; 3,1363], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.
По формуле Стерджеса длина частичного интервала равна:
h = (Xmax - Xmin)/(1+3,322*lg(n) = 4,5009/6,91 = 0,65
Для удобства и простоты расчётов следует округлять величину h. В нашем случае выбираем h =0,7 и вычисляем границы интервалов.
За начало первого интервала принимаем значение
x0 = Xmin – h/2 = -1,3646 – 0,7/2 = -1,3646 - 0,35 = -1,7146,
которое округляется до x0 = -1,7. Далее вычисляем границы интервалов.
x1 =x0 +h=-1,7 + 0,7 = -1,0
x2=x1 + h = -1,0+0,7=-0,3 x3=x2 + h =-0,3+0,7=0,4 x4=x3 + h = 0,4+0,7=1,1 x5=x4+ h = 1,1+0,7=1,8 x6=x5+ h =1,8+0,7=2,5 x7=x6+ h= 2,5+0,7=3,2
Вычисление границ заканчивается, как только выполняется неравенство
xn > Xmax , то есть x7 =3,2 > Xmax = 3,1363 .
После определения частичных интервалов, определяют экспериментальные частоты ni равные числу членов вариационного ряда попадающих в этот интервал:
xi-1≤ x(s) < xi ,
где xi-1, xi - границы i-го интервала,
x(s) - значения вариационного ряда.
Набор частот n1,n2,…,nk должен удовлетворять равенству:
n1
+ n2
+ …+ nk
=
=
n
Относительной частотой Wi называют долю наблюдений попадающих в рассматриваемый интервал:
Wi
=
Плотность распределения относительных частот определяют как отношение относительных частот к величине интервала:
(
)=
Wi
/h
= ni/(nh)
,
где =(xi-1 + xi)/2 является серединой интервала [xi-1;xi) .
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h , а высоты равны эмпирической плотности распределения:
=
(
)
= ni/(nh)
,
где i=1,2,…,k .
Площадь i-го прямоугольника равна отношению количества случайных величин, попавших в i-ый интервал, к их общему количеству:
Si = h = h ni/(nh) =
Площадь гистограммы относительных частот равна сумме площадей прямоугольников :
S
=
=
= 1
Таким образом, функция ( ) является статистическим аналогом плотности распределения случайной величины Х , реализации которой получают при статистическом наблюдении.
Полигоном частот называется ломаная линия, отрезки которой соединяют середины горизонтальных отрезков, образующих прямоугольники в гистограмме.
Полигоном относительных частот называется ломаная линия с вершинами в точках ( =(xi-1 + xi)/2 ; = ni/(nh) ) .
По результатам вычислений составляем табл.1.4.2: значения выборочной функции плотности. В первой строке таблицы помещаем частичные интервалы, во второй строке — середины интервалов, в третьей строке записаны частоты - количество элементов выборки, попавших в каждый частичный интервал, в четвертой строке записаны относительные
частоты, в пятой строке записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности.
Таблица 1.4.2
Значения выборочной функции плотности
[xi-1;xi) |
[-1,7; -1,0) |
[-1,0; -0,3) |
[-0,3;0,4) |
[0,4;1,1) |
[1,1;1,8) |
[1,8;2,5) |
[2,5;3,2) |
|
-1,35 |
-0,65 |
0,05 |
0,75 |
1,45 |
2,15 |
2,85 |
ni |
1 |
5 |
10 |
20 |
14 |
7 |
3 |
Wi= ni/n |
0,01667 |
0,08333 |
0,16667 |
0,33333 |
0,23333 |
0,11667 |
0,05 |
|
0,02381 |
0,11905 |
0,23810 |
0,47619 |
0,33333 |
0,16667 |
0,07143 |
По результатам вычислений функции плотности, представленной в табл. 1.4.2 можно сделать вывод, что мода имеет один локальный максимум в окрестностях точки х=0,75 с частотой ni=20.
Оценку медианы находим, используя вариационный ряд для которого n=2k=60 и k=30
Me
=
(x(k)
+ x(k+1)
) =
(x(30)
+ x(31)
) =
(0,8839
+ 0,9868) = 0,9354
Сравнение оценок медианы Ме = 0,9354 и оценки математического ожидания =0,9018 показывает, что они отличаются на 3,73 процента.