Тема №4. Обобщающие характеристики совокупности
Задание.
По равноинтервальной группировке (результат выполнения задания темы №3) рассчитайте среднее арифметическое, медиану и моду
По этим же данным измерьте вариацию при помощи показателей размаха вариации, дисперсии, среднего квадратического отклонения и коэффициента вариации.
Решение:
Для расчета требуемых показателей составим следующую таблицу.
Таблица 3
Середина интервала, Хi |
Накопленное кол-во |
Частота Ni |
Xi*Ni |
*Ni |
1088,5 |
26 |
26 |
28301 |
30805638,5 |
3053,5 |
27 |
1 |
3053,5 |
9323862,25 |
5018,5 |
30 |
3 |
15055,5 |
75556026,75 |
6983,5 |
31 |
1 |
6983,5 |
48769272,25 |
8948,5 |
0 |
0 |
0 |
0 |
10913,5 |
32 |
1 |
10913,5 |
119104482,25 |
Итого: |
- |
32 |
64307 |
283559282 |
Среднее арифметическое значение:
= == 2009,6 тыс. чел.
Следовательно, в среднем в данной выборке стран средний уровень занятости составляет 2009,6 тыс. чел.
Интервал, содержащий медиану: [106;2071].
Точное значение мадианы:
+
где x0 - начало интервала, содержащего медиану;
–величина интервала, содержащего медиану;
F(x0) – накопленная частота на начало интервала, содержащего мадиану;
N – объём совокупности;
NMe – частота того интервала, в котором расположена медиана.
Me[x] = 106+1965 *= 1315,2 тыс. чел.
Следовательно, в 50% стран из данной выборки стран уровень занятости составляет 1315,2 тыс. чел.
Интервал содержащий моду: [106;2071].
Точное значение моды:
Mo[x] = x +
Где x0 – начало интервала, содержащего моду;
–величина интервала, содержащего моду;
- частота того интервала, в котором расположена мода;
–частота интервала, предшествующего модальному;
- частота интервала, следующего за модальным.
Mo[x] = 106+ 1965* = 1107,7 тыс. чел.
Следовательно, наиболее популярное значение занятости населения составляет 1108,15 тыс. чел.
Дисперсия:
= =- 2009,62 = 8861227,6 – 4038492,16 = (тыс. чел.)2
Среднее квадратное отклонение:
= == 2196,07 тыс. чел.
Следовательно, среднее отклонение уровня занятости в данной выборке стран от среднего значения уровня занятости составляет 2196,07 тыс. чел.
Коэффициент вариации:
= = 1,09
Тема №5. Выборочное исследование
Задание.
По данным таблицы №1 «Макроэкономические показатели европейских стран», соответствующим вашему варианту с вероятностью 0,95 определите доверительный интервал для генеральной средней, считая эти данные собственно-случайной повторной выборкой.
Как изменится доверительный интервал, если вероятность увеличится до 0,99? Сделайте необходимый расчет.
Какую по объему выборку надо иметь, чтобы погрешность (ошибку) в доверительном интервале можно было бы уменьшить в 2 раза относительно её первоначального значения (вероятность 0,95).
Решение:
1-y = 0,95
(- tkp ; + tkp
Определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф (tkp ) = 1 – y
Ф (tkp ) = ( 1 – y) / 2 = 0,95/2 = 0,475
По таблице функции Лапласа найдем, при каком tkp значение Ф (tkp ) = 0,475
tkp (y) = (0,475) = 1,96
= tkp = 1,96 = 773,07
(2009,6 - 773,07 ; 2009,6 +773,07 ) = ( 1236,53 ; 2782,67)
С вероятностью 0,95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Определяем значение tkp по таблицам функции Лапласа.
1-y= 0,99
В этом случае 2Ф (tkp ) = 1 – y
Ф (tkp ) = ( 1 – y) / 2 = 0,99/2 = 0,495
По таблице функции Лапласа найдем, при при каком tkp значение Ф (tkp ) = 0, 495
tkp (y) = (0,495) = 2,58
= tkp = 2,58 = 1017,61
(2009,6 - 1017,61 ; 2009,6 +1017,61 ) = ( 991,99 ; 3027,21)
С вероятностью 0,99 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Таким образом, величина интервала увеличилась на:
= 2 * (1017,61 - 773,07) = 489,08
Известно, что = 0,5а значит, 0,5t = t , что справедливо дляn1 = n/ 0,25 = 32/ 0,25 = 128, то есть объем выборки следует увеличить до 128 стран. То есть, чтобы погрешность в доверительном интервале можно было бы уменьшить в 2 раза относительно её первоначального значения необходимо увеличить объем выборки до 128 единиц.
2Ф (tkp ) = 1 – y;
2Ф (tkp )y = 1;
Ф (tkp )y = 1 |:2
Ф (tkp )y = 0,5