- •Министерство образования и науки российской федерации
- •Общая теория статистики
- •Оглавление
- •Общие положения
- •Перечень заданий на контрольную работу Задание 1. Статистическое наблюдение
- •Задание 2. Сводка и группировка статистических данных
- •Задание 3. Построение и анализ рядов распределения
- •Задание 4. Средние величины. Показатели вариации признака
- •Задание 5. Выборочное наблюдение
- •Задание 6. Статистические методы анализа связи (корреляционно-регрессионный анализ)
- •Задание 7. Анализ динамических рядов
- •Задание 8. Статистические индексы
- •Методические указания по выполнению заданий 1-6 контрольной работы
- •Задание 1. Статистическое наблюдение
- •Задание 2. Сводка и группировка статистических данных
- •1. Классификация зарегистрированных признаков
- •2. Типологическая группировка
- •3. Классификация группировочных признаков
- •4. Структурная равноинтервальная группировка
- •5. Аналитическая равноинтервальная группировка
- •6. Комбинационная группировка
- •Задание 3. Построение и анализ рядов распределения
- •1. Дискретный вариационный ряд
- •2. Равнонтервальный вариационный ряд распределения
- •3. Графическое изображение равноинтервального ряда распределения
- •Задание 4. Средние величины. Показатели вариации признака
- •1. Расчет среднего значения и показателей вариации по несгруппированным данным
- •2. Расчет средних величин (среднего значения, моды и медианы) и показателей вариации в дискретном вариационном ряду
- •3. Расчет средних величин и показателей вариации в равноинтервальном вариационном ряду
- •5. Вывод сформулируйте самостоятельно. Задание 5. Выборочное наблюдение
- •1. Определение пределов нахождения среднего значения балансовой прибыли в генеральной совокупности предприятий
- •2. Определение пределов нахождения доли предприятий федеральной формы собственности в генеральной совокупности
- •3. Расчет необходимой численности выборки из генеральной совокупности
- •Задание 6. Статистические методы анализа связи
- •1. Корреляционный анализ (выявление наличия, направления и тесноты связи)
- •2. Регрессионный анализ (поиск формы и уравнения связи)
- •Библиографический список
- •Приложения
3. Расчет средних величин и показателей вариации в равноинтервальном вариационном ряду
а. По данным равноинтервального вариационного ряда распределения предприятий по размеру балансовой прибыли (табл. 3.4 = табл. 5.1) определим средний размер прибыли по формуле средней арифметической взвешенной через середины интервалов:
млн. руб.
Таким образом, среднее значение размера балансовой прибыли сорока предприятий Вологодской области составляет 80,3 млн. руб.
Таблица 5.1
Равноинтервальный вариационный ряд 40 предприятий по размеру балансовой прибыли (число интервалов = 5)
Номер группы |
Группы предприятий по размеру прибыли, млн. руб. |
Середина интервала, млн. руб. |
Количество предприятий в группе (частота) |
В % к итогу (частость) |
Накопленная частота |
j |
(границы интервалов yjн – yjв) |
|
fj |
|
|
1 |
2 |
4 |
5 |
6 |
7 |
1 |
50 – 62 |
56 |
7 |
17,5 |
7 |
2 |
62 – 74 |
68 |
4 |
10 |
11 |
3 |
74 – 86 |
80 |
16 |
40 |
27 |
4 |
86 – 98 |
92 |
7 |
17,5 |
34 |
5 |
98 – 110 |
104 |
6 |
15 |
40 |
|
ВСЕГО |
– |
n = 40 |
100 |
– |
б. Мода в интервальном ряду распределения рассчитывается по наибольшей частоте или частости.
Сначала определим модальный интервал – интервал с наибольшим числом предприятий (частотой). В нашем случае это третий интервал, поскольку его частота составляет наибольшее значение – 16 предприятий.
Теперь рассчитаем моду:
млн. руб. – наиболее часто в интервальном ряду распределения встречаются предприятия с размером прибыли 79,1 млн. руб.
в. Медиана в интервальном ряду распределения рассчитывается по накопленной частоте.
Медиану вычислим в три шага:
1 шаг. Местоположение медианы в ряду рассчитано:
.
2 шаг. Определим медианный интервал.
Из данных таблицы 5.1, столбец 7, видно, что интервал, кумулятивная частота которого равна или впервые превышает 20 – это 3 интервал (74 – 86 млн. руб.), накопленная частота которого F3=27 предприятий.
3 шаг. Вычислим численное значение медианы:
млн. руб., т.е. половина предприятий имеет размер прибыли меньше 80,8 млн. руб., а половина – больше.
г. Показатели вариации для интервальных данных рассчитываются через середины интервалов :
- размах вариации:
104 – 56 = 48 млн. руб.;
- среднее линейное отклонение в интервальном вариационном ряду определяется:
млн. руб.
- дисперсия признака в интервальном ряду рассчитывается по формуле:
;
- среднее квадратическое отклонение:
млн. руб.;
- коэффициент осцилляции:
;
- линейный коэффициент вариации:
;
- коэффициент вариации:
.
Таким образом, вывод о достаточной однородности совокупности сорока предприятий подтверждается: коэффициент вариации и по сгруппированным данным составил величину меньше 20%.
Вывод: средние значения размера прибыли, рассчитанные по массиву несгруппированных данных и дискретному вариационному ряду (п. 1а, 2а) (80 млн. руб.), а также интервальному ряду распределения (80,3 млн. руб.) различаются. Это объясняется тем, что расчет средней по интервальному ряду распределения зависит от середин интервалов, на которые оказывают влияние границы интервалов (верхняя и нижняя границы). А границы интервалов зависят от способа группировки данных и расчетной ширины интервала (hj), которая, к тому же, подвергалась округлению. Если сравнивать значения средних, рассчитанных по интервальному и дискретному рядам со средней, рассчитанной по массиву ранжированных данных, приняв ее за истинное значение, то в нашем случае только средняя, рассчитанная по дискретному ряду, оказалась точной.
Мода в дискретном ряду составляла 76 млн. руб., а в равноинтервальном ряду распределения (табл. 5.1) – 79,1 млн. руб. Расхождения в рассчитанных значениях объясняются тем, что при расчете моды в интервальном ряду распределения, как и при расчете средней, учитываются границы модального интервала (нижняя граница), которые при проведении группировки нередко округляются, что и приводит к погрешности в расчетах. Кроме того, признак внутри групп интервального ряда распределяется неравномерно, а мы при расчете моды подразумеваем его равномерное распределение внутри каждой группы, поэтому рассчитанное значение моды по интервальному ряду можно считать лишь примерными. Таким образом, расчетное значение моды сильно зависит от способа группировки первичных данных и вычисляется примерно. Точное значение моды можно определить только по дискретному вариационному ряду.
Медиана по данным дискретного вариационного ряда составляет 80,5 млн. руб. Она делит совокупность на две равные части: 20 первых предприятий имеют размер прибыли до 80,5 млн. руб. (не включая данное значение), 20 последних предприятий – более 80,5 млн. руб. (не включая данное значение). По равноинтервальному вариационному ряду медиана составила 80,8 млн. руб. (включая это значение). Расхождения в рассчитанных значениях медианы объясняются тем, что в расчетах медианы по интервальным рядам учитывается нижняя граница медианного интервала. Это означает, что значение медианы зависит от способа группировки данных и вычисляется примерно.
4. Все результаты расчетов сведем в таблицу 5.2.
Таблица 5.2
Результаты расчета средних величин и показателей вариации для разных типов исходных данных
Показатель |
Условное обозначение |
Единица измерения |
Значение показателя при разных типах исходных данных |
||
Массив несгруппированных данных |
ДВР (дискретный вариационный ряд) |
ИВР (интервальный вариационный ряд |
|||
Средние величины |
|||||
1. Среде значение |
|
млн. руб. |
80 |
80 |
80,3 |
2. Мода |
|
млн. руб. |
|
76 |
79,1 |
3. Медиана |
|
млн. руб. |
|
80,5 |
80,8 |
Абсолютные и относительные показатели вариации |
|||||
4. Размах вариации |
|
млн. руб. |
60 |
60 |
48 |
5. Среднее линейное отклонение |
|
млн. руб. |
12,5 |
12,5 |
11,2 |
6. Общая дисперсия |
|
|
241 |
241 |
227 |
7. Среднее квадратическое отклонение |
|
млн. руб. |
15,5 |
15,5 |
15,1 |
Относительные показатели вариации |
|||||
8. Коэффициент осцилляции |
|
% |
75 |
75 |
60 |
9. Линейный коэффициент вариации |
|
% |
15,6 |
15,6 |
13,9 |
10. Коэффициент вариации |
|
% |
19,4 |
19,4 |
18,8 |