Введение
Роль статистики в нашей жизни настолько значительна, что люди, зачастую и не осознавая этого, постоянно используют элементы статистической методологии не только в трудовых процессах, но и повседневном быту. Работая и отдыхая, общаясь с другими людьми, принимая какие-то решения, человек пользуется определенной системой сведений, сложившихся вкусов и привычек, фактов; он систематизирует, сопоставляет эти факты, анализирует их, делает необходимые для себя выводы и принимает решения и действия. Таким образом, в каждом человеке заложены элементы статистического мышления.
Данное пособие поможет разобраться с основами общей теории статистики.
Таким образом, цель учебного пособия заключается в формировании у студентов системы знаний об особенностях статистических методов, их роли в экономической практике, преимуществах и возможностях статистического анализа.
Учебное пособие структурировано в соответствии с логикой освоения материала.
Учебное пособие предназначено для студентов, обучающихся по направлению подготовки «Экономика» и выполнено в соответствии с государственным образовательным стандартом высшего профессионального образования. Учебное пособие в рамках базовой дисциплины «Статистика» направлено на студентов, осваивающих компетенции на пороговом уровне.
В результате освоения дисциплины обучающийся должен:
знать:
- основные социально-значимые проблемы и процессы, происходящие в обществе (экономические, социальные), методы прогнозирования;
- основные показатели статистики;
- методики расчета экономических показателей;
уметь:
- анализировать основные закономерности экономических и социальных процессов на основе имеющихся фактических данных;
- делать прогноз на ближайшее будущее, применяя статистические методы;
владеть:
- методами обработки исходной информации,
- методами прогнозирования.
I. Примеры решения задач
Статистическая сводка и группировка материалов статистического наблюдения. Ряды распределения.
Пример 1.1. Имеются данные (таблица 1) о деятельности предприятия отрасли за 2007 г. На основе данных о числе цехов на каждом предприятии создать дискретный ряд распределения.
Таблица 1
|
Предприя-тия |
Число цехов, ед. |
Число рабочих, чел. |
Объем производства, тыс. шт. |
Затраты на производство, млн. руб. |
Фонд заработной платы, тыс. руб. |
|
1 |
4 |
480 |
980 |
116,0 |
4608,0 |
|
2 |
4 |
260 |
540 |
66,8 |
3026,4 |
|
3 |
7 |
130 |
280 |
39,3 |
1950,0 |
|
4 |
9 |
190 |
400 |
52,8 |
2622,0 |
|
5 |
4 |
130 |
280 |
36,0 |
1612,0 |
|
6 |
8 |
420 |
860 |
94,0 |
4914,0 |
|
7 |
6 |
410 |
840 |
92,5 |
4456,7 |
|
8 |
9 |
350 |
720 |
80,7 |
3430,0 |
|
9 |
6 |
460 |
940 |
102,4 |
7005,8 |
|
10 |
6 |
210 |
440 |
56,0 |
2982,0 |
|
11 |
9 |
370 |
760 |
83,2 |
3947,9 |
|
12 |
8 |
180 |
380 |
46,7 |
2754,0 |
|
13 |
4 |
210 |
440 |
56,0 |
2520,0 |
|
14 |
7 |
380 |
780 |
94,0 |
5130,0 |
|
15 |
7 |
370 |
760 |
91,4 |
4329,0 |
|
16 |
5 |
110 |
240 |
34,0 |
1364,0 |
|
17 |
8 |
400 |
820 |
90,6 |
6000,0 |
|
18 |
8 |
340 |
700 |
78,6 |
4080,0 |
|
19 |
5 |
310 |
640 |
78,6 |
3887,4 |
|
20 |
5 |
250 |
520 |
66,8 |
2882,5 |
Решение:
Проведем ранжирование первичного ряда, т.е. расположение всех вариант (числа цехов) в возрастающем порядке. Определяем частоты появления варианты (ni) в данной совокупности. Далее находим накопленные частоты (nxi). Находим частости (wi =ni/n) как отношение частоты к объему совокупности. И, наконец, суммированием частот всех предшествующих интервалов определяем накопленную частоту Fi. Результаты заносим в таблицу 2, которая отображает полученный дискретный ряд распределения.
Таблица 2
|
Число цехов (варианта), i |
Количество предприятий с данным числом цехов (частота), ni |
Накопленные частоты, nxi |
Частости, wi |
Накопленные относительные частоты, Fi |
|
4 |
4 |
4 |
0,2 |
0,2 |
|
5 |
3 |
7 |
0,15 |
0,35 |
|
6 |
3 |
10 |
0,15 |
0,5 |
|
7 |
3 |
13 |
0,15 |
0,65 |
|
8 |
4 |
17 |
0,2 |
0,85 |
|
9 |
3 |
20 |
0,15 |
1 |
|
Σ |
20 |
|
1 |
|
Пример 1.2. Используя данные о суммах затрат на производство из задачи 1 построить группировку предприятий с равными интервалами. Каждую группу охарактеризовать: количеством предприятий, числом цехов и числом рабочих всего.
Решение:
Выберем число интервалов группировки, используя формулу Стэрджеса:
k=1+3.32*lg(n)
n = 20, k=1+3.32*lg(20) ≈ 5
Находим ширину каждого из интервалов одинаковой ширины по следующей формуле:
![]()
Далее на основании первичной выборки распределяем варианты выборки по интервалам группировки, т.е. подсчитываем повторяемость вариант в каждом интервале. Для каждого интервала подсчитываем количеством предприятий, числом цехов и числом рабочих всего. Результаты заносим в таблицу 3.
Таблица 3
|
№ группы |
Группы предприятий по суммам затрат на производство, млн. руб. (границы интервалов группы) |
Количество предприятий в группе (ni) |
Накопленные частоты (nxi) |
Количество цехов в группе |
Количество рабочих в группе | |
|
xi (ниж.) |
xi (верх.) |
|
|
|
| |
|
1 |
34 |
50,4 |
4 |
4 |
24 |
550 |
|
2 |
50,4 |
66,8 |
3 |
7 |
19 |
610 |
|
3 |
66,8 |
83,2 |
5 |
12 |
31 |
1510 |
|
4 |
83,2 |
99,6 |
6 |
18 |
45 |
2350 |
|
5 |
99,6 |
116 |
2 |
20 |
10 |
940 |
|
Σ |
|
|
20 |
|
129 |
5960 |
Задание 1.3. На основе исчисленных данных задач 1 и 2 построить:
– полигон распределения предприятий по числу цехов;
– гистограмму распределения предприятий по сумме затрат на производство;
– кумуляту распределения предприятий по числу цехов.
На графиках указать медиану и моду распределения и проверить значения аналитически.
Решение:
i Me Mo
Рис. 1. Полигон распределения предприятий по числу цехов.
Мода (Mo) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины ∑|xi - Me|=min.
Определим ранг медианы для таблицы 2.

![]()
Медианой в данном случае может быть любое число между 3 и 4 членами ряда. Для определенности в данном случае в качестве медианы возьмем среднее арифметическое этих двух значений, т.е.
![]()
По определению мода в данном случае будет Mo = 3 – как признак, повторяющийся с наибольшей частотой.
i Me Mo



Рис. 2. Гистограмма распределения предприятий по сумме затрат на производство.
Определим модe и медианe по интервальному рядe для таблицы 3 на основе следующих формул:

где x0 – нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту);
h – величина модального интервала;
nMo – частота модального интервала;
nMo-1 – частота интервала, предшествующего модальному;
nMo+1 – частота интервала, следующего за модальным.
В нашем случае x0=83,2
![]()

где x0 – нижняя граница медианного интервала (медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот);
h– величина медианного интервала;
nXMe-1 – накопленная частота интервала, предшествующего медианному;
nMe – частота медианного интервала.
Нижняя граница медианного интервала x0 = 66,8

Абсолютные и относительные величины
Пример 2.1. По предприятию за отчетный год имеются следующие данные о выпуске продукции:
Таблица 2
|
Наименование продукции |
План на I квартал, тыс. шт. |
Фактический выпуск, тыс. шт. |
Отпускная цена за ед., руб. | ||
|
январь |
февраль |
март | |||
|
1 |
453 |
110 |
200 |
170 |
2200 |
|
2 |
125 |
80 |
115 |
96 |
2700 |
Определить процент выполнения квартального плана по выпуску каждого вида продукции и в целом по выпуску всей продукции.
Решение:
Для определения процента выполнения квартального плана рассчитаем показатель сравнения реально достигнутых результатов с намеченными ранее.
,
где
Ф – достигнутый уровень в текущем периоде;
П – план на этот же период.
а) для продукции №1:
П1 = 453; Ф1 = 110+200+170 = 480 тыс. шт.
ОПВП1 = Ф1/П1*100 = 480/453*100 = 105,9 %
б) для продукции №2:
П2 = 125; Ф2 = 80+115+96 = 291 тыс. шт.
ОПВП2 = Ф2/П2*100 = 291/125*100 = 232,8 %
в) для всей продукции в целом:
Для расчета процента выполнения плана по выпуску всей продукции необходимо определить общий итог продукции по плану и фактический в денежном выражении:
SП3 = k1*П1+ k2*П2 = 2200*453 + 2700*125 = 1334100 тыс. руб.;
SФ3 = k1*Ф1+ k2*Ф2 = 2200*480 + 2700*291 = 1841700 тыс. руб.;
Тогда процент выполнения плана по выпуску всей продукции:
ОПВП3 = SФ3/SП3*100 = 1841700/1334100 *100 = 138,05 %
Пример 2.2. В прошлом году объем товарооборота по торговому предприятию составил 367,0 млн. руб. Планом текущего было предусмотрено довести объем товарооборота до 550,0 млн. руб.; фактический объем товарооборота в текущем году составил 565,0 млн. руб.
Определить: относительную величину планового задания по росту товарооборота; относительную величину динамики товарооборота; относительную величину выполнения плана по товарообороту.
Решение:
а) Относительную величину планового задания вычисляем отношением уровня, запланированного на предстоящий период (П), к уровню показателя, достигнутому в предыдущем периоде (Ф0):
![]()
Ф0 =367,0 млн. руб; П = 550,0 млн. руб.;
Тогда
=149,8
%
б) Относительную величину динамики товарооборота вычисляем делением уровня признака за определенный период или момент времени на уровень этого же показателя в предыдущий период или момент времени:
ОПД = Ф1 /Ф0*100
Ф0 =367,0 млн. руб; Ф1= 565,0 млн. руб.;
Тогда ОПД = Ф1 /Ф0*100 = 565.367*100= 153,95 %
в) Относительную величину выполнения плана по товарообороту (сравнения реально достигнутых результатов с намеченными ранее )вычисляем как отношение достигнутого уровня в текущем периоде к плану на этот же период:
![]()
Ф1 – достигнутый уровень в текущем периоде; П – план на этот же период.
Ф1 =565,0 млн. руб.; П = 550,0 млн. руб.;
=
102,72
%
Пример 2.3. Потребление электроэнергии в области характеризуется следующими данными: 2006 г. – 70,1 млрд. кВт∙ч; 2007 г. – 76,8 млрд. кВт∙ч. Численность населения области составила: на 1 января 2006 г. – 9,2 млн. чел.; на 1 января 2007 г. – 9,5 млн.чел.; на 1 января 2008 г. – 9,8 млн. чел.
Определить, на сколько процентов изменится потребление электроэнергии на душу населения.
Решение:
Потребление электроэнергии на душу населения определим по следующей формуле:
, где
А - потребление электроэнергии за год,
Nср – среднегодовая численность населения.
Запишем данные из условия задачи:
А2006 = 70,1 млрд. кВт∙ч; А2007 = 76,8 млрд. кВт∙ч;
Данные по численности на 1 января соответствующего года.
N2006 = 9,2 млн. чел.; N2007 = 9,5 млн. чел.; N2008 = 9,8 млн. чел.;
Получаем для 2006 г.:
![]()
для 2007 г.:
![]()
Тогда относительная величина динамики:
ОПД = Y2/Y1*100 = 7958/7497*100 = 106,15 %
Т.е. потребление электроэнергии на душу населения увеличится на 6,15 %.
Me

Рис. 3. Кумулята распределения предприятий по числу цехов.
Средние величины
Пример 3.1. По данным задачи (2.1) определить средний фактический выпуск продукции по фирме в целом.
Решение:
Определим средний фактический выпуск продукции по фирме в целом по формуле средней арифметической взвешенной:
,
где wi
– вес (отпускная цена) i
– ой продукции
Фi – фактический выпуск i – ой продукции
Возьмем данные из задания 2.1:
Ф1 = 480 тыс. шт.; Ф2 = 291 тыс. шт.; w1 = 2200 руб.; w2 = 2700 руб.;
Тогда
![]()
Пример 3.2. Используя данные задачи 1.1, определить: среднюю заработную плату одного рабочего; модальное и медианное значение затрат на производство.
Решение:
Внесем данные задачи 1.1. в таблицу 1 и рассчитаем среднюю заработную плату одного рабочего для каждого предприятия (группы):
,
где
- средняя заработная
плата одного рабочего в группе (на
предприятии), N
– количество рабочих на предприятии
Теперь занесем данные в таблицу и рассчитаем среднюю групповую зарплату, т.е. среднюю заработную плату одного рабочего по всем предприятиям:
,
где n
– количество предприятий
Тогда
![]()
Таблица 1.
|
Предприятия |
Число рабочих, чел. |
Объем производства, тыс. шт. |
Затраты на производство, млн. руб. |
Фонд заработной платы, тыс. руб. |
Средняя з/п на 1 рабочего |
|
1 |
480 |
980 |
116,0 |
4608,0 |
9,6 |
|
2 |
260 |
540 |
66,8 |
3026,4 |
11,64 |
|
3 |
130 |
280 |
39,3 |
1950,0 |
15 |
|
4 |
190 |
400 |
52,8 |
2622,0 |
13,8 |
|
5 |
130 |
280 |
36,0 |
1612,0 |
12,4 |
|
6 |
420 |
860 |
94,0 |
4914,0 |
11,7 |
|
7 |
410 |
840 |
92,5 |
4456,7 |
10,87 |
|
8 |
350 |
720 |
80,7 |
3430,0 |
9,8 |
|
9 |
460 |
940 |
102,4 |
7005,8 |
15,23 |
|
10 |
210 |
440 |
56,0 |
2982,0 |
14,2 |
|
11 |
370 |
760 |
83,2 |
3947,9 |
10,67 |
|
12 |
180 |
380 |
46,7 |
2754,0 |
15,3 |
|
13 |
210 |
440 |
56,0 |
2520,0 |
12 |
|
14 |
380 |
780 |
94,0 |
5130,0 |
13,5 |
|
15 |
370 |
760 |
91,4 |
4329,0 |
11,7 |
|
16 |
110 |
240 |
34,0 |
1364,0 |
12,4 |
|
17 |
400 |
820 |
90,6 |
6000,0 |
15 |
|
18 |
340 |
700 |
78,6 |
4080,0 |
12 |
|
19 |
310 |
640 |
78,6 |
3887,4 |
12,54 |
|
20 |
250 |
520 |
66,8 |
2882,5 |
11,53 |
|
Σ |
|
|
|
|
250,88 |
Модальное и медианное значение затрат на производство рассчитано в примере 1.1.
Пример 3.3. Известны данные о перевозке грузов по автотранспортному предприятию: январь – 35 тыс. т.; февраль – 37 тыс. т.; март – 42 тыс. т.; апрель – 45 тыс. т. Определить среднемесячный темп роста объема грузовых перевозок..
Решение:
Обозначим:
P1 = 35 тыс. т.; P2 = 37 тыс. т.; P3 = 42 тыс. т.; P4 = 45 тыс. т.;
Коэффициенты роста объема грузовых перевозок с переменной базой определяются следующим образом:
Tp1 = P2/ P1 = 37/35 = 1,057;
Tp2 = P3/ P2 = 42/37 = 1,135;
Tp1 = P4/ P3 = 45/42 = 1,071;
Тогда среднемесячный темп роста объема грузовых перевозок определится по формуле средней геометрической:
,
т.е.
=
1,087 или 108,7 %
(средний темп роста)
Пример 4.1. Распределение торговых фирм по размеру месячного товарооборота характеризуется следующими данными:
Таблица 4
|
Товарооборот, млн. руб. |
До 5 |
5-10 |
10-15 |
15-20 |
20-25 |
25 и более |
Итого |
|
Число фирм |
20 |
26 |
20 |
14 |
10 |
10 |
100 |
Определить средний размер месячного товарооборота на одну фирму.
Решение:
Для расчета будем использовать формулу средней арифметической взвешенной:
,
где x’
– товарооборот; f
– число фирм
Для каждого интервала предварительно вычислим среднее значение признака как полусумму нижнего и верхнего значений интервала. Величина открытых интервалов приравнивается к величине примыкающих к ним соседних интервалов:
![]()
Тогда
=
(2,5*20+7,5*26+12,5*20+17,5*14+22,5*10+27,5*10)/2
12,4
млн. руб.
- средний
размер месячного товарооборота на одну
фирму.
Пример 4.2. Определить за какой месяц и на сколько процентов была выше средняя месячная заработная плата работников предприятия, если известно:
Таблица 5
|
Цеха |
Сентябрь |
Октябрь | ||
|
Численность работников |
Средняя месячная заработная плата одного работника, руб. |
Средняя месячная заработная плата одного работника, руб. |
Фонд заработной платы, руб. | |
|
1 |
130 |
6800 |
6850 |
924750 |
|
2 |
140 |
7300 |
7140 |
999600 |
|
3 |
170 |
6970 |
6975 |
1185750 |
Решение:
Введем условные обозначения для сентября:
f – численность работников по каждому цеху;
x - средняя месячная заработная плата работников каждого цеха.
Определяющий показатель – общий фонд заработной платы Σx f.
Средняя месячная заработная плата работников предприятия за сентябрь составила:
7024,77
руб.
Условные обозначения для октября следующие:
w – фонд заработной платы по каждому цеху;
x - средняя месячная заработная плата работников каждого цеха.
Определяющий показатель – общий фонд заработной платы Σw.
Среднюю месячную заработную плату работников предприятия за октябрь вычисляем по формуле средней арифметической взвешенной:
6988,98
руб.
Динамика средней месячной заработной платы работников
0,9949
или 99,49 %
Следовательно, средняя месячная заработная плата работников предприятия в октябре понизилась на 0,51 % по сравнению с сентябрем.
Пример 4.3. При изучении покупательского спроса в обувных отделах торгового комплекса «Москва» получены следующие данные о распределении продаж мужской летней обуви по размерам:
Таблица 6
|
Размер |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
Итого |
|
Число проданных пар |
4 |
4 |
8 |
13 |
19 |
8 |
4 |
60 |
Проведите частотный анализ распределения и сделайте выводы. Для этого:
1) замените групповые частоты частостями;
2) для каждой группы определите кумулятивные частости;
3) постройте кумуляту распределения.
Решение:
Занесем данные (варианты и групповые частоты) задания в таблицу 7.
Далее находим частости (wi =ni/n) как отношение частоты к объему совокупности. И, наконец, суммированием частот всех предшествующих интервалов определяем кумулятивные частости Fi. Результаты также заносим в таблицу 7.
Таблица 7
|
Размер (варианта), i |
Число проданных пар (частота), ni |
Частости, wi |
Кумулятивные частости, Fi |
|
38 |
4 |
0,07 |
0,07 |
|
39 |
4 |
0,07 |
0,13 |
|
40 |
8 |
0,13 |
0,27 |
|
41 |
13 |
0,22 |
0,48 |
|
42 |
19 |
0,32 |
0,80 |
|
43 |
8 |
0,13 |
0,93 |
|
44 |
4 |
0,07 |
1,00 |
|
Σ |
60 |
1 |
|
Построим график распределения кумулятивных частостей (рис. 4.)
i
Р

Статистическое изучение вариации
Пример 5.1. По данным задачи (1.2) вычислить показатели вариации. Сделать выводы.
Решение:
Построим таблицу 1 и внесем туда часть данных из задания 1.2.
Рассчитаем середины интервалов x, произведение xf и внесем эти данные в таблицу 1.
Среднее значение определим по формуле средней арифметической взвешенной
![]()
Таблица 1
|
Группы предприятий по суммам затрат на производство, млн. руб. (границы интервалов группы) |
Количество предприятий в группе (fi) |
Середина интервала (х) |
хf |
|
|
| |
|
xi (ниж.) |
xi (верх.) |
|
|
|
|
|
|
|
34 |
50,4 |
4 |
42,2 |
168,80 |
-31,98 |
1022,72 |
4090,88 |
|
50,4 |
66,8 |
3 |
58,6 |
175,80 |
-15,58 |
242,74 |
728,21 |
|
66,8 |
83,2 |
5 |
75 |
375,00 |
0,82 |
0,67 |
3,36 |
|
83,2 |
99,6 |
6 |
91,4 |
548,40 |
17,22 |
296,53 |
1779,17 |
|
99,6 |
116 |
2 |
107,8 |
215,60 |
33,62 |
1130,30 |
2260,61 |
|
Σ |
|
20 |
|
|
|
|
8862,232 |
Произведем расчет показателей вариации, используя данные таблицы 1:
1)
Размах вариации
= 116 – 34 =82 тыс. руб
2)
дисперсия:
![]()
3)
СКО:
4)
КВ (коэффициент вариации) : ![]()
Пример 5.2. Для установления зависимости между урожайностью и сортом винограда в одном из хозяйств на основе выборки определили урожай на 10 кустах винограда:
Таблица 7
|
Сорт |
Число кустов |
Урожай с одного куста, кг. | ||||
|
1 |
2 |
3 |
4 |
5 | ||
|
Изабелла |
3 |
6 |
5 |
7 |
– |
– |
|
Мускат |
5 |
7 |
6 |
8 |
5 |
9 |
|
Лидия |
2 |
9 |
7 |
– |
– |
– |
С помощью эмпирического корреляционного соотношения определить степень влияния признака, положенного в основу группировки на вариацию результативного показателя. Сформулировать выводы.
Решение:
Для решения задания составим новую таблицу 7.2, в которую внесем суммарные данные по объему урожая для каждого сорта.
Рассчитаем
для каждой группы средние значения
,
произведение
и
внесем эти данные в таблицу 7.2.
Групповое среднее значение определим по формуле средней арифметической взвешенной
![]()
Таблица 7.2
|
Сорт |
Число кустов (f) |
Урожай в целом, кг (xf) |
Урожай в среднем на один куст, кг (x) |
|
|
|
|
Изабелла |
3 |
18 |
6 |
-0,9 |
0,81 |
2,43 |
|
Мускат |
5 |
35 |
7 |
0,1 |
0,01 |
0,05 |
|
Лидия |
2 |
16 |
8 |
1,1 |
1,21 |
2,42 |
|
Сумма |
10 |
69 |
|
|
|
4,9 |
|
Среднее |
|
|
6,9 |
|
|
|
Вычислим межгрупповую дисперсию по формуле:

Теперь вычислим общую дисперсию урожайности винограда на основе индивидуальных (несгруппированных) данных по формуле
![]()
Для этого создадим таблицу 7.3. и внесем туда данные из таблицы 7.
Таблица 7.3
|
Урожай с одного куста, кг. (y) |
y2 |
|
6 |
36 |
|
5 |
25 |
|
7 |
49 |
|
7 |
49 |
|
6 |
36 |
|
|
0 |
|
8 |
64 |
|
5 |
25 |
|
9 |
81 |
|
9 |
81 |
|
7 |
49 |
|
Σ |
495 |
![]()
тогда эмпирический коэффициент детерминации:
или
25,92%
![]()
Коэффициент детерминации говорит о том, что вариация урожайности винограда на 25,92% зависит от вариации сорта винограда и на 74,08% от прочих факторов.
Исходя
из значений таблицы Чеддока можно
заключить, что эмпирическое корреляционное
отношение
свидетельствует о заметной силе связи
между сортом винограда и его урожайностью.
Пример 5.3. Имеются следующие данные о балансовой прибыли предприятий за два квартала:
Таблица 8
|
Квартал |
Число предприятий |
Балансовая прибыль, млн. руб. |
|
I |
3 |
18,4; 38,8; 72,6 |
|
II |
4 |
14,1; 16,3; 48,8; 27,9 |
Определите:
1) среднюю из внутригрупповых, межгрупповую и общую дисперсию балансовой прибыли предприятия;
2) коэффициент детерминации и эмпирическое корреляционное отношение.
Сделайте выводы.
Решение:
Для решения задания составим новую таблицу 8.2, в которую внесем суммарные данные по объему урожая для каждого сорта.
Рассчитаем
для каждой группы средние значения
,
произведение
и
внесем эти данные в таблицу 8.2.
Групповое среднее значение определим по формуле средней арифметической взвешенной
![]()
Таблица 8.2
|
Квартал |
Число предприятий(f) |
Балансовая прибыль всего, (xf) |
Балансовая прибыль в группе в среднем, млн. руб. (x) |
|
|
|
|
I |
3 |
129,80 |
43,27 |
9,42 |
88,81 |
266,42 |
|
II |
4 |
107,10 |
26,78 |
-7,07 |
49,95 |
199,82 |
|
Сумма |
7 |
236,90 |
|
|
|
466,24 |
|
Среднее |
|
|
33,84 |
|
|
|
Вычислим внутригрупповую дисперсию внутри 1-ой и 2-ой группы:
, где
-
групповая средняя.
Для расчетов используем таблицу 8.3
Таблица 8.3
|
Квартал |
Балансовая прибыль предприятия млн. руб. (x) |
x2 |
|
|
|
I |
18,4 |
338,56 |
-24,87 |
618,35 |
|
38,8 |
1505,44 |
-4,47 |
19,95 | |
|
72,6 |
5270,76 |
29,33 |
860,44 | |
|
Сумма |
|
|
|
1498,75 |
|
Среднее |
43,27 |
|
|
|
|
II |
14,1 |
198,81 |
-12,68 |
160,66 |
|
16,3 |
265,69 |
-10,48 |
109,73 | |
|
48,8 |
2381,44 |
22,03 |
485,10 | |
|
27,9 |
778,41 |
1,13 |
1,27 | |
|
Сумма |
|
|
|
756,75 |
|
Среднее |
26,78 |
|
|
|
|
Сумма всего |
|
388,8195918 |
|
|
Тогда
=
499,58
=
189,19
Средняя из внутригрупповых дисперсий исчисляется как
,
где f
– частота появления внутригрупповой
дисперсии одной величины (одного
размера).
=
322,21
Вычислим межгрупповую дисперсию, используя данные из таблицы 8.2. по формуле:

Теперь вычислим общую дисперсию балансовой прибыли на основе индивидуальных (несгруппированных) данных, используя данные таблицы 8.2 и 8.3 по формуле
=
![]()
Это же значение можно получить, используя формулу:
=
322,21 + 66,61 = 388,2
2) эмпирический коэффициент детерминации:
или
17,13%
Тогда эмпирическое корреляционное отношение
![]()
Коэффициент детерминации говорит о том, что вариация балансовой прибыли на 17,13% зависит от вариации квартала и на 82,87% от прочих факторов.
Исходя
из значений таблицы Чеддока можно
заключить, что эмпирическое корреляционное
отношение
свидетельствует об умеренной силе
связи между номером квартала и балансовой
прибылью предприятия.
Пример 5.4. Удельный вес основных рабочих в трех цехах предприятия составил: 70, 75, и 95% общей численности рабочих.
Определить дисперсию и среднее квадратическое отклонение доли основных рабочих по предприятию в целом, если численность всех рабочих трех цехов составило соответственно 150, 250 и 200 человек соответственно.
Решение:
Рабочие предприятия подразделяются на две группы: основные и ремонтно-вспомогательные рабочие.
Общая численность основных рабочих по предприятию в целом составит:
Σn0 = 0,7 • 150 + 0,75 • 250 + 0,95 • 200 = 482,5 ≈ 483 человека.
Доля основных рабочих по предприятию
р = Σn0 / Σn = 483/(150+250+200) = 0,805.
Дисперсия альтернативного признака
σ2 = p*q
где р - доля единиц, обладающих данным признаком (доля основных рабочих);
q - доля единиц, не обладающих данным признаком (доля ремонтно-вспомогательных рабочих).
Поскольку р + q = 1, следовательно, q = 1 - р и формула дисперсии имеет вид:
σ2 = p*(1-p) = 0,805*(1-0,805) = 0,157
Среднее квадратическое отклонение доли основных рабочих по предприятию в целом:
=
0,3962
Пример5.5. Распределение семей сотрудников финансовой корпорации по количеству детей характеризуется следующими данными:
Таблица 9
|
Количество детей в семье |
Число семей сотрудников по подразделениям | ||
|
1-е |
2-е |
3-е | |
|
0 |
4 |
7 |
5 |
|
1 |
6 |
10 |
13 |
|
2 |
3 |
3 |
3 |
|
3 |
2 |
1 |
- |
Определите:
1) внутригрупповые дисперсии;
2) среднюю из внутригрупповых дисперсий;
3) межгрупповую дисперсию;
4) общую дисперсию.
Проверьте правильность произведённых расчётов с помощью правила сложения дисперсий и рассчитайте эмпирическое корреляционное отношение.
Решение:
Для расчета общей дисперсии составим дискретный ряд распределения, промежуточные расчеты поместим в таблицу 9.2.
Таблица 9.2
|
Число семей, (x) |
Количество повторов числа семей, (f) |
xf |
|
|
|
|
1 |
1 |
1,00 |
-4,18 |
17,49 |
17,49 |
|
2 |
1 |
2,00 |
-3,18 |
10,12 |
10,12 |
|
3 |
3 |
9,00 |
-2,18 |
4,76 |
14,28 |
|
4 |
1 |
4,00 |
-1,18 |
1,40 |
1,40 |
|
5 |
1 |
5,00 |
-0,18 |
0,03 |
0,03 |
|
6 |
1 |
6,00 |
0,82 |
0,67 |
0,67 |
|
7 |
1 |
7,00 |
1,82 |
3,31 |
3,31 |
|
10 |
1 |
10,00 |
4,82 |
23,21 |
23,21 |
|
13 |
1 |
13,00 |
7,82 |
61,12 |
61,12 |
|
Сумма |
11 |
57 |
|
|
131,64 |
Тогда групповое среднее значение определим по формуле средней арифметической взвешенной
57/11
= 5,18
Тогда общая дисперсия будет равна:
131,64/11
= 11,97
Величина этой дисперсии характеризует число семей с количеством детей от 0 до 3 под влиянием всех условий.
Различия в величине изучаемого признака прежде всего возникают под влиянием типа подразделения финансовой корпорации. В связи с этим в совокупности выделяются 3 группы по номеру подразделения. Определим для каждой из выделенных групп внутригрупповую дисперсию, возникающую под влиянием неучтенных факторов. Для их расчета используем вспомогательные таблицы 9.3 (1-е подразделение), 9.4 (2-е подразделение) и 9.5 (3-е подразделение):
Таблица 9.3.
|
Количество детей в семье |
Число семей, (x) |
Количество повторов числа семей, (f) |
xf |
|
|
|
|
0 |
4 |
1 |
4,00 |
0,25 |
0,06 |
0,06 |
|
1 |
6 |
1 |
6,00 |
2,25 |
5,06 |
5,06 |
|
2 |
3 |
1 |
3,00 |
-0,75 |
0,56 |
0,56 |
|
3 |
2 |
1 |
2,00 |
-1,75 |
3,06 |
3,06 |
|
Сумма |
15 |
4 |
15 |
|
|
8,75 |
15/4
= 3,75
Дисперсия будет равна:
8,75/4
= 2,19
Таблица 9.4
|
Количество детей в семье |
Число семей, (x) |
Количество повторов числа семей, (f) |
xf |
|
|
|
|
0 |
7 |
1 |
7,00 |
1,75 |
3,06 |
3,06 |
|
1 |
10 |
1 |
10,00 |
4,75 |
22,56 |
22,56 |
|
2 |
3 |
1 |
3,00 |
-2,25 |
5,06 |
5,06 |
|
3 |
1 |
1 |
1,00 |
-4,25 |
18,06 |
18,06 |
|
Сумма |
21 |
4 |
21 |
|
|
48,75 |
48,75/4
= 5,25
Дисперсия будет равна:
48,75/4
= 12,19
Таблица 9.5
|
Количество детей в семье |
Число семей, (x) |
Количество повторов числа семей, (f) |
xf |
|
|
|
|
0 |
5 |
1 |
5,00 |
-2,00 |
4,00 |
4,00 |
|
1 |
13 |
1 |
13,00 |
6,00 |
36,00 |
36,00 |
|
2 |
3 |
1 |
3,00 |
-4,00 |
16,00 |
16,00 |
|
3 |
0 |
0 |
0,00 |
-7,00 |
49,00 |
0,00 |
|
Сумма |
21 |
3 |
21 |
|
|
56,00 |
21/3
= 7
Дисперсия будет равна:
56/3
= 18,67
Средняя из внутригрупповых дисперсий исчисляется как
,
где f
– частота появления внутригрупповой
дисперсии одной величины (одного
размера).
=
10,32
Вычислим межгрупповую дисперсию, используя данные, полученные выше, по формуле:
1,65
Проверим правильность расчета с помощью правила сложения дисперсий, используя формулу:
=
10,32 + 1,65 = 11,97 , что
совпадает со значением общей дисперсии,
рассчитанной выше.
Определим эмпирический коэффициент детерминации:
0,1378
или 13,78%
Тогда эмпирическое корреляционное отношение
0,3712
Коэффициент детерминации говорит о том, что вариация числа сотрудников на 13,78% зависит от вариации подразделения и на 86,22% от прочих факторов.
Исходя
из значений таблицы Чеддока можно
заключить, что эмпирическое корреляционное
отношение
свидетельствует об умеренной силе
связи между числом сотрудников и номером
подразделения.
Пример 5.6. Дисперсия признака равна 800. Объем совокупности 16. Сумма квадратов индивидуальных значений признака 14096. Найти среднюю величину.
Решение:
Для нахождения средней величины воспользуемся формулой
, где
-
средняя арифметическая из квадратов
индивидуальных значений признака;
-
квадрат среднего значения признака.
Тогда
881
Средняя величина признака:
9
Статистическое изучение динамики
Пример 6.1. Ввод в действие жилых домов предприятиями всех форм собственности в одном из регионов в 1996 – 2003 гг. характеризуется следующими данными (млн. кв. метров общей площади):
Таблица 16
|
1996 |
1997 |
1998 |
1999 |
2000 |
2001 |
2002 |
2003 |
|
17 |
18 |
19 |
20 |
21 |
20 |
22 |
23 |
Для анализа ряда динамики определите:
1) цепные и базисные:
а) абсолютные приросты;
б) темпы роста;
в) темпы прироста;
г) среднегодовой темп прироста;
2) найдите для каждого года абсолютное значение 1% прироста;
3) в целом за весь период рассчитайте среднегодовой абсолютный прирост.
Результаты расчетов оформите в таблице и сделайте выводы.
Решение:
