Сводка и группировка в статистике
Задача 1.Имеются следующие данные о рабочих малого предприятия (табл.1). Постройте аналитическую группировку с целью выявления зависимости выработки рабочего от стажа его работы.
Таблица 1
№ п/п |
Стаж работы, лет |
Месячная выработка рабочего, тыс. руб. |
№ п/п |
Стаж работы, лет |
Месячная выработка рабочего, тыс. руб. |
1 |
1,0 |
200 |
16 |
10,5 |
276 |
2 |
1,0 |
202 |
17 |
1,0 |
234 |
3 |
3,0 |
205 |
18 |
9,0 |
270 |
4 |
6,5 |
290 |
19 |
9,0 |
264 |
5 |
9,2 |
298 |
20 |
6,5 |
252 |
6 |
4,4 |
250 |
21 |
5,0 |
241 |
7 |
6,9 |
280 |
22 |
6,0 |
256 |
8 |
2,5 |
230 |
23 |
10,1 |
262 |
9 |
2,7 |
223 |
24 |
5,5 |
245 |
10 |
16,0 |
310 |
25 |
2,5 |
240 |
11 |
13,2 |
284 |
26 |
5,0 |
244 |
12 |
14,0 |
320 |
27 |
5,3 |
252 |
13 |
11,0 |
295 |
28 |
7,5 |
253 |
14 |
12,0 |
279 |
29 |
7,0 |
252 |
15 |
4,5 |
222 |
30 |
8,0 |
262 |
Решение
Построим ряд распределения рабочих по стажу, образовав 5 групп с равными интервалами. Сначала определим, что факторный признак- это стаж работы, который влияет на значение выработки рабочего, а результативный – выработка, значение которой зависит от стажа работы. Следовательно, группировку производим по стажу рабочих.
Вычислим ширину равного интервала:
Образуем группы рабочих с равным интервалом h: от 1 до 4 лет, от 4 до 7 лет и т.д.. В каждый интервал попадают рабочие со стажем, равным значению нижней границы «от», и не включаются рабочие со стажем, совпадающим с верхней границей интервала «до».
По каждой группе подсчитаем численность рабочих и оформим результаты в виде следующей таблицы.
Таблица 2
Номер группы |
Группы рабочих по стажу, лет |
Число рабочих, чел. |
Число рабочих, % к итогу |
1 |
от 1 до 4 |
7 |
23,3 |
2 |
от 4 до 7 |
10 |
33,3 |
3 |
от 7 до 10 |
0 |
20,0 |
4 |
от 10 до 13 |
4 |
13,3 |
5 |
от 13 до 16 |
3 |
10,1 |
Итого |
- |
30 |
100,0 |
Имеем первичную простую структурную группировку, представленную равноинтервальным вариационным рядом распределения. Результаты группировки показывают, что более половины рабочих (53,3% имеют стаж работы от 4 до 10 лет. Равное число рабочих имеет стаж работы до 4 лет и свыше 10 лет, доля которых равна 23,3%.
Для построения аналитической группировки заполним вспомогательную таблицу, указав рядом с факторным соответствующий ему результативный признак.
Таблица 3
Номер группы |
Группы рабочих по стажу, лет |
Номер рабочего |
Стаж, лет |
Месячная выработка, тыс. руб. |
1 |
От 1 до 4 |
1 |
1,0 |
200 |
|
|
2 |
1,0 |
202 |
|
|
3 |
3,0 |
205 |
|
|
8 |
2,5 |
230 |
|
|
9 |
2,7 |
223 |
|
|
17 |
1,0 |
234 |
|
|
25 |
2,5 |
240 |
|
Итого |
7 |
13,7 |
1534 |
2 |
От 4 до 7 |
6 |
4,4 |
250 |
|
|
4 |
6,5 |
290 |
|
|
15 |
4,5 |
222 |
|
|
20 |
6,5 |
252 |
|
|
21 |
5,0 |
241 |
|
|
22 |
6,0 |
256 |
|
|
24 |
5,5 |
245 |
|
|
26 |
5,0 |
244 |
|
|
27 |
5,3 |
252 |
|
|
7 |
6,9 |
280 |
|
Итого |
10 |
55,6 |
2532 |
3 |
От 7 до 10 |
5 |
9,2 |
298 |
|
|
18 |
9,0 |
270 |
|
|
19 |
9,0 |
264 |
|
|
28 |
7,5 |
253 |
|
|
29 |
7,0 |
252 |
|
|
30 |
8,0 |
262 |
|
Итого |
6 |
49,7 |
1599 |
4 |
От 10 до 13 |
13 |
11,0 |
295 |
|
|
14 |
12,0 |
279 |
|
|
16 |
10,5 |
276 |
|
|
23 |
10,1 |
262 |
|
Итого |
4 |
43,6 |
1112 |
5 |
От 13 до 16 |
10 |
16,0 |
310 |
|
|
11 |
13,2 |
284 |
|
|
12 |
14,0 |
320 |
|
Итого |
3 |
43,2 |
914 |
|
Всего |
30 |
205,8 |
7691 |
По итоговым данным определим средний стаж и выработку рабочих в каждой группе: Средний стаж = Стаж всех рабочих/Число рабочих в группе;
Средняя выработка = Выработка всех рабочих/Число рабочих в группе.
стаж1=13,7/7=1,96 лет |
выработка1=1534/7=219,1 тыс. руб. |
стаж2=55,6/10=5,56 лет |
выработка2=2532/10=253,2 тыс. руб. |
стаж3=49,7/6=8,28 лет |
выработка3=1599/6=266,5 тыс. руб. |
стаж4=43,6/4= 10,9 лет |
выработка4=1112/4= 278,0 тыс. руб. |
стаж5=43,2/3=14,4лет |
выработка5=914/3=304,7 тыс. руб. |
Стаж=205,8/30=6,86 лет Выработка=7691/30=256,4 тыс. руб.
Построим аналитическую простую группировку (табл. 4)
Таблица 4
Номер группы |
Группы рабочих по стажу, лет |
Число рабочих, чел. |
Средний стаж работы, лет |
Месячная выработка, тыс. руб. |
|
всего |
на одного рабочего |
||||
А |
Б |
1 |
2 |
3 |
4 |
1 |
от 1 до 4 |
7 |
1,96 |
1534 |
219,1 |
2 |
от 4 до 7 |
10 |
5,56 |
2532 |
253,2 |
3 |
от 7 до 10 |
0 |
8,28 |
1599 |
266,5 |
4 |
от 10 до 13 |
4 |
10,9 |
1112 |
278,0 |
5 |
от 13 до 16 |
3 |
14,4 |
914 |
304,7 |
Итого |
- |
30 |
6,86 |
7691 |
256,4 |
Сравнивая столбцы 2 и 4 данной таблицы, видим, что с увеличением стажа рабочих растёт месячная выработка продукции. Следовательно, между изучаемыми признаками имеется прямая зависимость.
Построим теперь группировку по двум признакам (то есть комбинированную) – стажу работы и выработке. Для этого необходимо в каждой группе рабочих по стажу выделить группы по второму признаку – средней месячной выработке продукции на одного рабочего. Образуем в каждой группе, выделенной по стажу, три группы рабочих по уровню месячной выработки.
Вычислим ширину интервала:
тыс. руб.
На основании неупорядоченных данных таблицы 3 строим первичную комбинированную группировку по двум признакам.
Таблица 5
№ п/п |
Группы рабочих |
Число рабочих, лет |
Средний стаж рабо ты, лет |
Среднемесячная выработка продукции, тыс. руб. |
||
|
по стажу |
по среднемесячной выработке продукции, руб. |
всего |
на одного рабочего |
||
А |
Б |
В |
1 |
2 |
3 |
4 |
1 |
От 1 до 4 |
200-240 |
6 |
1,87 |
1294 |
215,7 |
|
|
240-280 |
1 |
2,5 |
240 |
240,0 |
|
|
280-320 |
- |
- |
- |
- |
Итого |
|
- |
7 |
1,96 |
1534 |
219,1 |
2 |
От 4 до 7 |
200-240 |
1 |
4,5 |
222,0 |
222,0 |
|
|
240-280 |
7 |
5,4 |
1740,0 |
248,6 |
|
|
280-320 |
2 |
6,7 |
570,0 |
285,0 |
Итого |
|
- |
10 |
5,56 |
2532,0 |
253,2 |
3 |
От 7 до 10 |
200-240 |
- |
- |
- |
- |
|
|
240-280 |
5 |
8,1 |
1301 |
260,2 |
|
|
280-320 |
1 |
9,2 |
298 |
298,0 |
Итого |
|
- |
6 |
8,28 |
1599 |
266,5 |
4 |
От 10 до 13 |
200-240 |
- |
- |
- |
- |
|
|
240-280 |
3 |
10,9 |
817 |
272,8 |
|
|
280-320 |
1 |
11,0 |
295 |
295,0 |
Итого |
|
- |
4 |
10,9 |
1112 |
278,0 |
5 |
От 13 до 16 |
200-240 |
- |
- |
- |
- |
|
|
240-280 |
- |
- |
- |
- |
|
|
280-320 |
3 |
14,4 |
914 |
304,7 |
Итого |
|
- |
3 |
14,4 |
914 |
304,7 |
Итого по подгруппам |
200-240 |
7 |
2,25 |
1516 |
216,6 |
|
|
|
240-280 |
16 |
7,1 |
4098 |
257,2 |
|
|
280-320 |
7 |
11,0 |
2077 |
296,7 |
Всего |
|
- |
30 |
6,88 |
7691 |
260,8 |
Данные таблицы 5 показывают, что выработка продукции рабочих находится в прямой зависимости от стажа работы.
Задача 2. По приведенным ниже данным о квалификации рабочих цеха требуется: а) построить дискретный ряд распределения; б) дать графическое изображение ряда. Тарифные разряды 24 рабочих цеха: 3;6;4;4;2;3;5;4;4;5;2;3;4;4;5;2;3;6;5;4;2;4;3.
Решение
а) Дискретный ряд распределения имеет вид (табл.1).
Таблица 1
Распределение рабочих цеха по квалификации
Тарифный разряд, х |
Число рабочих,f |
Накопленная частота,S |
2 |
4 |
4 |
3 |
5 |
9 |
4 |
9 |
18 |
5 |
4 |
22 |
6 |
2 |
24 |
Итого |
24 |
- |
б)на рис. 3.1. представлено графическое изображение построенного дискретного вариационного ряда в виде полигона частот. Полигон частот замыкается, для этого крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе (в данном случае х=1 и х=7).
Рис. 3.1. Полигон распределения рабочих цеха по квалификации
Задача 3.Имеются следующие данные о возрастном составе рабочих цеха (лет): 18;38;28;29;26;38;34;22;28;30;22;23;35;33;27;24;30;32;28;25;29;26;31;24;29;27;32;25;29;29. Для анализа распределения рабочих цеха по возрасту требуется: а) построить интервальный ряд распределения; б) графически изобразить ряд.
Решение
а) Величина интервала группировки определяется по формуле: =2,85≈3 года, где n принимаем равным 7.
Интервальный ряд представлен в таблице 1.
Таблица 1
Интервальный ряд распределения
Группы рабочих по возрасту (лет), х |
Число рабочих, f |
Накопленная частота, S |
18-21 21-24 24-27 27-30 30-33 33-36 36-39 |
1 3 6 10 5 3 2 |
1 4 10 20 25 28 30 |
итого |
30 |
- |
б) Графически интервальный вариационный ряд может быть представлен в виде гистограммы, полигона, кумуляты.
На рис.1 представлен интервальный полигон частот. На рис.2 представлена кумулятивная кривая (кумулята).
Рис. 1 Полигон распределения рабочих цеха по возрасту
Рис.2 Кумулята распределения рабочих цеха по возрасту
Средние величины в статистике
Задача 1. Имеются следующие данные о заработной плате рабочих участка (табл.1)
Таблица 1
Профессия |
Количество рабочих |
Заработная плата каждого рабочего за сентябрь, руб. |
Токари |
5 |
4700;4208;1917;3620;4400 |
Фрезеровщики |
2 |
3810;4550 |
Слесари |
3 |
5210;3380;1870 |
Вычислить среднюю месячную заработную плату рабочих участка.
Решение
Процесс выбора средней таков:
а) определяющий показатель - общая сумма начисленной заработной платы;
б) математическое выражение определяющего показателя-
в) замена индивидуальных значений средними -
г) решение уравнения:
Следовательно, использовалась формула простой средней арифметической.
Задача 2. Распределение рабочих участка по стажу работы следующее (табл.1) Определить средний стаж работы рабочих участка.
Таблица 1
Стаж работы, лет |
До 5 лет |
5-10 |
10-15 |
15 и более |
Количество рабочих |
2 |
6 |
15 |
7 |
Решение
Определяющий показатель – общий стаж работы всех рабочих- .
Средний стаж работы- лет.
Для каждого интервала предварительно вычислялось среднее значение признака как полусумма нижнего и верхнего значения интервала. Величина открытых интервалов приравнивается к величине примыкающих к ним соседних интервалов:
Для решения задачи использовалась формула средней арифметической взвешенной.
Задача 3. За два месяца по цехам завода имеются следующие данные (табл.1.) Определить за какой месяц и на сколько процентов была выше средняя месячная заработная плата работников предприятия.
Решение
Введем условные обозначения для сентября:
f -численность работников по каждому цеху;
x-средняя месячная заработная плата работников каждого цеха;
определяющий показатель- общий фонд заработной платы-
Таблица 1
№ цеха |
Сентябрь |
Октябрь |
||
Численность работников |
Средняя месячная заработная плата, руб. |
Средняя месячная заработная плата, руб. |
Фонд заработной платы, руб. |
|
1 |
140 |
3560 |
3600 |
486000 |
2 |
200 |
3600 |
3580 |
751800 |
3 |
260 |
3330 |
3340 |
835000 |
Средняя месячная заработная плата работников предприятия за сентябрь составила:
руб.
Условные обозначения для октября следующие:
w -фонд заработной платы по каждому цеху;
-средняя месячная заработная плата работников каждого цеха;
определяющий показатель –
Средняя месячная заработная плата работников предприятия за октябрь равна:
где - численность работников каждого цеха в октябре.
Средняя месячная заработная плата в октябре исчислена по формуле взвешенной гармонической.
Динамика средней месячной заработной платы работников предприятия:
или 100.3%
Следовательно, средняя месячная заработная плата работников предприятия в октябре повысилась на 0.3% по сравнению с сентябрем.
Задача 4. Проведена малая выборка из партии электрических лампочек для определения продолжительности их службы. Результаты представлены в табл.1. Определить моду и медиану.
Таблица 1
№ лампочки |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Срок горения, ч. |
1450 |
1400 |
1370 |
1430 |
1400 |
1380 |
1270 |
1420 |
1400 |
Решение
Для определения моды и медианы производится ранжирование данных.
Ранжированный ряд: 1270, 1370, 1380, 1400, 1400, 1400, 1420, 1430, 1450.
Мода- ч (1400-значение признака, встречающееся три раза).
Место медианы-
Ме=1400 ч (1400- значение признака, находящееся на 5-м месте в ранжированном ряду).
. Показатели вариации и анализ частотного распределения
Задача 1. По приведенным ниже данным о квалификации рабочих требуется вычислить показатели вариации. Тарифные разряды 24 рабочих цеха: 4;3;6;4;4;2;3;5;4;4;5;2;3;4;4;5;2;3;6;5;4;2;4;3.
Решение
Построим дискретный ряд распределения (табл.1).
Вычислим среднюю арифметическую взвешенную:
разряда.
Таблица 1
Распределение рабочих цеха по квалификации
Тарифный разряд, х |
Число рабочих,f |
Накопленная частота,S |
2 3 4 5 6 |
4 5 9 4 2 |
4 9 18 22 24 |
итого |
24 |
- |
К показателям вариации относятся: среднее линейное отклонение (), среднее квадратическое отклонение (), коэффициент вариации (v). Для расчета показателей ряда распределения удобно использовать вспомогательную таблицу 2.
= разряда;
разряда;
Таблица 2
Расчет показателей вариации
Тарифный разряд, х |
Число рабочих,f |
d= x- |
|
|
2 3 4 5 6 |
4 5 9 4 2 |
-1,8 -0,8 +0,2 +1,2 +2,2 |
7,2 4,0 1,8 4,8 4,4 |
12,96 3,20 0,36 5,76 9,68 |
Итого |
24 |
|
22,2 |
31,96 |
Следовательно, индивидуальные значения отличаются в среднем от средней арифметической на 1.15 разряда, или на 30.3%.
Среднее квадратическое отклонение превышает среднее линейное отклонение в соответствии со свойствами мажорантности средних.
Значение коэффициента вариации (30.3 %) свидетельствует о том, что совокупность достаточно однородна.
Задача 2. Имеются следующие данные о возрастном составе рабочих цеха (лет): 18; 38; 28; 29; 26; 38; 34; 22; 28; 30; 22; 23; 35; 33; 27; 24; 30; 32; 28; 25; 29; 26; 31; 24; 29; 27; 32; 25; 29; 29. Для анализа распределения рабочих цеха по возрасту: построить интервальный ряд распределения; исчислить показатели вариации.
Решение Построим интервальный ряд распределения.(табл. 1)
Таблица 1
Группы рабочих по возрасту (лет), х |
Число рабочих, f |
Накопленная частота, S |
18-21 21-24 24-27 27-30 30-33 33-36 36-39 |
1 3 6 10 5 3 2 |
1 4 10 20 25 28 30 |
итого |
30 |
- |
Для расчета показателей вариации составляется вспомогательная таблица (табл.2)
Таблица 2
Вспомогательная таблица для расчета показателей вариации
Группы рабочих по возрасту, лет |
Центр интервала, (лет), |
d= - |
|
||||
18-21 21-24 24-27 27-30 30-33 33-36 36-39 |
19,5 22,5 25,5 28,5 31,5 34,5 37,5 |
19,5 67,5 153,0 285,0 157,5 103,5 75,0 |
1 3 6 10 5 3 2 |
-9,2 -6,2 -3,2 -0,2 2,8 5,8 8,8 |
9,2 18,6 19,2 20,0 14б0 17,4 17,6 |
84,64 115,32 61,44 0,40 39,20 100,92 154,88 |
84,64 38,44 10,24 0,04 7,84 33,64 77,44 |
Итого |
- |
861,0 |
30 |
- |
116,0 |
556,80 |
- |
=года
года
Следовательно, вариация возраста у рабочих данного цеха не является значительной, что подтверждает достаточную однородность совокупности.
Задача3. Имеются следующие данные о времени простоя автомобиля под разгрузкой(табл. 1)
Таблица 1
№ пункта разгрузки |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Число грузчиков |
3 |
4 |
4 |
3 |
3 |
4 |
4 |
4 |
3 |
4 |
Время простоя, мин. |
12 |
10 |
8 |
15 |
19 |
12 |
8 |
10 |
18 |
8 |
Проверить закон сложения дисперсий
Решение
В данной задаче варьирующим признаком является время простоя автомобиля под разгрузкой. Общая дисперсия времени простоя под разгрузкой определяется по формуле
Для расчета общей дисперсии составляется дискретный ряд распределения, промежуточные расчеты помещены в табл.2.
Таблица 2
Вспомогательная таблица для расчета общей дисперсии
Время простоя под (мин.т.),х |
Число выполненных разгрузок, |
() |
() |
||
8 10 12 15 18 19 |
3 2 2 1 1 1 |
24 20 24 15 18 19 |
-4 -2 0 3 6 7 |
16 4 0 9 36 49 |
48 8 0 9 36 49 |
Итого |
10 |
120 |
- |
- |
150 |
Величина этой дисперсии характеризует вариацию времени простоя под разгрузкой под влиянием всех условий. Различия в величине изучаемого признака прежде всего возникают под влиянием числа грузчиков, принимающих участие в процессе разгрузки. В связи с этим в совокупности выделяются две однородные группы по числу грузчиков: в первую группу включаются наблюдения при числе грузчиков 3; во вторую группу-при числе грузчиков 4. Для каждой из выделенных групп определяется внутригрупповая дисперсия, возникающая под влиянием неучтенных факторов. Для их расчета использованы табл. 3 и 4.
Таблица 3
Расчет внутригрупповой дисперсии по первой группе(число грузчиков -3)
Время простоя под разгрузкой (мин.т.),х |
Число выполненных разгрузок, |
() |
||
12 15 18 19 |
1 1 1 1 |
12 15 18 19 |
-4 -1 2 3 |
16 1 4 9 |
Итого |
4 |
64 |
- |
30 |
Таблица 4