- •Раздел I методико-практический путеводитель по темам курса
- •1. Статистическое наблюдение
- •2. Сводка и группировка статистических данных
- •3. Статистические показатели
- •4. Ряды распределения. Анализ вариаций и формы распределения
- •5. Выборочный метод. Статистическая проверка гипотез
- •6. Методы анализа взаимосвязей
- •7. Ряды динамики. Анализ интенсивности и тенденций развития
- •8. Индексы
2. Сводка и группировка статистических данных
Статистическая сводка — второй этап исследования массовых общественных явлений. Суть ее заключается в классификации и агрегировании первичных статистических данных. На этапе сводки элементы совокупности по принципу сходства и различия определенных признаков объединяются в группы; для характеристики выделенных групп используют систему показателей. Результаты сводки оформляются в виде статистических таблиц.
Существуют общепринятые методологические стандарты распределения совокупностей на группы — четко определенные группировочные признаки и сформулированные требования относительно условий формирования групп. Это классификации. Например, классификация отраслей промышленности, форм собственности, организационно-правовых форм субъектов хозяйствования.
Для решения конкретных аналитических задач проводятся нестандартные группировки по определенным признакам, которые легко распознаются. В зависимости от цели исследования и сложности массового процесса используются один, два и более группировочных признаков. Группировка по одному признаку называется простой, в случае сочетания двух и более признаков — комбинационной.
Группировка в статистическом анализе выполняет определенные функции, в частности:
а) изучение структуры и структурных сдвигов;
б) типология социально-экономических явлений;
в) анализ взаимосвязей между явлениями.
В соответствии с этими функциями различают структурные, типологические и аналитические группировки.
Структурная группировка характеризует состав однородной совокупности по определенным признакам, объемы явления и значимость отдельных групп. Разновидностью структурной группировки является ряд распределения, элементами которого выступают варианты и частоты или частости. Варианты — это конкретные значения группировочного признака, частоты — количества единиц совокупности, которым свойственны отдельные варианты. Относительные частоты (% к итогу) называются частностями.
Типологическая группировка — это распределение качественно неоднородной совокупности на классы, социально экономические типы, однородные группы. Основная задача такой группировки — идентификация типов, поэтому первоочередное значение имеет выбор группировочного признака. И структурные, и типологические группировки — описательные, они характеризуют структуру совокупности, выделяя ее характерные черты и особенности, но отличаются по уровню качественных различий между группами.
С помощью аналитической группировки определяют наличие и направление связи между двумя признаками, один из которых представляет результат другой — фактор, влияющий на результат. В классическом варианте аналитической группировки совокупность делится на группы по факторному признаку, и в каждой группе определяется средний уровень результативного признака. При наличии связи между факторным и результативным признаком групповые средние от группы к группе постепенно изменяются — увеличиваются или уменьшаются.
При формировании групп возникает вопрос об их количестве и границах каждой из них. Количество групп зависит от степени вариации группировочного признака и объема совокупности, в каждом отдельном случае его необходимо обосновать. Если группировочный признак атрибутивный, количество групп чаще всего определяется количеством наименований признака. В табл. 2.1 показано распределение городских земель по видам застройки. Первые три группы представляют основные виды застройки, четвертая — объединяет остальные менее значительные виды. По аналитической функции — это структурная группировка, характеризующая масштабы и значительность отдельных видов застройки в пределах территории города.
Таблица 2.1
Вид городской застройки |
Площадь, га |
% к итогу |
Площадь под застройкой в том числе |
3025 |
100,0 |
промышленная |
670 |
22,1 |
жилищная |
1920 |
63,5 |
общественная |
315 |
10,4 |
другая |
120 |
4,0 |
В процессе формирования групп по вариационному признаку — непрерывному или дискретному, с широким диапазоном вариации — необходимо установить интервалы групп и определить границы каждого из них с такой точностью, чтобы распределение совокупности было однозначным. Интервалы бывают равные и неравные, открытые и закрытые.
Равные интервалы используют при условии, что значения признака х в диапазоне вариации изменяются равномерно. Величина такого интервала определяется отношением
где т — количество групп.
Например, прибыльность активов коммерческих банков колеблется от 5 до 45%. При т = 4 величина интервала составляет
а границы интервалов соответственно 5—15; 15—25; 25—35; 35 и более. Поскольку границы интервалов совпадают, то порядок отнесения к группам пограничных значений признака определяют слова последнего открытого интервала "35 и более", т. е. нижнюю границу закрытого интервала следует считать "включительно", а верхнюю — "исключая".
В случае, когда диапазон значений признака слишком широк и распределение совокупности по этому признаку неравномерно, используют неравные интервалы. Например, распределение поселков городского типа по количеству жителей, тыс. чел.: до 3; 3—4,9; 5—9,9; 10—19,9; 20—49,9. Поскольку границы интервалов не совпадают, то обе границы (верхнюю и нижнюю) следует считать "включительно".
Неотъемлемым элементом сводки и группировки является статистическая таблица, в которой сводная информация излагается компактно, в удобной для сравнения и анализа форме. В практике статистико-экономических исследований используются таблицы разной сложности, в зависимости от цели и особенностей объекта исследования, объема имеющейся информации. По логическому содержанию статистическая таблица рассматривается как "статистическое предложение", подлежащим которого является объект исследования, а сказуемым — система показателей, характеризующих объект. В зависимости от структуры подлежащего статистические таблицы делят на простые, групповые и комбинационные. Подлежащим простой таблицы является перечень элементов совокупности, территориальный или хронологический ряд. В групповой таблице подлежащим является группировка по одному признаку, в комбинационной — по двум и более признакам.
Статистическая таблица составляется в два этапа. На первом этапе проектируется макет таблицы, на втором — таблица заполняется статистическими данными. Макет статистической таблицы — это комбинация горизонтальных строк и вертикальных граф, на пересечении которых образуются клетки. Левые боковые и верхние клетки Предназначены для словесных заголовков — перечня составляющих подлежащего и системы показателей сказуемого» остальные — для числовых данных. Основное содержание таблицы указывается в названии. Макет таблицы, характеризующей объемы и результаты внешнеторговой деятельности страны, показан в табл. 2.2. Подлежащим таблицы является хронологический ряд, сказуемым — показатели.
Таблица 2.2. Динамика объемов внешней торговли (в дол. США)
Годы |
Экспорт |
Импорт |
Внешнеторговый оборот |
Торговый баланс |
|
|
|
(гр. 1 + гр. 2) |
(гр. 1 - гр. 2) |
А |
1 |
2 |
3 |
4 |
|
|
|
|
|
При оформлении таблицы необходимо придерживаться определенных правил. Так, название таблицы, заголовки строк и граф должны быть четкими, лаконичными, без сокращений. В названии таблицы указывается объект, его временной и географический признаки. Если названия отдельных граф (строк) повторяются, имеют одинаковые термины или одинаковое содержание, то их целесообразно объединять общим заголовком. В верхних или боковых заголовках указываются единицы измерения с использованием общепринятых сокращений (т, кВт, м3 и т. п.); иногда для них выделяется отдельная графа. Общую единицу измерения указывают над таблицей.
Строки и графы целесообразно нумеровать (название подлежащего — буквой алфавита, другие графы — цифрами), это дает возможность раскрыть методику расчета показателей сказуемого таблицы. Например, в табл. 2.2 внешнеторговый оборот — это сумма экспорта (гр. 1) и импорта (гр. 2), торговый баланс — разность экспорта и импорта. Информация, находящаяся в строках (графах) таблицы, обобщается итоговой строкой (графой) "Итого" или "В целом по совокупности". Если итоговая строка располагается первой, как в табл. 2.1, то детализация приводится "в том числе".
Значения показателей в клетках таблицы по возможности следует округлять в пределах одной и той же строки или графы обязательно с одинаковой степенью точности. Если цифры слишком малы, записывают 0,0 или 0,00. Отсутствие информации обозначают троеточием (...) или (н/д), если отсутствует само явление, используют тире (—). Значок х указывает, что клетка не подлежит заполнению.
Пример. Методику построения группировок рассмотрим по данным бюджетных обследований 20 домохозяйств. В табл. 2.3 приводятся данные о количестве членов домохозяйств, общем денежном и среднедушевом месячном доходе, включая трансферты. По этим данным сгруппируем домохозяйства по первым двум признакам отдельно и в комбинации.
Порядковый номер домохозяйства |
Количество членов домохозяйства |
Общий денежный доход, включая трансферты, ден. ед. |
Среднедушевой доход, ден. ед. |
|
|||||
1 |
2 |
3 |
4 |
|
|||||
1 |
2 |
185 |
92,5 |
|
|||||
2 |
3 |
268 |
89,3 |
|
|||||
3 |
4 |
539 |
134,7 |
|
|||||
4 |
2 |
193 |
96,5 |
|
|||||
5 |
3 |
473 |
157,6 |
|
|||||
6 |
3 |
324 |
108,0 |
|
|||||
7 |
4 |
710 |
177,5 |
|
|||||
8 |
3 |
172 |
57,3 |
|
|||||
9 |
4 |
248 |
62,0 |
|
|||||
|
10 |
2 |
350 |
175,0 |
|||||
|
11 |
3 |
516 |
172,0 |
|||||
|
12 |
3 |
374 |
124,7 |
|||||
|
13 |
4 |
450 |
112,5 |
|||||
|
14 |
3 |
603 |
201,0 |
|||||
|
15 |
3 |
229 |
76,3 |
|||||
|
16 |
2 |
368 |
184,0 |
|||||
|
17 |
4 |
313 |
78,3 |
|||||
|
18 |
3 |
346 |
115,3 |
|||||
|
19 |
3 |
447 |
149,0 |
|||||
|
20 |
4 |
392 |
98,0 |
Таблица 2.4
Количество членов домохозяйства |
Число домохозяйств |
2 |
4 |
3 |
10 |
4 |
6 |
Итого |
20 |
Таблица 2.5
Общий денежный доход домохозяйства, ден. ед. |
Число домохозяйств |
Менее 200 |
3 |
200—400 |
10 |
400—600 |
5 |
600 и больше |
2 |
Итого |
20 |
Группировка домохозяйств одновременно по двум признакам дает комбинационное распределение (табл. 2.6). Размещение частот таблицы в направлении от верхнего левого угла к нижнему правому указывает на наличие прямой связи между количеством членов и общим денежным доходом домохозяйств.
Таблица 2.6
Количество членов домохозяйства |
Общий денежный доход домохозяйства, ден. ед. |
Итого |
|||
До 200 |
200—400 |
400—600 |
600 и более |
||
2 |
2 |
2 |
— |
— |
4 |
3 |
1 |
5 |
3 |
1 |
10 |
4 |
— |
3 |
2 |
1 |
6 |
Итого |
3 |
10 |
5 |
2 |
20 |
Суммирование и усреднение признаков в каждой группе усугубляет анализ данных. Так, на основе итоговых данных о количестве членов домохозяйств и денежном доходе в каждой группе можно определить средний доход на одно домохозяйство и на одного члена домохозяйства (среднедушевой доход). Результаты такого обобщения приведены в табл. 2.7.
Таблица 2.7
Количество членов домохозяйства |
Число домохозяйств |
Суммарное количество членов домохозяйства |
Доход за месяц, ден. ед. |
||
Общий денежный доход |
В среднем |
||||
на одно домохозяйство |
на одного члена домохозяйства |
||||
2 |
4 |
8 |
1096 |
274,0 |
137,0 |
3 |
10 |
30 |
3752 |
375,2 |
125,1 |
4 |
6 |
24 |
2652 |
442,0 |
110,5 |
По совокупности в целом |
20 |
62 |
7500 |
375,0 |
121,0 |
По данным таблицы с увеличением количества членов домохозяйства возрастает средний доход на одно домохозяйство, но среднедушевой доход уменьшается. Зависимость среднедушевого дохода от количества членов домохозяйства более выразительно описывает аналитическая группировка (табл. 2.8). Параллельное сопоставление групповых значений факторного и результативного признаков дает возможность определить не только направление, но и интенсивность изменения результативного признака. При условии равномерного наращивания значений факторного признака разность между групповыми средними результативного признака используется для оценки эффекта влияния фактора на результат. По данным табл. 2.8, эффект влияния второй группы составляет: 125,1 - 137,0 = -11,9 ден. ед.; третьей группы: 110,5 - 125,1 = -14,6 ден. ед., т. е. интенсивность влияния фактора на результат возрастает.
Таблица 2.8
Количество членов домохозяйства |
Число домохозяйств |
Среднедушевой доход, ден. ед. |
2 |
4 |
137,0 |
3 |
10 |
125,1 |
4 |
6 |
110,5 |
По совокупности в целом |
20 |
121,0 |
По первичным данным об уровне среднедушевого дохода (табл. 2.3) составим типологическую группировку, выделив группы бедных, средних и состоятельных домохозяйств. По методике Европейской комиссии ООН к бедным отнесем домохозяйства, Среднедушевой доход которых не превышает 2/3 среднего уровня по совокупности в целом. Таким образом, в нашем примере чертой бедности является 2/3 • 121 = 81 ден. ед. К среднему слою отнесем домохозяйства, Среднедушевой доход которых попадает в интервал 121 ± 121/3, т. е. от 81 до 161 ден. ед. Домохозяйства со среднедушевым доходом 161 ден. ед. и более идентифицируются как состоятельные.
Результаты типологической группировки приведены в табл. 2.9. Состоятельных домохозяйств оказалось 5, среднего достатка — 11, за чертой бедности — 4, или 20% домохозяйств. Среднедушевой доход в группах соответственно составляет 181,9; 117,4; 68,7 ден. ед., т. е. доход зажиточных домохозяйств в 2,6 раза превышает доход бедных.
Таблица 2.9
Среднедушевой доход, ден. ед. |
Количество |
Общий денежный доход домохозяйств, ден. ед. |
Среднедушевой доход, ден. ед. |
|
домохозяйств |
членов домохозяйства |
|||
До 81 |
4 |
14 |
962 |
68,7 |
81—161 |
11 |
34 |
3991 |
117,4 |
161 и более |
5 |
14 |
2547 |
181,9 |
По совокупности в целом |
20 |
62 |
7500 |
121,0 |
Иногда возникает потребность в перегруппировке данных с целью сравнения структур двух группировок, выделения типов и т.п. Перегруппировка осуществляется путем или объединения, или расщепления интервалов первичной группировки. Результаты перегруппировки называют вторичной группировкой. Если границы интервалов первичной и вторичной группировок совпадают, частоты (частости) объединяющихся интервалов просто суммируются. В случае расщепления интервала первичной группировки частоты (частости) распределяются в той же пропорции, что и величина расщепленного интервала. Например, на основе первичной группировки предприятий региона по количеству занятых (т == 6) необходимо создать новые группы (т = 5) с другими интервалами. Техника перегруппировки показана в табл. 2.10.
Таблица 2.10
Первичная группировка |
Вторичная группировка |
||
Количество занятых, тыс. чел. |
Число предприятий |
Количество занятых, тыс. чел. |
Число предприятий |
100 и менее |
4 |
200 и менее |
4+1/2•16=12 |
101—300 |
16 |
201—500 |
1/2-16+2/7•35 =18 |
301—1000 |
35 |
501—1000 |
5/7•35 ==25 |
1001—2000 |
28 |
1001—3000 |
28+1/3•12 =32 |
2001—5000 |
12 |
3001 и более |
2/3•12+5=13 |
5001 и более |
5 |
|
|
Итого |
100 |
Итого |
100 |