Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ctatistika 1.doc
Скачиваний:
12
Добавлен:
26.11.2019
Размер:
938.5 Кб
Скачать

2. Статистическая сводка и группировка. Таблицы и графическое представление статистических данных

2.1. Статистическая сводка и группировка

На основе информации, собранной в ходе статистического на­блюдения, как правило, нельзя непосредственно выявить и оха­рактеризовать закономерности социально-экономических явлений. Это связано с тем, что наблюдение дает сведения по каждой еди­нице исследуемого объекта. Полученные данные не являются обобщающими показателями. С их помощью нельзя сделать выводы в целом об объекте без предварительной обработки данных.

Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получении на этой основе сводной характеристики всего объекта при помощи обоб­щающих статистических показателей.

Сводка представляет собой комплекс последовательных опе­раций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Таким образом, если при статистическом наблюдении собирают данные о каждой единице объекта, то результатом сводки являют­ся подробные данные, отражающие в целом всю совокупность.

По глубине обработки материала сводка бывает простая и сложная.

Простой сводкой называется операция по подсчету общих ито­гов по совокупности единиц наблюдения.

Сложная сводка представляет собой комплекс операций, вклю­чающих группировку единиц наблюдения, подсчет итогов по каж­дой группе и по всему объекту и представление результатов груп­пировки и сводки в виде статистических таблиц.

Проведению сводки предшествует разработка ее программы, которая состоит из следующих этапов: выбор группировочных при­знаков; определение порядка формирования групп; разработка системы статистических показателей для характеристики групп и объекта в целом; разработка системы макетов статистических таб­лиц, в которых должны быть представлены результаты сводки.

Отдельные единицы статистической совокупности объединяют­ся в группы при помощи метода группировки. Это позволяет «сжать» информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности, присущие изучаемому явлению.

Группировкой называется расчленение множества единиц изу­чаемой совокупности на группы по определенным существенным для них признакам. Группировка является одним из самых слож­ных в методологическом плане этапов статистического исследо­вания.

Почему проводят группировку? В показателях, исчисленных по достаточно большим группам, произойдет погашение случайного и выявление общего, существенного для развития исследуемого явления.

Группировка, в которой группы образованы по одному призна­ку, называется простой. Для характеристики явления бывает не­достаточно разбить совокупность на группы по какому-либо одно­му признаку. В этом случае строят сложные группировки.

Сложной называется группировка, в которой разделение сово­купности на группы производится по двум и более признакам, взя­тым в сочетании (комбинации). Сначала группы формируются по одному признаку, затем они делятся на подгруппы по другому признаку, которые, в свою оче­редь, подразделяются по третьему и т. д. Таким образом, сложные группировки дают возможность изучать распределение единиц со­вокупности одновременно по нескольким признакам. В качестве примера можно рассмотреть группировку семей России по месту проживания и числу детей в 1989 г. (табл. 2)

Т а б л и ц а 2

Группировка семей России по месту проживания и числу детей в 1989 г.

(по материалам переписи населения)

№ п/п

Группа семей по месту проживания

В том числе подгруппа семей по числу детей

Число се­мей, тыс.

1

Городское население

1 ребенок

2 детей

3 »

4 »

5 и более детей

9605

6936

971

153

76

Итого по группе

17741

2

Сельское население

1 ребенок

2 детей

3 »

4 »

5 и более детей

2328

2306

757

213

141

Итого по подгруппе

5745

Итого по подгруппам

1 ребенок

2 детей

3 »

4 »

5 и более детей

11933

9242

1728

366

217

Всего

23486

При построении сложной группировки возникает вопрос о пос­ледовательности разбиения единиц объекта по признакам. Как пра­вило, рекомендуется сначала производить группировку по атрибу­тивным признакам, значения которых имеют ярко выраженные ка­чественные различия.

С увеличением числа группировочных признаков в сложных группи-ровках быстро растет количество групп. Группировка с боль­шим числом групп становится ненаглядной. Поэтому на практике строят сложные группировки не более чем по трем признакам.

Признак, по которо­му проводится разбивка единиц совокупности на отдельные груп­пы называется группировочным признаком. Его часто называют основанием группировки. От правильного выбора группировочного признака зависят выводы, которые полу­чают в результате статистического исследования.

В основание группировки могут быть положены как количествен­ные, так и качественные признаки. Первые имеют числовое вы­ражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т. д.), а вторые отражают состояние еди­ницы совокупности (пол человека, его национальность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т. д.).

После определения основания группировки следует решить воп­рос о количестве групп, на которые надо разбить исследуемую со­вокупность.

Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупнос­ти, степени вариации признака.

Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов стра­ны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное насе­ление и население старше трудоспособного возраста. Если же ана­лизируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные группы.

При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, со­стояний у этого признака. Например, в случае проведения группи­ровки населения по полу можно образовать только две группы: мужчины и женщины.

Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуе­мого объекта и степень колеблемости группировочного признака.

При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. По­этому показатели, рассчитанные для таких групп, не будут пред­ставительными и не позволят получить адекватную характеристи­ку исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономер­ностей при исследовании социально-экономических явлений и про­цессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать и особенности объекта и цель иссле­дования.

Для определения оптимального числа групп используют формулу Стерджесса:

, (1)

где п – число групп;

N – число единиц совокупности.

Согласно формуле (1), выбор числа групп зависит от объема совокупности. Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого чис­ла единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

Другой способ определения числа групп основан на примене­нии показателя среднего квадратического отклонения ().

После определения числа групп следует определить интерва­лы группировки.

Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней гра­ницей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение призна­ка в нем. Величина интервала (ее еще часто называют интер­вальной разностью) представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрас­тающие, прогрессивно убывающие, произвольные и специализи­рованные.

Если вариация признака проявляется в сравнительно узких гра­ницах и распределение носит более или менее равномерный ха­рактер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей фор­муле:

, (2)

где h – шаг интервала;

R = Xmax – Xmin, т.е. размах вариации;

Xmax, Xmin – максимальное и минимальное значение признака в совокупности.

Прежде чем определять размах вариации, из совокупности ре­комендуется исключить аномальные наблюдения.

Если максимальные или минимальные значения сильно отли­чаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, для определения вели­чины интервала следует использовать не максимальное и мини­мальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.

Рассмотрим пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фон­дов, при этом максимальное значение признака равно 2040 у.е., а минимальное его значение – 290 у.е. Совокупность включает 80 единиц. Согласно формуле (2) она должна быть раз­бита на 7 групп. Сначала следует найти размах вариации:

R = 2040 – 290 = 1750 у.е.

Затем определим величину интервала:

h = 1750 : 7 = 250 у.е.

После этого построим интервалы групп (табл. 3).

Т а б л и ц а 3

Варианты построения групп

№ группы

I вариант

II вариант

I

II

III

IV

V

VI

VII

От 290 до 540

540 – 790

790 – 1040

1040 – 1290

1290 – 1540

1540 – 1790

1790 – 2040

До 540

540 – 790

790 – 1040

1040 – 1290

1290 – 1540

1540 – 1790

1790 и более

Чтобы не писать каждый раз от ... до, границы групп обознача­ют следующим образом: 290 – 540, 540 – 790 и т. д.

Особенностью первого варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во втором вари­анте первая и последняя группы – это группы с открытыми интер­валами.

Открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего.

Закрытыми называются интервалы, у которых обозначены обе границы.

Ширина открытого интервала принимается равной ширине смежного с ним интервала.

При группировке по количественному признаку границы интер­валов могут быть обозначены по-разному. Если основанием груп­пировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смеж­ных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i + 1-го интервала. Примером такой группировки является приведенная ранее группировка предприятий по стоимости основных фондов.

При таком обозначении границ может возникнуть вопрос, в ка­кую группу включать единицы объекта, значения признака у ко­торых совпадают с границами интервалов. Например, во вторую или третью группу должно войти предприятие со стоимостью фондов 790 млн руб. Если нижняя граница формируется по прин­ципу «включительно», а верхняя – по принципу «исключительно», то предприятие должно быть отнесено к третьей группе, в про­тивном случае – ко второй. Для того чтобы правильно отнести к той или иной группе единицу объекта, у которой значение при­знака совпадает с границами интервалов, можно использовать открытые интервалы.

Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе 1–1-го ин­тервала, увеличенной на 1.

Например, пусть совокупность состоит из 80 предприятий и ее надо разделить на группы по численности занятых. Минимальное и максимальное значения группировочного признака соответствен­но равны 290 и 2040 человек. В этом случае возможны следую­щие варианты построения групп (табл. 4).

Т а б л и ц а 4

Варианты построения групп

№ группы

I вариант

II вариант

I

II

III

IV

V

VI

VII

290 – 540

541 – 790

791 – 1040

1041 – 1290

1291 – 1540

1541 – 1790

1791 – 2040

До 540

541 – 790

791 – 1040

1041 – 1290

1291 – 1540

1541 – 1790

1791 и более

Неравные интервалы применяются в статистике, когда значе­ния признака варьируют неравномерно и в значительных разме­рах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.

После определения группировочного признака и границ групп строится ряд распределения.

Статистический ряд распределения – это упорядоченное рас­пределение единиц совокупности на группы по определенному ва­рьирующему признаку.

Ряд распределения принято оформ­лять в виде таблиц. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам.

Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариаци­онном ряду, т. е. конкретное значение варьирующего признака. Частоты – это численности отдельных вариантов или каждой груп­пы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %.

В зависимости от характера вариации признака различают дис­кретные и интервальные вариационные ряды. Примером дискретного ва­риационного ряда является распределение семей по числу ком­нат в отдельных квартирах, приведенное в табл. 5.

Т а б л и ц а 5

Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ

п/п

Группы семей, проживающих

в квартирах с числом комнат

Число семей

всего, тыс. ед.

в % к итогу

1

2

3

4

1

2

3

4 и более

4064

12399

7659

832

16,3

49,7

30,7

3,3

Всего

24954

100,0

В первой колонке таблицы представлены варианты дискретно­го вариационного ряда, во второй – помещены частоты вариаци­онного ряда, а в третьей – показаны частости.

В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационных рядов целесообразно, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких преде­лах, т. е. число вариантов дискретного признака достаточно вели­ко.

Ряд распределения представляет собой простейшую группиров­ку, в которой каждая выделяемая группа характеризуется одним показателем – численностью единиц объекта, попавших в каждую группу. Построение рядов распределения является составной частью сводной обработки данных, при которой каждая группа еди­ниц характеризуется многими показателями. Поэтому важным мо­ментом в построении группировки является перечень тех показа­телей, которыми будет характеризоваться каждая группа.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]