![](/user_photo/2706_HbeT2.jpg)
- •Г.В. Беспалова, а.А. Федоров статистика
- •Часть I
- •1. Статистика как наука
- •1.1. Понятие статистики
- •1.2. Статистическое наблюдение
- •2. Статистическая сводка и группировка. Таблицы и графическое представление статистических данных
- •2.1. Статистическая сводка и группировка
- •2.2. Статистические таблицы
- •2.3. Графическое представление статистических данных
- •3. Статистические показатели
- •3.1. Абсолютные и относительные статистические показатели
- •3.2. Сущность и значение средних показателей
- •3.3. Средняя арифметическая и ее свойства
- •Рассмотрим расчет средней способом моментов:
- •3.4. Другие виды средних
- •1. Средняя гармоническая Средняя гармоническая взвешенная
- •2. Средняя гармоническая простая
- •4. Показатели вариации и анализ частотных распределений
- •4.1. Показатели вариации
- •I. Абсолютные показатели вариации.
- •II. Относительные показатели вариации:
- •4.2. Понятие о закономерностях распределения
- •4.3. Структурные характеристики вариационного ряда распределения
- •Сравнение средних
- •5. Выборочное наблюдение
- •5.1. Выборочное наблюдение как важнейший источник статистической информации
- •5.2. Средняя и предельная ошибки выборки
- •5.3. Способы отбора единиц в выборку
- •5.4. Определение необходимого объема выборки
- •5.5. Оценка результатов выборочного наблюдения и распространение их на генеральную совокупность
- •5.6. Малая выборка
- •Литература
- •Содержание
2. Статистическая сводка и группировка. Таблицы и графическое представление статистических данных
2.1. Статистическая сводка и группировка
На основе информации, собранной в ходе статистического наблюдения, как правило, нельзя непосредственно выявить и охарактеризовать закономерности социально-экономических явлений. Это связано с тем, что наблюдение дает сведения по каждой единице исследуемого объекта. Полученные данные не являются обобщающими показателями. С их помощью нельзя сделать выводы в целом об объекте без предварительной обработки данных.
Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получении на этой основе сводной характеристики всего объекта при помощи обобщающих статистических показателей.
Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.
Таким образом, если при статистическом наблюдении собирают данные о каждой единице объекта, то результатом сводки являются подробные данные, отражающие в целом всю совокупность.
По глубине обработки материала сводка бывает простая и сложная.
Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения.
Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.
Проведению сводки предшествует разработка ее программы, которая состоит из следующих этапов: выбор группировочных признаков; определение порядка формирования групп; разработка системы статистических показателей для характеристики групп и объекта в целом; разработка системы макетов статистических таблиц, в которых должны быть представлены результаты сводки.
Отдельные единицы статистической совокупности объединяются в группы при помощи метода группировки. Это позволяет «сжать» информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности, присущие изучаемому явлению.
Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам. Группировка является одним из самых сложных в методологическом плане этапов статистического исследования.
Почему проводят группировку? В показателях, исчисленных по достаточно большим группам, произойдет погашение случайного и выявление общего, существенного для развития исследуемого явления.
Группировка, в которой группы образованы по одному признаку, называется простой. Для характеристики явления бывает недостаточно разбить совокупность на группы по какому-либо одному признаку. В этом случае строят сложные группировки.
Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Сначала группы формируются по одному признаку, затем они делятся на подгруппы по другому признаку, которые, в свою очередь, подразделяются по третьему и т. д. Таким образом, сложные группировки дают возможность изучать распределение единиц совокупности одновременно по нескольким признакам. В качестве примера можно рассмотреть группировку семей России по месту проживания и числу детей в 1989 г. (табл. 2)
Т а б л и ц а 2
Группировка семей России по месту проживания и числу детей в 1989 г.
(по материалам переписи населения)
№ п/п
|
Группа семей по месту проживания
|
В том числе подгруппа семей по числу детей
|
Число семей, тыс.
|
1 |
Городское население |
1 ребенок 2 детей 3 » 4 » 5 и более детей
|
9605 6936 971 153 76 |
Итого по группе |
17741 |
||
2 |
Сельское население |
1 ребенок 2 детей 3 » 4 » 5 и более детей
|
2328 2306 757 213 141 |
|
Итого по подгруппе |
5745 |
|
|
Итого по подгруппам |
1 ребенок 2 детей 3 » 4 » 5 и более детей
|
11933 9242 1728 366 217 |
|
Всего |
23486 |
При построении сложной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.
С увеличением числа группировочных признаков в сложных группи-ровках быстро растет количество групп. Группировка с большим числом групп становится ненаглядной. Поэтому на практике строят сложные группировки не более чем по трем признакам.
Признак, по которому проводится разбивка единиц совокупности на отдельные группы называется группировочным признаком. Его часто называют основанием группировки. От правильного выбора группировочного признака зависят выводы, которые получают в результате статистического исследования.
В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т. д.), а вторые отражают состояние единицы совокупности (пол человека, его национальность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т. д.).
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные группы.
При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины.
Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. Поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.
Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать и особенности объекта и цель исследования.
Для определения оптимального числа групп используют формулу Стерджесса:
, (1)
где п – число групп;
N – число единиц совокупности.
Согласно формуле (1), выбор числа групп зависит от объема совокупности. Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения ().
После определения числа групп следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала (ее еще часто называют интервальной разностью) представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
,
(2)
где h – шаг интервала;
R = Xmax – Xmin, т.е. размах вариации;
Xmax, Xmin – максимальное и минимальное значение признака в совокупности.
Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.
Рассмотрим пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равно 2040 у.е., а минимальное его значение – 290 у.е. Совокупность включает 80 единиц. Согласно формуле (2) она должна быть разбита на 7 групп. Сначала следует найти размах вариации:
R = 2040 – 290 = 1750 у.е.
Затем определим величину интервала:
h = 1750 : 7 = 250 у.е.
После этого построим интервалы групп (табл. 3).
Т а б л и ц а 3
Варианты построения групп
№ группы
|
I вариант
|
II вариант
|
I II III IV V VI VII
|
От 290 до 540 540 – 790 790 – 1040 1040 – 1290 1290 – 1540 1540 – 1790 1790 – 2040
|
До 540 540 – 790 790 – 1040 1040 – 1290 1290 – 1540 1540 – 1790 1790 и более
|
Чтобы не писать каждый раз от ... до, границы групп обозначают следующим образом: 290 – 540, 540 – 790 и т. д.
Особенностью первого варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во втором варианте первая и последняя группы – это группы с открытыми интервалами.
Открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего.
Закрытыми называются интервалы, у которых обозначены обе границы.
Ширина открытого интервала принимается равной ширине смежного с ним интервала.
При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i + 1-го интервала. Примером такой группировки является приведенная ранее группировка предприятий по стоимости основных фондов.
При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должно войти предприятие со стоимостью фондов 790 млн руб. Если нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно», то предприятие должно быть отнесено к третьей группе, в противном случае – ко второй. Для того чтобы правильно отнести к той или иной группе единицу объекта, у которой значение признака совпадает с границами интервалов, можно использовать открытые интервалы.
Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе 1–1-го интервала, увеличенной на 1.
Например, пусть совокупность состоит из 80 предприятий и ее надо разделить на группы по численности занятых. Минимальное и максимальное значения группировочного признака соответственно равны 290 и 2040 человек. В этом случае возможны следующие варианты построения групп (табл. 4).
Т а б л и ц а 4
Варианты построения групп
№ группы
|
I вариант
|
II вариант
|
I II III IV V VI VII
|
290 – 540 541 – 790 791 – 1040 1041 – 1290 1291 – 1540 1541 – 1790 1791 – 2040
|
До 540 541 – 790 791 – 1040 1041 – 1290 1291 – 1540 1541 – 1790 1791 и более
|
Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.
После определения группировочного признака и границ групп строится ряд распределения.
Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.
Ряд распределения принято оформлять в виде таблиц. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам.
Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретное значение варьирующего признака. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 5.
Т а б л и ц а 5
Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ
№ п/п
|
Группы семей, проживающих в квартирах с числом комнат
|
Число семей
|
||
всего, тыс. ед. |
в % к итогу |
|||
1 2 3 4
|
1 2 3 4 и более
|
4064 12399 7659 832
|
16,3 49,7 30,7 3,3
|
|
|
Всего
|
24954
|
100,0
|
В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, а в третьей – показаны частости.
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационных рядов целесообразно, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико.
Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется одним показателем – численностью единиц объекта, попавших в каждую группу. Построение рядов распределения является составной частью сводной обработки данных, при которой каждая группа единиц характеризуется многими показателями. Поэтому важным моментом в построении группировки является перечень тех показателей, которыми будет характеризоваться каждая группа.