
Сводка и группировка статистических данных
Понятие статистической сводки и группировки
Сводка и группировка относятся ко второму этапу статистического исследования. Сводка – комплекс операций по обобщению единичных фактов в процессе наблюдения. Простая (относятся операции по подсчету общих итогов по совокупности единиц наблюдения) и сложная (комплекс операций, включающих группировку данных, разработку систем показателей, которые будут характеризовать типичные группы, подсчет групповых и общих итогов, на основе всего построение статистических таблиц) сводка.
Группировка – распределение единиц изучаемой совокупности на однородные группы по существенным для данного исследования признакам. Метод группировок является основой применения других методов статистического анализа.
Задачи группировок и виды группировок
Выделяют следующие задачи группировок:
Выделение социально-экономических типов, явлений и процессов
Изучение структуры статистической совокупности
Изучение влияния различных факторов и анализ взаимосвязи социально-экономических явлений
В зависимости от решаемых задач выделяют 3 вида группировок:
Типологическая группировка. Цель этой группировки определение качественно отличных типов социально-экономических явлений. Деление экономически активного населения на работающих и безработных.
Структурная. Необходима для характеристики состава изучаемой совокупности. Каково соотношение мужчин и женщин в группе работающие и в группе безработные.
Аналитическая. Позволяет установить зависимость между факторами и результативными признаками. Особенности этого вида группировки является то, что единица совокупности группируется по факторному признаку, а по результативному признаку рассчитывается среднее значение по каждой группе. На основе изменения средних значений делается вывод о наличии зависимости. А) Если факторный и результативный признак изменяются однонаправленно, то связь между ними прямая. Б) Если факторные и результативные признаки меняются в разных направлениях, то такая связь называется обратной.
Выбор группированного признака
Построение группировки начинается с определения составов группировочного признака. Группировочный признак (основание группировки) - признак, на основе которого, производится подразделение единиц наблюдения на группы. Выбор группировочного признака или признаков всегда основывается на анализе качественных характеристик изучаемого явления, в качестве основания группировки выбираются только существенные признаки. В каждом конкретном исследовании включение признака в состав группировки должно быть теоритически обосновано. Группировка может выполняться по одному признаку (простая группировка) или по нескольким признакам (сложная группировка). По характеру выражения выделяются атрибутивные (регистрируются в виде текстовой записи) или количественные ( имеют цифровое выражение) признаки. Для определения количества групп, на которое будет разделена исследуемая совокупность, анализируют:
Задачи исследования
Вид признака, положенного в основу группировки
численность совокупности
Степень вариации признака
При группировке по атрибутивному признаку количество групп, является число наименований, если их немного, если признак имеет большое количество разновидностей, то при группировке ряд наименований объединяют в одну группу. Для такого объединения разрабатываются стандартные классификации. Наиболее известно и применяемо на практике является общероссийский классификатор видов экономической деятельности (ОКВЭД).
При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака. А) для небольших совокупностей число групп – n примерно равно 0.1 от числа единиц совокупности – N. Б) Если совокупность состоит из большого числа единиц и распределение совокупности по признак, положенному в основу группировки близко к нормальному, то для определения числа групп используются формула Стерджесса n = 1 + 3,222 log10N. Число n округляется до целого.
Д/з: социальная структура РФ (работающие и безработные 2011, 1997, 1989), 3w.gks.ru.
Структура экономики РФ (объем производства с/х, торговля, промышленность, добывающий сектор) 2011, 2003, 1995.
Ряды распределения, их виды и определение границ и интервалов
В основе группировки лежат ряды распределения, которые представляют собой упорядоченное распределение единиц совокупности по какому-либо признаку. Различают атрибутивные и количественные (вариационные) ряды распределения, в зависимости от того какой признак атрибутивный или количественный лежит в основе рядораспределения. Вариационный ряд состоит из 2 основных элементов:
Xi – значение переменного признака
mi – частота, с которой встречается данное значение признака в изучаемой совокупности.
∑mi = N
N – число единиц совокупности
Wi – частота (частота, выраженная в долях или процентах)
∑Wi = 100%
Wi = mi / ∑mi = mi / N
Si - накопленная частота показывает какое количество единиц совокупности имеет значение признака не более рассматриваемого.
Xi |
mi |
Wi |
Si |
2 |
6 |
28,75% |
6 |
3 |
8 |
38% |
14 = 8+6 |
4 |
4 |
19% |
18 |
5 |
2 |
9,5% |
20 |
6 |
1 |
4,75% |
21 |
Итого |
21 |
100% |
- |
2 2 3 6 2 3 4 5 4 3 3 4 5 3 2 4 2 2 3 3 3
h = Xmax – Xmin / n = R / n
R = Xmax – Xmin R – размах вариации
h – Размер интервала
Интервалы рассчитываются для интервальных вариационных рядов, и интервальный вариационный ряд целесообразно строить при непрерывной вариации признака, или, если дискретный вариационный ряд изменяется в широких пределах.
Интервал – значение варьирующего признака, лежащее в определенных пределах или границах. Характеризуется величиной и имеет верхнюю и нижнюю границу. Различают закрытые (присутствуют обе границы) и открытые интервалы (нет верхней или нижней границы).
Закон округления границ интервала. Если до запятой стоит 1 цифра, то округляют до десятых; если перед запятой 2 цифры и больше, то округляют до целых. Если рассчитанная величина представляет собой трехзначное или четырехзначное число, то округляют до числа кратного 50 или 100 в большую сторону.
Группировку с равными интервалами строят, если вариация признака невелика и его значение изменяются равномерно. Если в рамках вариации изменение признака значительное, то есть вариации велик и признак распределен неравномерно, то необходимо использовать для группировки неравные интервалы. Неравные интервалы бывают прогрессивно-возрастающими или прогрессивно-убывающими. Величина интервала изменяется либо в арифметической или в геометрической прогрессии.
hi+1 = hi + a
hi+1 = hi * g
g = const
Вторичная группировка осуществляется 2 методами:
Метод укрупнения интервалов
Числ. работников |
Кол-во фирм % |
|
№1 |
№2 |
500 |
15 |
Укрупнение интервала |
0-1000 |
15+20=35 |
500-1000 |
20 |
Метод пропорциональности заключается в том, что количество единиц в совокупности распределяется по новому интервалу вторичной группировки пропорционально изменению размера интервала.
Числ. работников |
Кол-во фирм % |
|
№1 |
№2 |
500 |
15 |
Укрупнение интервала |
0-300 |
9 |
500-1000 |
20 |
|||
|
|
|
300-600 |
6+4=10 |
|
|
|
600-1000 |
16 |
В первом интервале исходной таблицы условно можно выделить 5 подгрупп предприятия: с численностью персонала 100, 200, 300, 400, 500 человек, чтобы посчитать какое количество фирм приходится в исходном интервале на каждую подгруппу, разделим 15 на 5, получится, что на каждую подгруппу приходится по 3% предприятия. Вот вторичной группировке 3 подгруппы из первого интервала исходной группировки будут относиться к 1 интервалу вторичной группировки, таким образом, в интервал численностью человек 0-300 попадет 9% предприятия (3%*3), а остальные 6% предприятия будут относиться к следующему интервалу вторичной группировки. Во втором интервале исходной группировки на каждую подгруппу приходится 4%, остальные 16% идут в 3 интервал.
Второй этап статистического исследования заканчивается построением статистических таблиц.