- •Лекция 3 сводка и группировка материалов статистического наблюдения
- •1. Сводка статистических данных, ее задачи и содержание
- •Глубина
- •Техника
- •2. Метод группировки и его место в системе статистических методов. Задачи, решаемые с помощью метода группировок
- •2.1. Виды статистических группировок
- •3. Принципы построения статистических группировок и классификаций
- •Сравнимость статистических группировок
- •4. Ряд распределения.
- •4.1. Общие понятия
- •4.2. Графическое изображение рядов распределения
Сравнимость статистических группировок
(Шмойлова, со стр. 82 - примеры)
Группировки, построенные за один и тот период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Для того чтобы привести такие группировки к сопоставимому виду (это позволяет провести их сравнительный анализ), используется метод вторичной группировки. Суть метода состоит в перегруппировке единиц объекта без обращения к первичным данным.
Вторичная группировка – это операция по образованию новых групп на основе ранее построенной группировки.
Применяются два способа образования новых групп.
Объединение первоначальных интервалов (наиболее простой и распространенный способ). Применяется, когда нужно переход от мелких интервалов к более крупным интервалам, а также когда границы новых и старых интервалов совпадают.
Долевая перегруппировка состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые.
4. Ряд распределения.
4.1. Общие понятия
Статистическим рядом распределения (см. п. 2.1, первую схему) называется ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, разновидности которого расположены в определенной последовательности (другими словами, этот ряд представляет упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку).
Ряды распределения иногда входят в качестве составной части сводной обработки данных, при которых единицы совокупности характеризуются многими показателями (например, группы промышленных предприятий), иногда приобретают самостоятельное значение.
Ряды распределения строятся с целью изучения
состава исследуемой совокупности,
однородности совокупности,
колеблемости значений признаков и
границ их изменения.
На основе рядов распределения
рассчитываются относительные величины структуры,
средние показатели;
устанавливается типичность обобщающих показателей с позиций наблюдаемых единиц совокупности.
По своей конструкции ряд распределения состоит из двух элементов:
вариантов (числовых значений количественного признака или числа групп по выделенному признаку) и
частот (численности отдельных вариантов или численности групп, т.е. числа элементов в каждой группе).
Частости – частоты, выраженные в виде относительных величин (доли единиц – в этом случае сумма всех частот = 1, процентов – сумма = 100%). Ряд частостей обычно применяют, когда совокупность очень велика, кроме того; ряды частостей позволяют сравнивать распределения по одному и тому же признаку в разных по численности совокупностях.
Объем распределения (или его численность) – это сумма всех частот.
Накопленная частота (накопленная частость) для данного интервала получается суммированием (накапливанием) частот (частостей) у всех предшествующих интервалов, включая данный.
Вариационный ряд оформляется в виде статистической таблицы, например, см. табл. 4.1 для совокупности, состоящей из N единиц.
Атрибутивные – это ряды распределения, образованные по качественному (атрибутивному) признаку (см табл. 4.2).
Вариационные – это ряды, образованные по количественному признаку (см. табл. 4.4).
При наличии достаточно большого количества вариантов значений признака первичный ряд становится трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности, поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов в возрастающем (или убывающем) порядке.
По способу построения вариационные ряды делятся на дискретные и интервальные.
Дискретный – в ряду группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения (см. табл. 4.3).
Таблица 4.1
-
Вариант
Частота
.
.
.
.
.
.
Итого
(или ,N)
Таблица 4.2
№ п/п |
Группы оборота по Формам собственности |
Млрд. руб. |
% к итогу | ||
1998 |
2000 |
1998 |
2000 | ||
|
А |
1 |
2 |
3 |
4 |
1 |
Негосударственная |
990,8 |
4129 |
93,0 |
95,5 |
|
из нее частная |
852,3 |
1845 |
80,0 |
82,0 |
2 |
Государственная |
74,4 |
102 |
7,0 |
4,5 |
|
Всего оборота розничной торговли |
1065,2 |
2251 |
100,0 |
100,0 |
Таблица 4.3
-
№
п/п
Группы семей
по числу детей
х
Число семей
Накопленные
Частоты
S
тыс.
f
% к итогу
w
А
1
2
3
1
0
6
5,9
6
2
1
28
27,5
34
3
2
22
21,3
56
4
3
20
19,6
76
5
4
13
12,7
89
6
5
8
7,8
96
7
6 и более
5
4,9
102
Итого
102
100,0
–
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину.
Интервальный – вариационный ряд, в котором группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения; Строится, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико.
Если интервальный вариационный ряд построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности, при неравных интервалах – нельзя получить такую информацию, т.к. частоты в интервалах непосредственно несопоставимы.
Для того чтобы частоты можно было бы сравнить, исчисляют плотность распределения.
Абсолютная плотность распределения – это частота, приходящаяся на единицу интервала, т.е. .
Относительная плотность распределения – это частость, приходящаяся на единицу интервала, т.е. .
Плотность распределения используется в рядах с неравными интервалами для расчета моды.
Пример интервального ряда с неравномерными интервалами приведен в табл. 4.4 (заметим, при равных интервалах графа 3 не нужна).