Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
43
Добавлен:
10.06.2015
Размер:
164.35 Кб
Скачать

Сравнимость статистических группировок

(Шмойлова, со стр. 82 - примеры)

Группировки, построенные за один и тот период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Для того чтобы привести такие группировки к сопоставимому виду (это позволяет провести их сравнительный анализ), используется метод вторичной группировки. Суть метода состоит в перегруппировке единиц объекта без обращения к первичным данным.

Вторичная группировка – это операция по образованию новых групп на основе ранее построенной группировки.

Применяются два способа образования новых групп.

Объединение первоначальных интервалов (наиболее простой и распространенный способ). Применяется, когда нужно переход от мелких интервалов к более крупным интервалам, а также когда границы новых и старых интервалов совпадают.

Долевая перегруппировка состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые.

4. Ряд распределения.

4.1. Общие понятия

Статистическим рядом распределения (см. п. 2.1, первую схему) называется ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, разновидности которого расположены в определенной последовательности (другими словами, этот ряд представляет упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку).

Ряды распределения иногда входят в качестве составной части сводной обработки данных, при которых единицы совокупности характеризуются многими показателями (например, группы промышленных предприятий), иногда приобретают самостоятельное значение.

Ряды распределения строятся с целью изучения

  • состава исследуемой совокупности,

  • однородности совокупности,

  • колеблемости значений признаков и

  • границ их изменения.

На основе рядов распределения

  • рассчитываются относительные величины структуры,

  • средние показатели;

  • устанавливается типичность обобщающих показателей с позиций наблюдаемых единиц совокупности.

По своей конструкции ряд распределения состоит из двух элементов:

  • вариантов (числовых значений количественного признака или числа групп по выделенному признаку) и

  • частот (численности отдельных вариантов или численности групп, т.е. числа элементов в каждой группе).

Частости – частоты, выраженные в виде относительных величин (доли единиц – в этом случае сумма всех частот = 1, процентов – сумма = 100%). Ряд частостей обычно применяют, когда совокупность очень велика, кроме того; ряды частостей позволяют сравнивать распределения по одному и тому же признаку в разных по численности совокупностях.

Объем распределения (или его численность) – это сумма всех частот.

Накопленная частота (накопленная частость) для данного интервала получается суммированием (накапливанием) частот (частостей) у всех предшествующих интервалов, включая данный.

Вариационный ряд оформляется в виде статистической таблицы, например, см. табл. 4.1 для совокупности, состоящей из N единиц.

Атрибутивные – это ряды распределения, образованные по качественному (атрибутивному) признаку (см табл. 4.2).

Вариационные – это ряды, образованные по количественному признаку (см. табл. 4.4).

При наличии достаточно большого количества вариантов значений признака первичный ряд становится трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности, поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов в возрастающем (или убывающем) порядке.

По способу построения вариационные ряды делятся на дискретные и интервальные.

Дискретный – в ряду группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения (см. табл. 4.3).

Таблица 4.1

Вариант

Частота

.

.

.

.

.

.

Итого

(или ,N)

Таблица 4.2

п/п

Группы оборота по

Формам собственности

Млрд. руб.

% к итогу

1998

2000

1998

2000

А

1

2

3

4

1

Негосударственная

990,8

4129

93,0

95,5

из нее частная

852,3

1845

80,0

82,0

2

Государственная

74,4

102

7,0

4,5

Всего оборота розничной

торговли

1065,2

2251

100,0

100,0

Таблица 4.3

п/п

Группы семей

по числу детей

х

Число семей

Накопленные

Частоты

S

тыс.

f

% к итогу

w

А

1

2

3

1

0

6

5,9

6

2

1

28

27,5

34

3

2

22

21,3

56

4

3

20

19,6

76

5

4

13

12,7

89

6

5

8

7,8

96

7

6 и более

5

4,9

102

Итого

102

100,0

В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину.

Интервальный – вариационный ряд, в котором группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения; Строится, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико.

Если интервальный вариационный ряд построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности, при неравных интервалах – нельзя получить такую информацию, т.к. частоты в интервалах непосредственно несопоставимы.

Для того чтобы частоты можно было бы сравнить, исчисляют плотность распределения.

Абсолютная плотность распределения – это частота, приходящаяся на единицу интервала, т.е. .

Относительная плотность распределения – это частость, приходящаяся на единицу интервала, т.е. .

Плотность распределения используется в рядах с неравными интервалами для расчета моды.

Пример интервального ряда с неравномерными интервалами приведен в табл. 4.4 (заметим, при равных интервалах графа 3 не нужна).