Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции сокращен 14 час.doc
Скачиваний:
31
Добавлен:
02.09.2019
Размер:
1.78 Mб
Скачать

1) Производится группировка единиц совокупности по признаку-фактору;

2) по каждой полученной группе от6ираются соответствующие значения признака-результата и на их основе рассчитывается некоторый обобщающий показатель (чаще всего среднее значение);

3) анализируются изменения обобщающего показателя по группам и делается вывод о наличии или отсутствии взаимосвязи и ее направлении. Если изменение величены признака-фактора, положенного в основу группировки, вызывает изменение величины признака-результата в том же направлении, то связь прямая, в противном случае — связь обратная.

Приведем пример аналитической группировки студентов для характеристики зависимости признака-результата У – «оценка студента по статистике» от признака-фактора X — «посещаемость практических занятии по статистике». Исходные данные:

X 16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9

У 4 4 4 3 3 5 5 3 3 3 5 4 4 5 4 2 4 3 3 4

Результаты аналитической группировки представлены в табл.

Посещаемость

Количество студентов

Оценка по статистике

Средняя оценка студента в группе

[0;7]

7

4 5 2 3 3 3 4

3,4

(7:14]

7

4 3 5 3 3 4 4

3,7

(14;16]

6

4 4 4 3 5 5

4,2

Итого

20

X

X

Анализируя данную таблицу, можно заметить прямую зависимость результативного признака У — «оценка по статистике» от признака-фактора X — «посещаемость практических занятий по статистике» чем 6ольше занятии посетил студент тем выше его оценка по статистике. Данная зависимость наблюдается в среднем по совокупности. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.

Группировки делятся на простые (построены по одному признаку) и сложные (построены по двум и более признакам).

При построении сложной группировки рекомендуется сначала производить группировку по атрибутивным признакам (значения которых имеют ярко выраженные качественные различия), а затем - по количественным.

Принципы построения статистических группировок.

Построение группировки начинается:

I) с определения состава группировочных признаков.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования.

В основание группировки могут быть положены как количественные, так и атрибутивные признаки. Первые имеют числовое выражение (возраст человека, доход семьи и т. д.), а вторые отражают состояние единицы совокупности (пол человека, семейное положение, отраслевую принадлежность предприятия, его форму собственности и т. д.).

  1. необходимо определить количество групп, на которые надо разбить исследуемую совокупность.

Число групп зависит от:

  1. задач исследования и вида показателя, положенного в основание группировки;

  2. численности совокупности;

  3. степени вариации признака.

Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состоянии у этого признака. Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации.

Если группировка проводится по количественному признаку, то особое внимание обращается на число единиц исследуемого объекта и степень вариации группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как показатели, рассчитанные для таких групп, не будут представительными.

Определение числа групп можно осуществить и математическим путем с использованием формулы Стерджесса: n=1+3,322*lgN, (1)

где n - число групп;

N - число единиц совокупности.

Согласно формуле (1) выбор числа групп зависит от объема совокупности.

Недостаток формулы (1) состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному (Гаусса-Лапласа)

Другой способ определения числа групп основан на применении среднего квадратического отклонения (сигма). Если величина интервала равна 1/2 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 или , то совокупность делится соответственно на 9 и 6 групп. Однако при определении групп данным методом существует большая вероятность получения «пустых», или малочисленных, групп.

III) Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них, Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле: h=R/n=Xmax-Xmin/n

где хmax и хmin- максимальное и минимальное значения признака в совокупности; n - число групп.

Существуют следующие правила записи числа шага интервала. Если величина интервала рассчитанная по формуле (2), представляет собой величину, которая имеет один знак до запятой (например, 0,88; 1,585; 4,71), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере это будут соответственно значения: 0,9; 1,6; 4,7. Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой (например, 15,985), то это значение необходимо округлить до целого числа (до 16). В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 587 следует округлить до 600.

Если значение признака варьируется в широких пределах (от 10 до 1000то необходимо использовать группировку с неравными интервалами.

Например, по численности работающих предприятия могут быть разбиты на следующие группы с арифметически возрастающими величинами интервалов: до 100 человек, 100-200, 200-300, 300-500, 500-1000, 1000 и более человек, Это объясняется тем, что изменение количества работающих на 50—100 человек имеет существенное значение для мелких предприятий, а для крупных — не имеет;

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. У открытых интервалов указана только одна граница: верхняя - у первого, нижняя - у последнего. Например, группы коммерческих банков по уровню дохода работающих в них сотрудников (чел.): до 2200, 2200 -2300, 2300 - 2400, 2400 и более.

В зависимости от того, какой признак положен в основании группировки прерывный или непрерывный границы интервалов могут быть обозначены по-разному.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему работ (тыс. руб.): до 1200, 1200 - 1400, 1400 - 1600, 1600 - 1800, 1800 и более), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов.

При таком обозначении границ возникает вопрос, в какую группу включать объект, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом работ 1600 тыс. руб. Если нижняя граница формируется по принципу «включительно»), а верхняя - по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае — ко второй. Для того чтобы правильно отнести к группе единицу объекта можно использовать открытые интервалы (например, группы строительных фирм по объему работ преобразуются в следующие: до 1400, 1400 - 1600, 1600 - 1800, 1800 и более). Возможны два случая обозначения открытого последнего интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае строительные фирмы с объемом работ 1800 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит прерывный признак, то нижняя граница i-го интервала равна верхней границе (i-1) интервала, увеличенной на 1. Например, до 1400, 1401 - 1600, 1601 - 1800, 1801 и более.

От группировок следует отличать классификацию. Классификацией это систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. В основу классификации кладется атрибутивный признак. Они остаются неизменными в течение длительного периода времени, и разрабатываются органами государственной и международной статистики.

Пример. Произведем анализ 30 самых малых и средних коммерческих банков одного из регионов на 01.01.2008 г.), применяя метод группировок (табл. 1)

В качестве группировочного признака возьмем уставный капитал. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле:

H=Xmax-Xmin/n = (23100-2100)/4= 5 250 тыс. руб.

Обозначим границы групп:

2 100 – 7 350 7 350–12 600

12 600–17 850 17 850–23 100

Определен группировочный признак - уставный капитал, задано число групп - 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по указанным группам, и подсчитываются итоги по группам. Результаты группировки наносятся в таблицу, и определяются общие итоги по каждому показателю (табл. 2).

Таблица 2

№ группы

Группы банков по величине уставного капитала, тыс. руб.

Число банков, ед.

Работающие активы, тыс. руб.

Капитал, тыс. руб.

Уставный капитал, тыс. руб.

1

2100-7350

18

504898

342889

71272

2

7350-12600

6

343932

204694

58227

3

12600-17850

3

174079

130680

48281

4

17850-23100

3

217842

128573

62238

Итого

30

1240731

806836

240018

Структурная группировка коммерческих банков на основе данных табл.2 представ. в табл. 3

Таблица3. Структурная группировка характеризует состав однородной совокупности

№ группы

Группы банков по величине уставного капитала, тыс. руб.

Число банков, ед.

Число банков в % к итогу

Уставной капитал, % к итогу

Капитал, % к итогу

Работающие активы % к итогу

1

2100-7350

18

60

29,7

42,5

40,7

2

7350-12600

6

20

24,3

25,4

27,7

3

12600-17850

3

10

20,1

16,2

14,0

4

17850-23100

3

10

25,9

15,9

17,6

Итого

30

100

100

100,0

100,0

Из табл. 3 видно, что в основном преобладают малые банки –60%, на долю которых приходится 42,5% всего капитала.

Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки где признак результат величина работающих активов прямо зависим от признака фактора- величины уставного капитала (чем крупнее банк, тем эффективнее управление работающими активами.) табл. 4

№ группы

Группы банков по величине уставного капитала, тыс. руб.

Число банков, ед.

Капитал, тыс. руб.

Работающие активы, тыс. руб.

Всего

В среднем на один банк

Всего

В среднем на один банк

1

2100-7350

18

342889

19049

504898

28050

2

7350-12600

6

204694

34116

343932

57322

3

12600-17850

3

130680

43560

174079

58020

4

17850-23100

3

128573

42858

217842

72614

Итого

30

806836

1240731

В среднем на один банк

26895

41358

Ряды распределения

Ряды распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. Группировка, в которой для характеристики групп используется только один показатель–частота.

В зависимости от признака, положенного в основу ряда распределения, различают атрибутивные (построенные по качественным признакам) (пример, распределение студентов по полу) и вариационные ряды распределения (построенные по количественному признаку).

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретное значение варьирующего признака. Частотами называются численности отдельных вариантов, т. е. это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1, или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные ряды.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, распределение семей по числу детей, распределение рабочих по тарифному разряду. В случае непрерывной вариации признак может принимать определенные значения, отличающиеся друг от друга на сколь угодно малую величину. Построение интервальных вариационных рядов целесообразно при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах.

Примером такого ряда распределения может служить распределение работников организаций по уровню дохода.

Распределение работников строительной фирмы по уровню дохода в январе 2004г.

Группы работников по уровню дохода, руб.

Число работников, чел.

Удельный вес, % к итогу

До 5000

20

50

5000-1000

10

25

10000-15000

6

15

15000 и более

4

10

Итого

40

100,0

Правила построения рядов распределения аналогичны правилам построения группировки.

Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются значения вариантов, а по оси ординат величины частот. Полученные на пересечении абсцисс и ординат точки соединяют прямыми линиями и получают ломанную линию, называемую полигоном частот. Для замыкания полигона крайние точки (слева и справа на ломанной линии) соединяют с точками на оси абсцисс и получают многоугольник.

Гистограмма (рис.1) применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам.

Если середины верхних сторон прямоугольников соединить прямыми, то гистограмма может быть преобразована в полигон распределения (рис.2)

При построении гистограммы вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения (частота, рассчитанная на единицу ширины интервала) признака в соответствующих интервалах. Это необходимо сделать для того, чтобы получить возможности сравнивать частоты.

Для графического изображения вариационных рядов может использоваться также кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака, не большие, чем рассматриваемое значение.

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат - накопленные частоты. Затем эти перпендикуляры соединяют и получают ломанную линию, т. е. кумуляту. Если по оси ординат откладывать варианты значений признака, а по оси абсцисс частости, то получим огиву распределения.