Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций по статистике.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
16.1 Mб
Скачать

Методы определения количества групп в группировке.

По формуле Стерджесса

С применением показателя

среднего квадратичного отклонения (σ)

n = 1 + 3,322× lgN,

где n – количество групп,

N - численность совокупности

lgN – десятичный логарифм от N

Недостаток этого метода: дает хорошие результаты только, если совокупность состоит из большого числа единиц.

Весь диапазон изменения показателя предполагается равным.

Если величина интервала равна 0.5σ, то совокупность разбивается на 12 групп, когда 2/3 σ – на 9 групп, или σ – на 6 групп.

Недостаток этого метода: появляется вероятность «пустых» или малочисленных групп.

  1. Расчет ширины интервала.

Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определённой группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Каждый интервал имеет:

- длину (ширину) – разность между верхней и нижней границей интервала.

- верхнюю границу; или хотя бы одну из них

- нижнюю границу.

Например:

Объем оптового товарооборота за декабрь 2016г., тыс. руб.

Число предприятий

тыс. единиц

mi

% от общего

числа предприятий

wi

М енее 1

1-25

25-50 интервалы, где

50-100 первый показатель -

100-200 нижняя граница,

200-500 второй – верхняя.

Свыше 500

Итого

15,620

9,362

3,633

3,618

3,261

3,034

3,100

41,628

37,5

22,5

8,7

8,7

7,8

7,3

7,5

100,0

Итак, в данной таблице 25 -50 тыс. руб. – интервал, где 25 тыс. руб. -это нижняя граница, 50 тыс. руб. – верхняя граница интервала, 50-25= 25 тыс. руб. – ширина интервала.

Интервалы бывают:

- равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

- неравные: прогрессивно возрастающие, прогрессивно убывающие, произвольные, специализированные

- открытые, когда имеется только одну границу (верхняя – у первого, нижняя граница – у последнего интервала);

- закрытые, когда имеются и нижняя, и верхняя границы.

Пример произвольных интервалов:

Распределение населения РФ по величине среднедушевых доходов в месяц в 2009 г.*

Группа населения по величине среднедушевых денежных доходов в месяц, руб.

Удельный вес населения, % к итогу

До 2000,0

1,0

2000,1-4000,0

1,1

4000,1-6000,0

10,3

6000,1-8000,0

11,1

8000.1- 10 000.0

10,4

10 000,1- 15 000,0

20,4

15 000,1- 25 000.0

21,8

Свыше 25 000,0

18,6

Итого

100,0

Виды

интервалов

Метод определения величины (шага) интервала

Примечание

Равные

По формуле:

где h –шаг интервала (ширина)

, -максимальное и минимальное значение признака в совокупности;

n – число групп

Округление значений:

- если до запятой 1 знак, то округляется до десятых долей (0,88 ≈ 0,9; 1,585 ≈ 1,6; 4,72 ≈4,7);

- если шаг имеет 2 цифры до запятой, то округляется до целого числа (15,985 ≈16; 14,231 ≈ 14)

- если до запятой трехзначное, четырехзначное число и более, то округляется до ближайшего числа, кратного 100 или 50

Неравные

  1. Путем объединения двух или нескольких интервалов.

Этот метод применяется если:

- содержаться группы, не отражающие определенные типы изучаемого явления или процесса;

- имеются группы, не содержащие ни одной единицы совокупности («пустые»)

2) Для прогрессивно возрастающих и прогрессивно убывающих по формулам:

-арифметической прогрессии

hi+1 = hi + a

- геометрической прогрессии

hi+1 = hi×q

где hi - величина i-го интервала

a и q – константы (постоянная величина)

i-тым интервалом считается, тот интервал, которым мы сейчас рассматриваем

Константа a в арифметической прогрессии для прогрессивно возрастающих интервалах имеет знак «+», а прогрессивно убывающих – знак «-»

Константа q в геометрической прогрессии для прогрессивно возрастающих интервалах больше «1», а прогрессивно убывающих – меньше «1».

Специализированные.

Например: Характеристика отношения мужского населения к трудовой деятельности

0 – 15 лет

нетрудоспособные

16 – 18

лица полурабочего возраста

19 – 59

лица рабочего возраста

60 – 69

лица полурабочего возраста

70 и старше

нетрудоспособные

это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях, т.е. целью является отобразить качественное своеобразие групп. В этом случае в каждой группе есть особое свое содержание, и граница интервала устанавливается там, где происходит переход от одного качества к другому.

Произвольные* При изучении социально-экономических явлений на макроэкономическом уровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими (пример группировки с произвольными интервалами на стр. 23 конспекта)

Обозначение интервалов

По непрерывному признаку

По дискретному

признаку

  1. Например, группировка фирм по величине прибыли, тыс. руб.:

4200 – 4400

4400 – 4600

4600 – 4800

Как видим, верхняя граница совпадает с нижней границей второго интервала, верхняя – второго, с нижней третьего, и т.д. При таком обозначении нужно определиться, как формируется верхняя граница «включительно» или «исключительно».

Если верхняя граница формируется по принципу «включительно», то фирмы с величиной прибыли 4400, 4600 тыс. руб. будут отнесены к 1,2 группе соответственно.

Если верхняя граница формируется по принципу «исключительно», то фирмы с величиной прибыли 4400, 4600 тыс. руб. будут отнесены ко 2 и 3 группе соответственно.

Дискретный -­ прерывистый, дробный, состоящий из отдельных частей. Такой признак всегда представляется в виде целого (недробного) числа.

Например, группировка фирм по числу персонала, чел:

100-150

151-200

201-300

Т.е. верхняя граница 2,3, и т.д. интервалов больше на 1, чем показатель границы нижнего интервала предыдущей группы.

  1. Можно использовать открытые интервалы:

а) до 4400

4400 – 4600

4600 и более

Показатель 4400 тыс. руб. входит во вторую группу, а 4600 тыс. руб. – в третью.

б) до 4400

4400 – 4600

более 4600

Показатель 4400 тыс. руб. входит в первую группу, а 4600 тыс. руб. – во вторую.