Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 Конспект лекций для ЗО (1).doc
Скачиваний:
26
Добавлен:
25.11.2018
Размер:
3.89 Mб
Скачать

2.2. Расчет числа и ширины интервалов группировки данных

1). Для качественного (атрибутивного) группировочного признака интервалов группировки не может быть!

2). Для количественного группировочного признака интервалы группировки устанавливаются только при условии непрерывности количественного признака.

Интервалы могут быть равными и неравными.

а). Неравные интервалы применяются при группировках, которые охватывают массу единиц неоднородной совокупности с неравномерными и значительными колебаниями признака.

б). Равные интервалы применяется при группировках единиц, составляющих однородные совокупности.

Ширина равного интервала определяется по формуле:

, (2.1)

где – максимальное и минимальное значение признака в совокупности;

– число интервалов (групп).

Важно! Поскольку в формуле (2.1) участвует максимальное и минимальное значение признака в совокупности, то данные перед группировкой следует ранжировать – расположить по возрастанию или убыванию значений признака.

Число групп определяется по формуле Стерджеса:

=1+3,22 lg n, (2.2)

где nчисло значений признака (единиц совокупности).

Согласно формуле (2.2) получаем оптимальное соотношение объема исследуемой совокупности (n) и числа групп (т) (табл. 2.1).

Таблица 2.1.

Таблица оптимальных соотношений объема исследуемой совокупности () и числа групп ()

15-24

25-44

45-89

90-179

180-359

360-719

5

6

7

8

9

10

Пример. Для =20 рабочих предприятия, попавших в обследование размера заработной платы, число групп будет равно =5 (табл. 2.2).

Таблица 2.2.

Группировка рабочих предприятия по размеру заработной платы

Номер группы

Группы (интервалы) по размеру заработной платы, руб.

Ширина группы (интервала), руб.

Количество рабочих, имеющих данную заработную плату

J

(границы групп )

(частота признака)

1

2

3

4

1

До 5 000

5 000

2

2

5 000 – 10 000

5 000

5

3

10 000 – 15 000

5 000

6

4

15 000 – 20 000

5 000

5

=5

20 000 и более

5 000

2

ВСЕГО

=20

При группировке данных необходимо знать следующее:

1. Минимальное и максимальное значение признака в группе называется нижней () и верхней () границей интервала (пример: в таблице 2.2 нижняя граница второго интервала по размеру заработной платы – 5 000 руб., верхняя граница второго интервала – 10 000 руб.).

2. Интервалы, в которых указана лишь одна граница (верхняя или нижняя), называются открытыми интервалами (пример: в таблице 2.2 открыт первый интервал – отсутствует нижняя граница; открыт пятый интервал – отсутствует верхняя граница размера заработной платы).

Форма записи открытых интервалов показывает, в какую группу относить единицу совокупности с пограничным значением признака (пример: табл. 2.2, в первый интервал входят рабочие с заработной платой до 5 000 руб. не включая, в пятый интервал входят рабочие с заработной платой равной или выше 20 000 руб.).

3. Пограничные значения признака всегда включаются в следующий интервал (пример: табл. 2.2, при наличии рабочих с заработной платой 5 000 руб. их численность включается в интервал, для которого пограничное значение является нижней границей, т.е. во второй интервал. Аналогично численность рабочих с заработной платой 10 000 руб. учитывается в третьем интервале и т.д.).

4. Ширина открытого интервала равна ширине прилежащего (последующего или предыдущего) интервала (пример: в таблице 2.2 ширина первого интервала равна ширине прилежащего (последующего к нему) – второго интервала: ; ширина открытого пятого интервала равна ширине прилежащего (предыдущего к нему) – четвертого интервала: ).

5. Все интервалы группировки должны быть заполнены единицами наблюдения (частота не может равняться нулю). В противном случае группировку следует повторить, уменьшив число интервалов на единицу (построить группировку повторно).

6. Мелкие группы (менее 10% совокупности) при группировке могут быть объединены рубрикой «прочие».