3) При наличии нескольких группировочных признаков описание того, как они комбинируются между собой;
4) установление показателей, которыми должны характеризоваться группы, т. е. сказуемого группировки.
Для правильного проведения группировки необходимо определить количество групп. Для определения количества групп используют формулу Стержерса:
,
где n число групп; N численность генеральной совокупности.
Интервалы определяются из расчета максимальных и минимальных значений изучаемой совокупности:
где h-интервальная
длина;
максимальное и минимальное значение
генеральной совокупности; n
- количество заданных групп.
Например,
Тогда 300-3240 – 1-й интервал;
3240-6180 – 2-й интервал и т.д.
Методология построения различных видов группировок.
Типологическая группировка может строиться для разных целей и по различным критериям.
По способу формирования типологических групп различают:
1) способ последовательных разбиений, заключающийся в формировании таких групп, все объекты которых имеют одинаковые значения классификационных признаков;
2) способ многомерной классификации. В этом случае объекты, образующие группы, могут иметь различные значения классификационных признаков.
Первый способ включает в себя два метода.
Во-первых, это типичный для него метод комбинационной группировки, при которой формирование групп производится путем последовательного разбиения сначала всей совокупности по одному признаку, затем полученных частей по другому и т. д., причем строго соблюдается принцип иерархии групп.
Во-вторых, это многошаговый метод последовательных разбиений совокупности. Способ многомерной классификации, когда группы формируются на основе близости объектов одновременно по большому числу признаков, получил широкое применение с разработкой методов распознавания образов и появлением ЭВМ.
При использовании методов комбинационной группировки классификация осуществляется путем последовательного логического деления совокупности по отдельным признакам.
Очередность этапов здесь такова:
1) наметка типов;
2) выбор группировочного признака (признаков);
3) определение числа групп и величины интервалов;
4) сведение выделенных групп в типы;
5) характеристика типов с помощью системы показателей
Ввариация количественных признаков может быть дискретной (прерывной) или непрерывной. Поэому различают дискретные и интервальные вариационные ряды. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 2.3.
В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй - помещены частоты вариационною ряда, а в третьей - показаны частости.
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационных рядов возможно также, если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. В табл. 2.3 представлен интервальный вариационный ряд.
Таблица 2.3
Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ (по данным переписи населения)
№ п/п |
Группы семей, проживающих в квартирах с числом комнат |
Число семей
|
|
всего, тыс. ед. |
% к итогу |
||
1 2 3 4 |
1 2 3 4 и более |
4064 12399 7659 832 |
16,3 49,7 30,7 3,3 |
|
Всего
|
24954
|
100,0
|
Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются значения варьирующего признака, а по оси ординат – значения частот.
Таблица 2.4
Распределение жилого фонда района по типу квартир
№ п/п |
Группы квартир по числу комнат |
Число квартир, тыс.ед. |
1 2 3 4 5 |
1 2 3 4 5 |
10 35 30 15 5 |
|
Всего
|
95
|
Полученные на пересечении абсцисс и ординат точки соединяются прямыми линиями, в результате этого получают ломаную линию, называемую полигоном частот. Иногда для замыкания полигона предлагается крайние точки (слева и справа на ломаной линии) соединить с точками на оси абсцисс. В этом случае получается многоугольник.
Например, на основе данных, представленных в табл. 2.4 построим полигон (рис. 2.3).
Рис. 2.3. Полигон распределения жилищного фонда
городского района по типу квартир
На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. В результате мы получим гистограмму - график, на котором ряд распределения изображен в виде смежных друг с другом столбиков.
Изобразим графически интервальный ряд распределения, приведенный в табл. 2.5 (рис. 2.3). Таблица 2.5
