Тема 1. Группировка статистических данных
Группировка - это распределение единиц совокупности по группам в соответствии с группировочным признаком. Назначение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, изучения взаимосвязей между признаками.
Различия в целевом назначении группировки выражаются в существующей в нашей статистике классификации группировок: типологические, структурные, аналитические.
При осуществлении любой группировки решается вопрос об определении числа выделяемых групп. При группировке по количественному признаку вопрос о числе групп решается на основе выделения однородных, близких по значению признака единиц совокупности. Необходимо, чтобы каждая группа характеризовала существенные типы явления. Число единиц в выделенных группах должно быть достаточным, чтобы характеристики, рассчитанные для отдельных групп, были статистически устойчивыми. Количество выделяемых групп зависит от вариации признака, числа наблюдений, а также от количества отдельных возможных значений признака, т.е. от числа вариант признака. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу.
Если число вариант велико, то значения группировочного признака для отдельных групп указываются в интервалах "от - до". Для этого всю область изменения признака разбивают на несколько интервалов и считают, сколько элементов попадает в отдельный интервал. Интервалы могут быть равными и неравными, открытыми и закрытыми. Группировку с неравными интервалами надо использовать, если размах вариации признака в совокупности велик, неравные интервалы применяются как прогрессивно возрастающие или убывающие. В этом случае границы каждого интервала устанавливаются исследователем. Однако, необходимо учесть, что наличие равных интервалов технически значительно облегчает вычисление различных статистических характеристик.
Равные интервалы применяются в случаях, когда изменение признака внутри совокупности происходит равномерно. Расчет величины интервала при равных интервалах производится по формуле:
,
где - величина отдельного интервала,
xmax - максимальное значение признака в исследуемой совокупности,
xmin - минимальное значение признака в исследуемой совокупности.
n - число групп,
Затем определяются границы каждого интервала:
для первого интервала: от xmin до xmin +;
для второго интервала: от xmin + до xmin + 2 ;
........................................................................
для n-го интервала: от xmin + n до xmax.
Типологическая группировка служит для выявления типов элементов явлений.
Структурная группировка служит для исследования совокупности по одному признаку.
После того, как в результате сводки статистические данные сгруппированы, они, как правило, представляются в виде таблицы. Макет таблицы для представления результатов структурной группировки может выглядеть следующим образом:
