
- •Федеральное агентство по образованию
- •Содержание
- •Глава 1. Статистика как наука и методы статистического исследования
- •1.1. История развития статистики и ее задачи на современном этапе
- •1.2. Предмет и метод статистики
- •1.3. Структура отраслей статистической науки
- •1.4. Организация современной системы статистики рф
- •1.5. Статистическая информация и ее распространение
- •1.6. Статистическое наблюдение
- •1.6.1. Понятие о статистическом наблюдении
- •1.6.2. Подготовка статистического наблюдения
- •1.6.3. Формы, виды и способы наблюдения
- •Контрольные вопросы и задания
- •Глава 2. Сводка и группировка статистических данных
- •2.1. Статистическая сводка, ее задачи и виды
- •2.2. Группировка статистических данных
- •2.3. Механизм проведения группировки данных
- •2.4. Статистические ряды распределения
- •2.5. Наглядное представление статистических данных
- •Название таблицы (общий заголовок)
- •Объем основных услуг связи рф
- •Распределение предприятий, выставивших акции на чековые аукционы рф в 2006 г., по величине уставного капитала (цифры условные)
- •Группировка предприятий, выставивших акции на чековые аукционы рф в 2006 г., по величине уставного капитала числу занятых (цифры условные)
- •Распределение акций среди работников приватизированных предприятий промышленности
- •Распределение акций среди работников приватизированных предприятий промышленности
- •Структура населения г. Москвы
- •Потребление кофе на душу населения, кг
- •Структура возрастного состава населения г. Москвы
- •Вопросы для самоконтроля
- •Глава 3. Абсолютные, относительные и средние величины
- •3.1. Абсолютные величины
- •3.2. Относительные показатели
- •3.3. Средние величины
- •Степенные средние
- •Структурные средние
- •Вопросы для самоконтроля
- •Глава 4. Вариация признака
- •4.1. Вариация количественного признака
- •4.2. Дисперсия альтернативного признака
- •4.3. Правило сложения дисперсий
- •Вопросы для самоконтроля
- •Глава 5. Выборочное наблюдение
- •5.1. Понятие о выборочном наблюдении, сфера его применения
- •5.2. Ошибки выборки
- •Распределение вероятности в выборках в зависимости от величины t и объема выборки n
- •5.3. Объем выборки
- •Вопросы для самоконтроля
- •Глава 6. Анализ рядов динамики
- •6.1. Понятие о рядах динамики их виды
- •6.2. Показатели анализа рядов динамики
- •6.3. Методы анализа основной тенденции развития в рядах динамики и прогнозирование
- •6.4. Изучение сезонных колебаний
- •Вопросы для самоконтроля
- •Глава 7. Индексы
- •7.1. Понятие и виды индексов
- •7.2. Методы исчисления индексов
- •Основные формулы исчисления индивидуальных и сводных индексов
- •7.3. Индексы цен, их использование и экономический смысл
- •7.4. Индексы средних величин
- •Вопросы для самоконтроля
- •Глава 8. Изучение взаимосвязи социально-экономических явлений
- •8.1. Взаимосвязи между явлениями и их типы
- •8.2. Статистические методы моделирования связи
- •8.3. Однофакторный линейный корреляционно-регрессионный анализ
- •8.4. Нелинейные и многофакторные модели регрессии
- •8.5. Непараметрические показатели связи
- •Вопросы для самоконтроля
- •Медведева т.Ю. Статистика (общая теория статистики)
2.3. Механизм проведения группировки данных
При разделении исходных данных на группы необходимо придерживаться определенной последовательности действий или механизма.
Прежде всего, необходимо выделить группировочный признак, который будет положен в основание группировки.
Во-вторых, необходимо определить количество групп и величину интервала группировки. Вопрос о числе групп следует решать с учетом множества обстоятельств.
Если в основание группировки положен качественный признак, то групп будет столько, сколько существует градаций этого признака. Например, если в основание группировки рабочих предприятия положен группировочный признак – пол, то групп будет всего две: мужчины и женщины.
Если группировка проводится по количественному признаку, то следует учитывать численность изучаемой совокупности и степень колеблемости группировочного признака.
В случае малой численности, когда статистическая совокупность включает менее 30 единиц, то целесообразно выделить три группы, характеризующие передовую, отстающую части и «золотую середину». Это объясняется тем, что при небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными, что не отвечает требованию закона больших чисел.
Если изучаемая совокупность велика, то число групп определяется по формуле Стерджесса:
,
где N – количество единиц в изучаемой статистической совокупности.
Величина интервалов в этом случае принимается равной для всех групп и определяется по формуле:
,
где xmax и xmin – это максимальное и минимальное значения признака в совокупности;
m – число групп.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот.
Пусть произведена группировка рабочих предприятия по величине производительности труда (деталей за смену) и выделено 5 групп с равными интервалами: 10 15; 15 20; 20 25; 25 30; 30 35.
На практике может возникнуть случай, когда производительность труда рабочего составляет 20 деталей за смену. Возникает неопределенность: к какой группе его отнести, ко второй или третьей? Для устранения подобного рода неопределенности используют принцип единообразия — левая граница интервала включает в себя обозначенное значение, а правая — не включает. Таким образом, работник, производительность труда которого составляет 20 деталей, должен быть отнесен к третьей группе.
В случае если в основание группировки положено несколько признаков, то необходимо привести описание того, как они комбинируются между собой.
2.4. Статистические ряды распределения
Ряды распределения обычно выступают в качестве составной части сводки статистических данных, т.к. являются разновидностью простой группировки. Однако в ряде случаев ряды распределения приобретают самостоятельное значение. Они строятся с целью изучения состава исследуемой совокупности, ее однородности, колеблемости значений признаков и границ их изменения. На основе рядов распределения рассчитываются относительные величины структуры и средние показатели.
Ряд распределения в статистике это ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, значения которого расположены в определенной последовательности.
Ряд распределения включает два элемента:
1. варианты значения признака;
2. частоты – это численность отдельных групп, т.е. числа, которые показывают, сколько раз данное значение признака встречается в исследуемой совокупности.
Частоты, выраженные в виде относительных величин (долях единиц, процентах), называются частостями. Замена частот частостями позволяет сопоставлять ряды распределения с разным числом наблюдений.
Сумма всех частот ряда называется его численностью или объемом распределения.
Ряды распределения, построенные по атрибутивным признакам (в порядке возрастания или убывания наблюдаемых знаний), называются атрибутивными. Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т.д.
Ряды распределения, построенные по количественному признаку, называются вариационными. Например, распределение населения по возрасту, рабочих — по стажу работы, заработной плате и т.д.
Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных признаках, принимающих только целые значения (например, тарифный разряд рабочих, число детей в семье), а интервальные — на непрерывных признаках (имеющих любые значения, в том числе и дробные).
Правила построения ряда распределения аналогичны правилам построения группировки. Но иногда при наличии достаточно большого количества вариантов значений признака ряд распределения является трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т. е. расположение всех вариантов в возрастающем (или убывающем) порядке.
Для анализа рядов распределения чаще всего используют их графическое изображение, позволяет судить о форме распределений единиц совокупности по значениям группировочного признака.