Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции и примеры задач.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.05 Mб
Скачать

Тема 3. Сводка и группировка данных

В результате первой стадии исследования – статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии – упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Это достигается путем сводки и группировки первичного статистического материала.

Сводка – это комплекс операций по обобщению конкретных единичных фактов, образующих совокупность. Служит для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Центральным моментом сводки является группировка.

Группировкой называется разделение единиц изучаемой совокупности на однородные группы по определенному существенному для них признаку. В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные и аналитические.

Типологические группировки позволяют выделить социально-экономические типы явлений. Выполняются в разнородной совокупности. Например, с помощью этой группировки можно изучить распределение основных фондов по формам собственности; выделить в секторах экономики крупные, средние и мелкие предприятия. Структурные группировки служат для изучения структуры однотипных явлений. Например, группировка населения по возрастным группам, группировка предприятий по размеру основных фондов. Аналитические группировки служат для исследования взаимосвязи между явлениями в однокачественной совокупности. Например, для установления взаимосвязи между энерговооруженностью труда и производительностью труда рабочих.

Группировка показателей производится по определенному признаку. Признаки бывают атрибутивные, альтернативные и количественные. По роли во взаимосвязи явлений признаки подразделяют на факторные (оказывающие влияние) и результативные (изменяющиеся под воздействием факторных).

Методика группировки состоит из следующих этапов:

  • выбор группировочного признака;

  • определение числа групп (k);

  • определение интервала группировки (i);

  • непосредственно группировка, то есть распределение совокупности по выделенным группам.

Число групп определяется в зависимости от содержания группировочного признака: если признак атрибутивный, число групп определяется по числу разновидностей признака; если признак количественный число групп определяется расчетным путем.

Аналитическая группировка имеет свои особенности:

  • в качестве группировочного признака выбирается факторный ( );

  • после распределения единиц совокупности на группы по (х) в каждой группе рассчитывается среднее значение результативного признака ( );

  • по характеру изменения x и у устанавливают наличие или отсутствие зависимости и её направление.

Интервалы группировки могут быть равные и неравные.

Группировку с равными интервалами выполняют, когда вариация признака невелика, а группировку с неравными интервалами, когда размах вариации признака велик и его значения варьируют неравномерно.

1. При группировке с равными интервалами размер интервала равен:

если количество групп известно: ,

где k - количество групп.

б) если количество групп не известно;

когда объем совокупности более 30 единиц, то есть n > 30

.

2. При группировке с неравными интервалами порядок проведения группировки следующий:

- при равнонаполненных интервалах:

  • количество групп (k) задается или рассчитывается по формуле, как и при группировке с равными интервалами;

  • определяется количество единиц, которое должно быть в каждой группе: ;

  • ранжируются единицы совокупности по возрастанию группировочного признака;

  • проводится непосредственно группировка.

Если изменение размеров количественного признака приводит к переходу

от одного качества к другому, граница интервала устанавливается в том месте, где осуществляется этот переход. Рамки границ зависят от условий места и времени. Например, при группировке предприятий по численности работников на малые, средние и большие устанавливаются более короткие интервалы для малых предприятий, и более длинные – для крупных.

Специализированные интервалы применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Например, распределение предприятий различных видов деятельности по уровню рентабельности.

Если в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности или нужно привести к сопоставимому виду группировки с различными интервалами, выполняют перегруппировку данных (вторичную группировку). Методика проведения вторичной группировки включает последовательное решение двух задач: изменение величины интервалов группировок и пересчет частот или удельных весов групп. В процессе наблюдения и сводки данных получают статистические ряды, которые по содержанию подразделяют на: ранжированные, ряды распределения и ряды динамики.

Расположение признака в порядке возрастания или убывания образует ранжированный ряд. Статистическим рядом распределения называют упорядоченное расположение единиц совокупности по какому-либо группировочному признаку с указанием частоты его появления. Ряды распределения бывают: вариационные (построенные по количественному признаку), атрибутивные.

Вариационные ряды распределения могут быть дискретные (признак представлен в виде отдельных чисел, чаще целых) и интервальные (признак представлен в виде интервала “от … до …”).

Любой ряд распределения состоит из двух элементов: вариантов (признаков) – x и частот – f. Частоты – число повторений признака в совокупности. Частоты, выраженные в долях единицы или в процентах к итогу, называют частостями, сумма которых равна 1 или 100%.

Анализ рядов распределения можно проводить наглядно на основе их графического изображения. Для этого строят полигон, гистограмму, кумуляту и огиву распределения.

Результаты статистической сводки и группировки удобнее всего располагать в виде таблиц. Таблица, имеющая название, наименование строк и граф, которые ещё не заполнены цифрами, называется макетом таблицы.

Каждая статистическая таблица имеет подлежащее и сказуемое. Подлежащее таблицы - это объект изучения, располагается обычно слева, в виде наименования горизонтальных строк. Сказуемое – это система показателей, которыми характеризуется объект изучения, располагается справа в виде наименования вертикальных граф. В зависимости от построения подлежащего различают следующие виды таблиц: простые, групповые и комбинационные. Простые – таблицы, в подлежащем которых нет группировок, а дается лишь перечень единиц совокупности (перечневые таблицы), административных единиц (территориальные таблицы) или периодов времени (хронологические таблицы). Подлежащее может быть представлено сочетанием этих признаков. Пример макета простой перечневой таблицы 3.1:

Таблица 3.1

Цены на основные виды горючего

Виды горючего

Средняя цена, руб./т.

Объём партии, т.

А

1

2

Бензин A-76

Бензин A-92

Дизельное топливо

Примером макета территориальной таблицы может служить таблица 3.2:

Таблица 3.2

Территория земного шара, млн. км2.

Части света

Численность населения, млн. чел.

Площадь, км2

Европа

Азия

Америка

Африка

Австралия

Антарктида

Простым хронологическим является макет таблицы 3.3:

Таблица 3.3

Численность населения России за 2009-2012 гг.

Годы

Всё население, млн. чел.

В том числе

городское

сельское

А

1

2

3

2009

2010

2011

2012

Групповые таблицы в подлежащем содержат группировку единиц совокупности по одному признаку:

Таблица 3.4

Распределение работников фирмы по уровню образования

на 1.01.2013г., чел.

Уровень

образования

Всего

работников

в том числе

мужчин

женщин

А

1

2

3

Высшее

Средне специальное

Среднее

Итого

Комбинационные – таблицы, в которых подлежащее содержит группировку единиц совокупности по двум и более признакам, взятым в сочетании:

Таблица 3.5

Среднегодовая численность работников предприятия за 2012г., чел.

Группы работников предприятия по уровню образования

Численность работников, чел.

Всего

в том числе

мужчины

женщины

1. Рабочие – всего,

в том числе с образованием:

- средним

- средним специальным

- высшим

2. Служащие – всего,

в том числе с образованием:

- средним

- средним специальным

- высшим

Показатели сказуемого таблицы могут иметь простую разработку и сложную. В первом случае показатели располагаются последовательно друг за другом, а во втором – показатели даются в комбинации (делятся на группы и подгруппы). Если в сказуемом показатели даны за один период времени, таблица называется статической. Все приведенные выше макеты таблиц являются по построению сказуемого статическими. Если в сказуемом явление изменяется во времени, таблица называется динамической, например, таблица 3.6:

Таблица 3.6

Состав населения г. Иркутска за 1990 и 2013 гг., чел.

Пол

Годы

1990

2013

А

1

2

Мужчины

Женщины

Итого

Для анализа взаимосвязей между факторным и результативным признаками строятся таблицы взаимной сопряженности, в подлежащем которых представлена группировка по факторному признаку, а в сказуемом – по результативному. Такие таблицы содержат числовую характеристику изучаемой совокупности по двум и более атрибутивным признакам или комбинации количественных и атрибутивных.

Таблица 3.7

Распределение семей по среднедушевому доходу и

уровню потребления фруктов

Группы семей по

среднедушевому

доходу, тыс. руб.

Группы семей по уровню потребления фруктов за год на душу населения, кг.

До 30

30 - 40

40 - 50

50 - 60

Свыше 60

До 20

20 - 40

40 - 60

60 - 80

Свыше 80

Основные правила составления таблиц:

  • Каждая таблица должна иметь номер и название, в котором указывается содержание таблицы, объект наблюдения и период времени.

  • Необходимо указывать единицы измерения показателей.

  • Названия строк и граф должны быть сформулированы ясно и кратко.

  • Следует нумеровать графы.

  • Округление чисел нужно производить с одинаковой точностью, если признак меньше принятой точности, то ставится 0,00 или 0,000.

  • Таблица должна быть замкнутой, то есть иметь итоговые показатели.

  • Необходимо соблюдать принятые в таблицах условные обозначения:

“-”, если явление отсутствует,

“нет сведений” или “…”, если явление присутствует, но сведения о нем отсутствуют,

“ ”, если пересечение строки и графы не имеет смысла.