- •Тема 1. Предмет и метод статистики
- •Тема 2. Статистическое наблюдение
- •Примеры
- •Тема 3. Сводка и группировка данных
- •Пример 1 (группировка):
- •Пример 2 (вторичная группировка)
- •Тема 4. Статистические показатели. Абсолютные и относительные величины
- •Примеры
- •Тема 5. Средние величины
- •1. Теория средних величин
- •Понятие о средней величине.
- •3. Степенные средние величины
- •Средняя арифметическая
- •Пример 1 (средняя арифметическая простая)
- •Пример 2 (средняя арифметическая взвешенная в дискретных рядах)
- •Пример 3 (средняя арифметическая взвешенная в интервальных рядах)
- •Пример 5 (средняя гармоническая простая)
- •Пример 6 (средняя гармоническая простая).
- •Пример 7 (cредняя гармоническая взвешенная)
- •Пример 8 (cредняя гармоническая взвешенная)
- •Средняя квадратическая и средняя кубическая
- •Пример 9 (средняя квадратическая)
- •Средняя геометрическая
- •Правило мажорантности средних величин
- •4. Структурные средние
- •Пример 12 (структурные средние)
- •Тема 6. Ряды динамики
- •Пример 1
- •Пример 2.
- •Тема 7. Показатели вариации и другие характеристики рядов распределения
- •7.1. Понятие о вариации
- •7.2. Показатели вариации и способы их расчета
- •7.3. Основные свойства дисперсии
- •7.4. Правило сложения дисперсий
- •7.5. Ряды распределения и их моделирование
- •Значение моментов распределения
- •Тема 8. Выборочное наблюдение
- •8.1. Общие сведения о выборочном наблюдении
- •8.2. Виды и схемы отбора
- •8.3. Определение средних и предельных ошибок при различных видах отбора
- •8.4. Определение необходимой численности выборки
- •Тема 9. Индексы
Тема 3. Сводка и группировка данных
В результате первой стадии исследования – статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии – упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Это достигается путем сводки и группировки первичного статистического материала.
Сводка – это комплекс операций по обобщению конкретных единичных фактов, образующих совокупность. Служит для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Центральным моментом сводки является группировка.
Группировкой называется разделение единиц изучаемой совокупности на однородные группы по определенному существенному для них признаку. В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные и аналитические.
Типологические группировки позволяют выделить социально-экономические типы явлений. Выполняются в разнородной совокупности. Например, с помощью этой группировки можно изучить распределение основных фондов по формам собственности; выделить в секторах экономики крупные, средние и мелкие предприятия. Структурные группировки служат для изучения структуры однотипных явлений. Например, группировка населения по возрастным группам, группировка предприятий по размеру основных фондов. Аналитические группировки служат для исследования взаимосвязи между явлениями в однокачественной совокупности. Например, для установления взаимосвязи между энерговооруженностью труда и производительностью труда рабочих.
Группировка показателей производится по определенному признаку. Признаки бывают атрибутивные, альтернативные и количественные. По роли во взаимосвязи явлений признаки подразделяют на факторные (оказывающие влияние) и результативные (изменяющиеся под воздействием факторных).
Методика группировки состоит из следующих этапов:
выбор группировочного признака;
определение числа групп (k);
определение интервала группировки (i);
непосредственно группировка, то есть распределение совокупности по выделенным группам.
Число групп определяется в зависимости от содержания группировочного признака: если признак атрибутивный, число групп определяется по числу разновидностей признака; если признак количественный число групп определяется расчетным путем.
Аналитическая группировка имеет свои особенности:
в качестве группировочного признака выбирается факторный (
);
после распределения единиц совокупности на группы по (х) в каждой группе рассчитывается среднее значение результативного признака (
);
по характеру изменения x и у устанавливают наличие или отсутствие зависимости и её направление.
Интервалы группировки могут быть равные и неравные.
Группировку с равными интервалами выполняют, когда вариация признака невелика, а группировку с неравными интервалами, когда размах вариации признака велик и его значения варьируют неравномерно.
1. При группировке с равными интервалами размер интервала равен:
если
количество групп известно:
,
где k - количество групп.
б) если количество групп не известно;
когда объем совокупности более 30 единиц, то есть n > 30
.
2. При группировке с неравными интервалами порядок проведения группировки следующий:
- при равнонаполненных интервалах:
количество групп (k) задается или рассчитывается по формуле, как и при группировке с равными интервалами;
определяется количество единиц,
которое должно быть в каждой группе:
;
ранжируются единицы совокупности по возрастанию группировочного признака;
проводится непосредственно группировка.
Если изменение размеров количественного признака приводит к переходу
от одного качества к другому, граница интервала устанавливается в том месте, где осуществляется этот переход. Рамки границ зависят от условий места и времени. Например, при группировке предприятий по численности работников на малые, средние и большие устанавливаются более короткие интервалы для малых предприятий, и более длинные – для крупных.
Специализированные интервалы применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Например, распределение предприятий различных видов деятельности по уровню рентабельности.
Если в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности или нужно привести к сопоставимому виду группировки с различными интервалами, выполняют перегруппировку данных (вторичную группировку). Методика проведения вторичной группировки включает последовательное решение двух задач: изменение величины интервалов группировок и пересчет частот или удельных весов групп. В процессе наблюдения и сводки данных получают статистические ряды, которые по содержанию подразделяют на: ранжированные, ряды распределения и ряды динамики.
Расположение признака в порядке возрастания или убывания образует ранжированный ряд. Статистическим рядом распределения называют упорядоченное расположение единиц совокупности по какому-либо группировочному признаку с указанием частоты его появления. Ряды распределения бывают: вариационные (построенные по количественному признаку), атрибутивные.
Вариационные ряды распределения могут быть дискретные (признак представлен в виде отдельных чисел, чаще целых) и интервальные (признак представлен в виде интервала “от … до …”).
Любой ряд распределения состоит из двух элементов: вариантов (признаков) – x и частот – f. Частоты – число повторений признака в совокупности. Частоты, выраженные в долях единицы или в процентах к итогу, называют частостями, сумма которых равна 1 или 100%.
Анализ рядов распределения можно проводить наглядно на основе их графического изображения. Для этого строят полигон, гистограмму, кумуляту и огиву распределения.
Результаты статистической сводки и группировки удобнее всего располагать в виде таблиц. Таблица, имеющая название, наименование строк и граф, которые ещё не заполнены цифрами, называется макетом таблицы.
Каждая статистическая таблица имеет подлежащее и сказуемое. Подлежащее таблицы - это объект изучения, располагается обычно слева, в виде наименования горизонтальных строк. Сказуемое – это система показателей, которыми характеризуется объект изучения, располагается справа в виде наименования вертикальных граф. В зависимости от построения подлежащего различают следующие виды таблиц: простые, групповые и комбинационные. Простые – таблицы, в подлежащем которых нет группировок, а дается лишь перечень единиц совокупности (перечневые таблицы), административных единиц (территориальные таблицы) или периодов времени (хронологические таблицы). Подлежащее может быть представлено сочетанием этих признаков. Пример макета простой перечневой таблицы 3.1:
Таблица 3.1
Цены на основные виды горючего
Виды горючего |
Средняя цена, руб./т. |
Объём партии, т. |
А |
1 |
2 |
Бензин A-76 |
|
|
Бензин A-92 |
|
|
Дизельное топливо |
|
|
Примером макета территориальной таблицы может служить таблица 3.2:
Таблица 3.2
Территория земного шара, млн. км2.
Части света |
Численность населения, млн. чел. |
Площадь, км2 |
Европа |
|
|
Азия |
|
|
Америка |
|
|
Африка |
|
|
Австралия |
|
|
Антарктида |
|
|
Простым хронологическим является макет таблицы 3.3:
Таблица 3.3
Численность населения России за 2009-2012 гг.
Годы |
Всё население, млн. чел. |
В том числе |
|
городское |
сельское |
||
А |
1 |
2 |
3 |
2009 |
|
|
|
2010 |
|
|
|
2011 |
|
|
|
2012 |
|
|
|
Групповые таблицы в подлежащем содержат группировку единиц совокупности по одному признаку:
Таблица 3.4
Распределение работников фирмы по уровню образования
на 1.01.2013г., чел.
Уровень образования |
Всего работников |
в том числе |
|
мужчин |
женщин |
||
А |
1 |
2 |
3 |
Высшее |
|
|
|
Средне специальное |
|
|
|
Среднее |
|
|
|
Итого |
|
|
|
Комбинационные – таблицы, в которых подлежащее содержит группировку единиц совокупности по двум и более признакам, взятым в сочетании:
Таблица 3.5
Среднегодовая численность работников предприятия за 2012г., чел.
Группы работников предприятия по уровню образования |
Численность работников, чел. |
||
Всего |
в том числе |
||
мужчины |
женщины |
||
1. Рабочие – всего, |
|
|
|
в том числе с образованием: |
|
|
|
- средним |
|
|
|
- средним специальным |
|
|
|
- высшим |
|
|
|
2. Служащие – всего, |
|
|
|
в том числе с образованием: |
|
|
|
- средним |
|
|
|
- средним специальным |
|
|
|
- высшим |
|
|
|
Показатели сказуемого таблицы могут иметь простую разработку и сложную. В первом случае показатели располагаются последовательно друг за другом, а во втором – показатели даются в комбинации (делятся на группы и подгруппы). Если в сказуемом показатели даны за один период времени, таблица называется статической. Все приведенные выше макеты таблиц являются по построению сказуемого статическими. Если в сказуемом явление изменяется во времени, таблица называется динамической, например, таблица 3.6:
Таблица 3.6
Состав населения г. Иркутска за 1990 и 2013 гг., чел.
Пол |
Годы |
|
1990 |
2013 |
|
А |
1 |
2 |
Мужчины |
|
|
Женщины |
|
|
Итого |
|
|
Для анализа взаимосвязей между факторным и результативным признаками строятся таблицы взаимной сопряженности, в подлежащем которых представлена группировка по факторному признаку, а в сказуемом – по результативному. Такие таблицы содержат числовую характеристику изучаемой совокупности по двум и более атрибутивным признакам или комбинации количественных и атрибутивных.
Таблица 3.7
Распределение семей по среднедушевому доходу и
уровню потребления фруктов
Группы семей по среднедушевому доходу, тыс. руб. |
Группы семей по уровню потребления фруктов за год на душу населения, кг. |
||||
До 30 |
30 - 40 |
40 - 50 |
50 - 60 |
Свыше 60 |
|
До 20 |
|
|
|
|
|
20 - 40 |
|
|
|
|
|
40 - 60 |
|
|
|
|
|
60 - 80 |
|
|
|
|
|
Свыше 80 |
|
|
|
|
|
Основные правила составления таблиц:
Каждая таблица должна иметь номер и название, в котором указывается содержание таблицы, объект наблюдения и период времени.
Необходимо указывать единицы измерения показателей.
Названия строк и граф должны быть сформулированы ясно и кратко.
Следует нумеровать графы.
Округление чисел нужно производить с одинаковой точностью, если признак меньше принятой точности, то ставится 0,00 или 0,000.
Таблица должна быть замкнутой, то есть иметь итоговые показатели.
Необходимо соблюдать принятые в таблицах условные обозначения:
“-”, если явление отсутствует,
“нет сведений” или “…”, если явление присутствует, но сведения о нем отсутствуют,
“ ”,
если пересечение строки и графы не имеет
смысла.
