- •9. Статистическое изучение взаимосвязи социально-экономических явлений 101
- •1. Основные понятия статистики
- •2. Статистическое наблюдение
- •2.1. Основные организационные формы, виды и способы статистического наблюдения Организационные формы статистического наблюдения
- •Способы статистического наблюдения
- •Виды статистического наблюдения
- •2.2. Точность статистического наблюдения
- •3. Статистическая сводка и группировка
- •3.1. Вторичная группировка, ее виды
- •Расчет численности групп на основе метода долевой перегруппировки
- •4. Статистические таблицы
- •Название таблицы*
- •4.1. Основные правила построения статистических таблиц
- •5. Графическое изображение статистических данных
- •5.1. Классификация статистических графиков
- •6. Статистические показатели, их виды
- •6.1. Виды признаков и шкал
- •Сравнительные характеристики различных видов шкал
- •6.2. Статистические показатели, их виды
- •7. Статистическое распределение выборки и показатели, рассчитываемые на его основе.
- •7.1. Статистическое распределение выборки
- •Табличная форма представления
- •7.2. Средние величины
- •7.3. Структурные характеристики статистических рядов
- •7.4. Показатели вариации
- •7.5. Построение теоретического закона распределения по опытным данным
- •Расчет выборочных характеристик
- •1. Дискретные случайные величины
- •2. Непрерывные случайные величины
- •Расчет χ2-критерия Пирсона
- •Расчет χ2-критерия Пирсона
- •Расчет величины d
- •7.6. Моменты распределения. Асимметрия и эксцесс
- •8. Выборочное наблюдение
- •8.1. Сущность и этапы выборочного наблюдения
- •8.2. Методы формирования выборок
- •8.3. Виды выборок
- •8.4. Статистические оценки параметров распределения
- •8.4.1. Понятие и свойства точечных оценок
- •8.4.2. Методы получения точечных оценок
- •8.4.3. Сущность интервального оценивания
- •Формулы расчета стандартной ошибки выборки7
- •8.4.4. Оценка параметров генеральной совокупности по малым выборкам
- •8.5. Определение необходимой численности выборки
- •Формулы расчета численности выборки
- •8.6. Распространение результатов полученных по выборке на генеральную совокупность
- •9. Статистическое изучение взаимосвязи социально-экономических явлений
- •9.1. Сущность причинно-следственной связи, ее виды
- •9.2. Корреляционный анализ количественных признаков
- •9.2.1. Парная корреляция
- •9.2.1.1. Метод сопоставления параллельных данных
- •Основные показатели деятельности предприятий
- •9.2.1.2. Метод группировок
- •9.2.1.3. Выборочный линейный коэффициент корреляции к. Пирсона
- •9.2.2. Частная и множественная корреляция
- •9.3. Корреляционный анализ качественных признаков
2.2. Точность статистического наблюдения
Точностью статистического наблюдения называют степень соответствия величины (значения) какого-либо признака, определенной по материалам статистического наблюдения, действительной его величине.
Расхождение между расчетным и действительным значениями изучаемых величин называется ошибкой наблюдения.
Точность данных – это основное требование, предъявляемое к статистическому наблюдению. Чтобы избежать ошибок наблюдения, предупредить, выявить и исправить их, необходимо:
1) обеспечить качественное обучение персонала, который будет проводить наблюдение;
2) организовать специальные частичные или сплошные контрольные проверки правильности заполнения статистических формуляров;
3) провести логический и арифметический контроль полученных данных после окончания сбора информации.
В зависимости от причин возникновения выделяют ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации – это отклонения между значением показателя, полученного в ходе статистического наблюдения, и фактическим, действительным его значением. Этот вид ошибок может быть возникать как при сплошном, так и несплошном наблюдении.
Ошибки регистрации бывают случайные и систематические.
Случайные ошибки – это результат действия различных случайных факторов. Данные ошибки могут, как завышать, так и занижать значения исследуемых показателей. При достаточно большой обследуемой совокупности в результате действия закона больших чисел эти ошибки взаимно погашаются.
Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к завышению, либо к занижению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку.
В отличие от ошибок регистрации ошибки репрезентативности характерны только для несплошного наблюдения. Они возникают потому, что отобранная и обследованная совокупность недостаточно точно воспроизводит (репрезентирует) всю исходную совокупность в целом.
Отклонение значение показателя обследованной совокупности от его величины по исходной совокупности называется ошибкой репрезентативности.
Ошибки репрезентативности также бывают случайные и систематические. Случайные ошибки возникают, если отобранная совокупность неполно воспроизводит всю совокупность в целом. Ее величина может быть оценена.
Систематические ошибки репрезентативности появляются вследствие нарушения принципов отбора из исходной совокупности единиц, которые должны быть подвергнуты наблюдению.
3. Статистическая сводка и группировка
На основе информации, собранной в ходе статистического наблюдения (СН), как правило, нельзя непосредственно выявить и охарактеризовать закономерности социально-экономических явлений. Это связано с тем, что наблюдение дает сведения по каждой единице исследуемого объекта, и, полученные данные не являются обобщающими показателями.
Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получения на этой основе сводной характеристики всего объекта при помощи обобщающих статистических показателей.
Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.
По глубине обработки материала сводка бывает простой и сложной.
Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения.
Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.
Проведению сводки предшествует разработка ее программы, включающей следующие этапы:
1) выбор группировочных признаков;
2) определение порядка формирования групп;
3) разработка системы статистических показателей для характеристики групп и объекта в целом;
4) разработка системы макетов статистических таблиц, в которых должны быть представлены результаты сводки.
По форме обработки материала сводка бывает децентрализованной и централизованной.
При децентрализованной сводке (используется, как правило, при обработке статистической отчетности) разработка материала производится последовательными этапами. Так отчеты предприятий сводятся статистическими органами субъектов РФ, а уже итоги по региону поступают в Госкомстат РФ, и там определяются показатели в целом по народному хозяйству страны.
При централизованной сводке весь первичный материал поступает в одну организацию, где и подвергается обработке от начала и до конца. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований.
По технике исполнения статистическая сводка подразделяется на автоматизированную и ручную.
Отдельные единицы статистической совокупности объединяются в отдельные группы при помощи группировки, что позволяет «сжать» информацию и сделать ее более наглядной.
Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным признакам (которые называют группировочными или основанием группировки).
В каждом конкретном исследовании включение признака в состав группировочных зависит от целей данного исследования и должно быть теоретически обосновано. Только на базе теоретического анализа экономических законов развития исследуемого явления можно правильно определить состав признаков.
Всю совокупность группировочных признаков можно разбить на две группы: атрибутивные (качественные) и количественные.
С помощью группировки решаются задачи, которые можно представить в виде последовательности следующих этапов:
1) выделение социально-экономических типов явлений (типологическая группировка);
2) изучение структуры явления и структурных сдвигов, происходящих в нем (структурная группировка);
3) выявления связи и зависимости между явлениями (аналитическая группировка).
Группировку называют простой, если в ее основу закладывается один группировочный признак, и сложной – если несколько взаимосвязанных признаков.
Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки (классификацией). Классификацией называют систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основе их сходства и различия. Как правило, в основе типологической группировки закладывается атрибутивный (качественный) признак. Примером типологической группировки может служить группировка промышленных предприятий по формам собственности (федеральная, субъектов Федерации, муниципальная, частная и др.).
Структурной называют группировку, в которой происходит разделение качественно однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. Как правило, в основу структурной группировки закладывается количественный признак. С помощью таких группировок, к примеру, может изучаться возрастная структура населения, состав предприятий по численности занятых, стоимости основных фондов и т.д.
Аналитической называют группировку, выявляющую взаимосвязи между различными признаками изучаемых социально-экономических явлений.
В процессе планирования группировки важным является определение порядка формирования групп. При небольшом объеме совокупности не следует образовывать большое число групп, так как они будут малочисленными, и показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.
Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака (измеряется посредством показателей вариации): чем больше его колеблемость, тем больше следует образовывать групп. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. В связи с этим в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать особенности объекта и цель исследования.
В практике исследований группировка проводится с использованием специализированных программных пакетов, реализующих стандартные процедуры группировки. К примеру, одна из таких процедур основана на формуле Г.А. Стерджесса для определения оптимального числа групп:
,
,
где n – объем исходной совокупности.
Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц (как правило, более 100) и распределение единиц по признаку, положенному в основании группировки, близко нормальному (гауссовскому).
После определения числа групп следует определить интервалы группировки. Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину (ширину), верхнюю и нижнюю границу или хотя бы одну из них.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границе – наибольшее значение признака в нем.
Различают открытые и закрытые интервалы. Открытые – это такие интервалы, у которых указана только одна граница, т.е. либо нижняя, либо верхняя (например, менее 10, более 3000). Закрытые интервалы имеют обе фиксированные границы (например, 10 – 20).
Величина интервала (ширина, интервальная разность) представляет собой разность между верхней и нижней границами интервала. Ширина открытого интервала принимается равной ширине смежного с ним интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
,
где R – размах вариации.
,
где xmax и xmin – максимальное и минимальное значение признака в совокупности.
Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения, т.е. если максимальные или минимальные значения сильно отличаются от смежных с ними значений группировочного признака, для определения величины интервала следует использовать не максимальное и минимальное значения, а значения несколько превышающее минимум и несколько меньшее, чем максимум.
Полученную величину интервала округляют, она является шагом интервала. Для удобства работы округление полученного значения величины интервала рекомендуется осуществлять в соответствии со следующими принципами:
если величина интервала имеет один знак до запятой, то ее значение целесообразно округлить до десятых долей единицы (к примеру, h=0,473≈0,5);
если величина интервала имеет два знака до запятой, то ее значение целесообразно округлить до целого числа (к примеру, h=10,473≈10);
если величина интервала представляет собой трехзначное, четырехзначное и так далее число, то ее значение целесообразно округлить до ближайшего целого числа, кратного 50 или 100 (к примеру, h=246≈250).
Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических процессов, особенно при анализе макроэкономических показателей.
Неравные интервалы могут быть прогрессивно возрастающие или убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:
,
в геометрической прогрессии:
,
где a – константа, которая будет положительной при прогрессивно возрастающих интервалах и отрицательной при прогрессивно убывающих;
q – положительная константа, которая при прогрессивно возрастающих интервалах больше 1, а при прогрессивно убывающих интервалах меньше 1.
При определении границ интервалов статистических группировок исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому. В данных случаях используют специализированные интервалы. Специализированными называют интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Например, группировка предприятий по числу занятых показывает, что в промышленности и строительстве предприятия со среднесписочной численностью работающих 75 – 100 человек относятся к группе малых предприятий, а в отраслях непроизводственной сферы и в розничной торговле – к крупным.
При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающими. Такие интервалы называют произвольными.