
- •Федеральное агентство по образованию
- •Содержание
- •Глава 1. Статистика как наука и методы статистического исследования
- •1.1. История развития статистики и ее задачи на современном этапе
- •1.2. Предмет и метод статистики
- •1.3. Структура отраслей статистической науки
- •1.4. Организация современной системы статистики рф
- •1.5. Статистическая информация и ее распространение
- •1.6. Статистическое наблюдение
- •1.6.1. Понятие о статистическом наблюдении
- •1.6.2. Подготовка статистического наблюдения
- •1.6.3. Формы, виды и способы наблюдения
- •Контрольные вопросы и задания
- •Глава 2. Сводка и группировка статистических данных
- •2.1. Статистическая сводка, ее задачи и виды
- •2.2. Группировка статистических данных
- •2.3. Механизм проведения группировки данных
- •2.4. Статистические ряды распределения
- •2.5. Наглядное представление статистических данных
- •Название таблицы (общий заголовок)
- •Объем основных услуг связи рф
- •Распределение предприятий, выставивших акции на чековые аукционы рф в 2006 г., по величине уставного капитала (цифры условные)
- •Группировка предприятий, выставивших акции на чековые аукционы рф в 2006 г., по величине уставного капитала числу занятых (цифры условные)
- •Распределение акций среди работников приватизированных предприятий промышленности
- •Распределение акций среди работников приватизированных предприятий промышленности
- •Структура населения г. Москвы
- •Потребление кофе на душу населения, кг
- •Структура возрастного состава населения г. Москвы
- •Вопросы для самоконтроля
- •Глава 3. Абсолютные, относительные и средние величины
- •3.1. Абсолютные величины
- •3.2. Относительные показатели
- •3.3. Средние величины
- •Степенные средние
- •Структурные средние
- •Вопросы для самоконтроля
- •Глава 4. Вариация признака
- •4.1. Вариация количественного признака
- •4.2. Дисперсия альтернативного признака
- •4.3. Правило сложения дисперсий
- •Вопросы для самоконтроля
- •Глава 5. Выборочное наблюдение
- •5.1. Понятие о выборочном наблюдении, сфера его применения
- •5.2. Ошибки выборки
- •Распределение вероятности в выборках в зависимости от величины t и объема выборки n
- •5.3. Объем выборки
- •Вопросы для самоконтроля
- •Глава 6. Анализ рядов динамики
- •6.1. Понятие о рядах динамики их виды
- •6.2. Показатели анализа рядов динамики
- •6.3. Методы анализа основной тенденции развития в рядах динамики и прогнозирование
- •6.4. Изучение сезонных колебаний
- •Вопросы для самоконтроля
- •Глава 7. Индексы
- •7.1. Понятие и виды индексов
- •7.2. Методы исчисления индексов
- •Основные формулы исчисления индивидуальных и сводных индексов
- •7.3. Индексы цен, их использование и экономический смысл
- •7.4. Индексы средних величин
- •Вопросы для самоконтроля
- •Глава 8. Изучение взаимосвязи социально-экономических явлений
- •8.1. Взаимосвязи между явлениями и их типы
- •8.2. Статистические методы моделирования связи
- •8.3. Однофакторный линейный корреляционно-регрессионный анализ
- •8.4. Нелинейные и многофакторные модели регрессии
- •8.5. Непараметрические показатели связи
- •Вопросы для самоконтроля
- •Медведева т.Ю. Статистика (общая теория статистики)
8.2. Статистические методы моделирования связи
Задача изучения взаимосвязей в общем виде состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие.
В статистике для изучения функциональных связей применяются балансовый и индексный методы.
Для исследования стохастических зависимостей используются следующие способы экономического анализа: сравнение параллельных и динамических рядов, метод аналитических группировок, графический метод. Однако они позволяют выявить только общий характер и направление связи. Основная же задача факторного статистического анализа — определить степень влияния каждого фактора на уровень результативного показателя. Для этой цели применяются корреляционно-регрессионный анализ, дисперсионный, компонентный, дискриминантный, многомерный факторный анализ и т.д.
На практике наиболее широкое применение нашли приемы корреляционно-регрессионного анализа, которые позволяют количественно выразить взаимосвязь между показателями.
Корреляционный анализ подразумевает исследование силы связи.
Задачи корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.
При проведении регрессионного анализа оцениваются форма связи и воздействие одних факторов на другие.
Задачи регрессионного анализа заключаются в установлении формы зависимости, определении функции регрессии и ее использовании для оценки неизвестных значений зависимой переменной.
8.3. Однофакторный линейный корреляционно-регрессионный анализ
Корреляционная связь - это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных.
Наиболее разработанной в теории статистики является методология так называемой парной корреляции - зависимости между двумя случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению другой. Например, зависимость между производительностью труда и объемом производства, зависимость между размерами активов банка и суммой прибыли банка; ростом производительности труда и стажем работы сотрудников.
Для выявления и оценки связи между изучаемыми признаками в корреляционно-регрессионном анализе необходимо построить регрессионную модель (уравнение регрессии), которая лучше других будет отражать реально существующие связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих исследований или осуществляться эмпирически – перебором и оценкой функций разных типов.
Наиболее простым уравнением, которое характеризует прямолинейную зависимость между двумя показателями, является уравнение прямой (уравнение однофакторной корреляционной связи):
ўx=a + bx,
где х — факторный признак; y — результативный признак; а и b — неизвестные параметры уравнения регрессии.
Это уравнение описывает такую связь между двумя признаками, при которой с изменением факторного показателя на определенную величину наблюдается равномерное возрастание или убывание значений результативного показателя.
Параметры a и b оцениваются с помощью специальных методов, наибольшее распространение из которых получил метод наименьших квадратов, суть которого заключается в том, чтобы подобрать параметры уравнения ўx=a + bx с таким расчетом, чтобы квадраты суммарных отклонений фактических значений ряда (yx) от найденных по статистической модели (ўx) были бы минимально возможными, то есть:
(yx – ўx)2 = min или (yx - a-bx)2 =min.
Для нахождения параметров a и b надо приравнять к нулю частные производные от полученного выражения по каждой искомой константе в отдельности. После соответствующих преобразований получают систему уравнений, которую называют нормальной:
yx= na + bx,
yx x= ax + bx2,
где n — количество наблюдений.
Подставив в систему имеющуюся исходную информацию, рассчитываются параметры а и b.
Параметр a является свободной переменной и не несет никакого экономического смысла, а параметр b – коэффициент регрессии - при наличии прямой зависимости имеет положительное значение, а в случае обратной зависимости – отрицательное. Кроме того, он показывает, насколько в среднем изменяется величина результативного признака y при изменении факторного признака x на 1.
Например, по данным о стоимости оборудования (x) и производительности труда (y) методом наименьших квадратов получено уравнение:
ўx = -12,14 + 2,08х.
В этом случае коэффициент b означает, что увеличение стоимости оборудования на 1 млн. руб. ведет в среднем к росту производительности труда на 2,08 тыс. руб.
Коэффициент регрессии применяют для определения коэффициента эластичности, который показывает, на сколько процентов изменится величина результативного признака y при изменении факторного признака x на 1%:
.
Для измерения тесноты связи между факторными и результативными показателями в однофакторном корреляционно-регрессионном анализе определяется коэффициент корреляции, который определяется по следующей формуле:
,
где х – факторный признак,
у - результативный признак,
–среднее
квадратическое отклонение по признаку
x,
–среднее
квадратическое отклонение по признаку
y.
Коэффициент корреляции принимает значение в интервале от -1 до +1.
Если |r|<0,3; то связь слабая; при |r|=(0,3..0,7) – средняя; при |r|>0,7 – сильная (тесная).
При |r|=1 связь называется функциональной, а при |r|=0 линейная связь между x и y отсутствует.
Квадрат коэффициента корреляции носит название коэффициента детерминации (R2).
Величина коэффициента детерминации служит одним из критериев качества линейной модели. Чем ближе его значение к 1, тем меньше роль случайных факторов, и, следовательно, данную линейную модель можно использовать для прогноза значений результативного признака.