- •9 Статистическое изучение взаимосвязей
- •9.1 Понятие и виды связей между социально-экономическими явлениями
- •9.2 Статистические методы моделирования связи
- •9.2.1 Двухмерная линейная модель корреляционного и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ)
- •9.2.3 Многофакторный корреляционный и регрессионный анализ
- •9.3 Показатели корреляционной связи (зависимости)
- •9.3.1 Линейные коэффициенты
- •9.3.2 Ранговые коэффициенты корреляции
- •9.3.3 Коэффициент Фехнера (коэффициент корреляции знаков)
- •9.3.4 Коэффициент конкордации
- •9.4 Непараметрические методы
9.2 Статистические методы моделирования связи
Для изучения функциональных связей применяются балансовый и индексный методы.
Для исследования стохастических связей широко используется:
- метод сопоставления двух параллельных рядов,
- метод аналитических группировок,
- корреляционный анализ,
- регрессионный анализ,
- некоторые непараметрические методы.
Метод сопоставления двух параллельных рядов - позволяет установить наличие стохастической связи и получить представление о ее характере и направлении. Для этого факторы, характеризующие результативный признак, располагают в возрастающем или убывающем порядке (в зависимости от эволюции процесса и целей исследования), а затем прослеживают изменение величины результативного признака.
К недостатку метода взаимозависимых параллельных рядов следует отнести невозможность определения количественной меры связи между изучаемыми признаками. Однако он удобен и эффективен, когда речь идет о необходимости установления связей между показателями и факторами, характеризующими экономический процесс.
Метод аналитических группировок – используют для изучения более четкого проявления стохастической связи. Чтобы выявить зависимость с помощью этого метода, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее или относительное значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного, можно выявить направление, характер и тесноту связи между ними с помощью эмпирического корреляционного отношения. Однако метод группировок не позволяет определить форму (аналитическое выражение) влияния факторных признаков на результативный.
Корреляционный и регрессионный анализ позволяет изучить не только количественную оценку наличия, направления и силы связи, но и определить формы (аналитического выражения) влияния факторных признаков на результативный.
Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых, должен быть выяснен с помощью теоретического анализа) и оценке факторов, оказывающих наибольшее влияние на результативный признак.
Задачи регрессионного анализа - выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной (функции регрессии).
Решение всех названных задач приводит к необходимости комплексного использования этих методов.
9.2.1 Двухмерная линейная модель корреляционного и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ)
Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака , на результативный признак и представляющая собой однофакторный корреляционный и регрессионный анализ.
При изучении связи экономических показателей производства (деятельности) используют различного вида уравнения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляционной связи ( уравнение регрессии) имеет вид:
,
(9.3)
где - теоретические значения результативного признака, полученные по уравнению регрессии;
-
коэффициенты (параметры) уравнения
регрессии.
Поскольку
является
средним значением
в
точке
,
экономическая интерпретация часто
затруднена или вообще невозможна.
Коэффициент
парной линейной регрессии
имеет
смысл показателя
силы связи
между
вариацией факторного признака
и
вариацией результативного признака
.
Уравнение
(9.3) показывает
среднее значение изменения результативного
признака
при
изменении факторного признака
на одну единицу его измерения,
т.е. вариацию
,
приходящуюся
на единицу вариации
.
Знак
указывает
направление этого изменения.
Параметры
уравнения
находят
методом
наименьших квадратов
- метод решения систем уравнений, при
котором в качестве решения принимается
точка минимума суммы квадратов отклонений.
Таким образом, в основу данного метода
положено требование минимальности сумм
квадратов отклонений эмпирических
данных
от выровненных
:
Для нахождения минимума функции приравниваем к нулю её частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
(9.4)
Решим эту систему в общем виде, находим параметры уравнения :
(9.5)
(9.6)
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
или
,
.
Определив
значения
,
подставив их в уравнение связи
,
находим значения
,
зависящие только от заданного значения
.
Пример 9.1. Рассмотрим построение однофакторного уравнения регрессии зависимости объема предоставленных кредитов от задолженности по кредитам .
Исходя из экономических соображений предоставленные кредиты выбраны в качестве независимой переменной . Сопоставление данных параллельных рядов признаков и (таблица 9.1) показывает, что с возрастанием признака (предоставленные в рублях кредиты), растет результативный признак (задолженность по кредитам в рублях). Следовательно, между и существует прямая зависимость, выраженная достаточно ясно.
Таблица 9.1 - Распределение лет по сумме предоставленных кредитов и задолженности по ним, в рублях
Исходные данные |
Расчетные данные |
|||||
Год |
Предоставленные кредиты в рублях, млрд. руб.
|
Задолженность по кредитам в рублях, млрд. руб.
|
|
|
|
|
2004 2005 2006 2007 2008 |
1,935 3,048 4,244 6,538 10,183 |
1,539 2,306 3,079 4,375 6,738 |
3,744 9,290 18,012 42,745 103,693 |
2,369 5,318 9,480 19,141 45,401
|
2,978 7,029 13,067 28,604 68,613 |
1,661 2,329 3,046 4,423 6,610 |
Итого |
|
|
|
|
|
|
Пользуясь расчетными значениями (см. таблицу 9.1), исчислим параметры для данного уравнения регрессии:
,
.
Следовательно, регрессионная модель распределения задолженности по предоставленным кредитам в рублях для данного примера может быть записана в виде конкретного простого уравнения регрессии:
.
Это
уравнение характеризует зависимость
среднего уровня предоставленных в
рублях кредитов от задолженности по
ним. Расчетные значения
,
найденные по данному уравнению, приведены
в таблице 9.1. Правильность расчета
параметров уравнения регрессии может
быть проверена сравнением сумм
(
,
(возникло
некоторое расхождение вследствие
округления расчетов)).
Корреляционный анализ имеет своей задачей количественное определение тесноты связи не только между двумя признаками (при парной связи), но и между результативным признаком и множеством факторных признаков (при многофакторной связи).
