Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по теории статистики - темы 12, 13, 14.doc
Скачиваний:
40
Добавлен:
19.09.2019
Размер:
267.26 Кб
Скачать

12.2 Статистические исследования формы корреляционной связи. Основные этапы корреляционного анализа

Форма корреляционной связи в основном определяется с помощью теоретического анализа, однако в ряде случаев приходится только предполагать наличие определённой формы связи. Эти предположения в последствии проверяют при помощи графического анализа.

В корреляционно-регрессионном анализе используются различные формы связи (12.1, 12.2, 12.3, 12.4):

1) прямолинейная

(12.1)

2) криволинейная в виде:

- параболы второго порядка (или высших порядков)

(12.2)

- гиперболы

(12.3)

- показательной функции

(12.4) и т.д.

Наиболее простым вариантом корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативным и факторным или между двумя факторными). Математически эту зависимость можно выразить как зависимость результативного показателя у от факторного показателя х. Связи могут быть прямые и обратные. В первом случае с увеличением признака х увеличивается и признак у, при обратной связи с увеличением признака х уменьшается признак у. Важнейшей задачей при этом является определение формы связи с последующим расчетом параметров уравнения, или, иначе, нахождение уравнения связи.

Уравнение парной линейной регрессии (12.5):

Уi теор = ао + а1 * хi . (12.5)

Параметры связи в этом уравнении, как правило, определяют из системы нормальных уравнений, которые должны отвечать требованию метода наименьших квадратов (МНК) (12.6):

(12.6)

Если связь выражена параболой второго порядка ( ), то систему нормальных уравнений для отыскания параметров a0 , a1 , a2 можно представить в виде (12.7):

(12.7)

Такую связь называют множественной линейной регрессией.

Выделяют также нелинейную регрессию, которая бывает двух классов:

1) регрессии нелинейные относительно включённых в исследование переменных, но линейные по параметрам;

2) нелинейность по оцениваемым параметрам.

Для оценки нелинейной регрессии чаще всего используют коэффициент эластичности (12.8), который показывает, на сколько процентов изменится у при изменении х на один процент:

Э = dУ/dХ * Х/У или Э = а1*х / у (для линейного уравнения). (12.8)

Выделяют следующие этапы анализа линейной корреляционной зависимости:

  1. сбор и подготовка исходных данных;

  2. построение поля корреляции;

  3. выбор формы связи;

  4. оценка тесноты связи.

  5. оценка коэффициента корреляции на достоверность.

Указанная оценка может быть проведена по коэффициенту значимости Стьюдента (12.9):

t расч = . (12.9)

При этом должно выполняться условие:

tрасч > tтаб (tтаб берётся из таблицы коэффициентов Стьюдента).

6) расчет коэффициентов регрессии для уравнения ух = ах + b(12.10, 12.11):

a = ;

b = . (12.10, 12.11)

7) расчет доверительных пределов отклонений.

Доверительные пределы отклонений (+/- d) – это расстояния вверх и вниз от теоретической линии, образующие доверительную область виде полосы вдоль теоретической линии, в которую с заданной вероятностью будут попадать все уi (12.12):

+/- d = +/- t таб . (12.12)

8) оценка предсказательной силы модели – осуществляется по двум критериям:

- остаточной дисперсии (оценка ведётся по коэффициенту вариации) (12.13):

(12.13) ;

Для экономических прогнозов коэффициент вариации должен быть меньше или равен 10%.

- критерию Фишера (12.14):

. (12.14)

Если , то предсказательная сила модели достаточная.

При изучении развития явления во времени часто возникает необходимость оценить степень взаимосвязи в изменениях уровней нескольких рядов динамики. Применение для этого методов классической теории корреляции связано с определенными особенностями:

1) в рядах динамики зачастую наблюдается зависимость между последующими и предшествующими уровнями. Наличие такой связи в статистической литературе называют автокорреляцией. При изучении взаимосвязи между рядами динамики с применением методов корреляционно-регрессионного анализа автокорреляция должна быть исключена из каждого из сравниваемых рядов динамики;

2) в изменении уровней нескольких рядов динамики, как правило, существует лаг, т.е. смещение во времени по сравнению с изменением уровней другого ряда динамики. Для получения более правильной оценки степени тесноты корреляционной связи также необходимо исключить этот лаг, т.е. нужно сдвинуть уровни одного ряда относительно другого на некоторый промежуток времени;

3) условия формирования уровней рассматриваемых рядов, как правило, изменяются. Соответственно может изменяться во времени и степень тесноты связи. В этих условиях речь идет о переменной корреляции.

Таким образом, при анализе корреляционной связи между рядами динамики необходимо:

1) измерить связь между предыдущими и последующими уровнями;

2) с учетом указанных выше особенностей изучить связь между рядами динамики.

Первая задача решается по каждому ряду динамики: в качестве факторного признака рассматриваются фактические уровни ряда, а уровни этого же ряда со сдвигом на один период принимаются в качестве результативного признака. Исчисляются коэффициенты автокорреляции и авторегрессии, при этом коэффициент автокорреляции рассчитывается на основе формулы коэффициента линейной (парной) корреляции. Если результаты расчета коэффициентов автокорреляции будут указывать на наличие автокорреляции уровней исходных рядов динамики, то для дальнейшего анализа корреляционной связи между рядами динамики нужно эту автокорреляцию исключить.