
Лекция 10. Корреляционно-регрессионный анализ
Зависимости бывают функциональными или корреляционными.
Переменные X и Y связаны корреляционной зависимостью, если каждому значению одной из них соответствует ряд распределения другой. При этом связь между факторными и результативными признаками проявляется через изменение средних величин.
Пример: Аналитическая группировка.
группы заводов по стоимости ОПФ |
количество заводов |
фонды (млн. руб.) |
Товарная продукция (млн. шт.) | ||
всего (∑) |
|
всего (∑) |
| ||
0,8-3,8 |
4 |
8,7 |
2,2 |
12,9 |
3,2 |
3,8-6,8 |
13 |
62,4 |
4,8 |
94 |
7,2 |
6,8-9,8 |
9 |
70,5 |
7,8 |
101,7 |
11,3 |
9,8-12,8 |
4 |
48,1 |
12 |
76,4 |
19,1 |
итого: |
30 |
189,7 |
- |
285 |
- |
Важной особенностью корреляционных связей является то, что они обнаруживаются не в единичных случаях, а в массе, что требует для исследования наличия значительного количества данных (не менее 15-20).
Задачи корреляционного анализа
1. Определение формы связи между факторными и результативными признаками (выбор математического уравнения, например, y = a+bx);
2. Определение параметров математического уравнения (a, b, c,…- коэффициенты регрессии).
3. Оценка тесноты связи между факторными и результативными признаками;
4. Оценка качества полученного уравнения (модели).
Способы выбора формы связи между факторными и результативными признаками
1. Путём теоретического анализа взаимосвязи между изучаемыми признаками.
2. При помощи аналитической группировки.
3. Графическое изображение показателей (графический анализ).
4. Графическое изображение корреляционной таблицы.
Схема №7: “Классификация корреляционной зависимости”
↓ |
↓ |
парная - корреляционная зависимость между двумя признаками: 1. прямолинейная (линейная) отображается уравнением: y = a+bx 2. криволинейная: 2.1. параболическая: y = a+bx+cx2 2.2. гиперболическая: y = a+b ∙ 1/x 2.3. степенная: y = axb |
многофакторная – корреляционная зависимость между несколькими признаками, отображается следующими уравнениями: y = a+bx1+cx2+dx3 y = ax1b ∙ x2c ∙ x3d… |
Для
составления парной корреляционно-регрессионной
модели (=
a+bx)
нам необходимо определить коэффициенты
регрессии (a, b,
c,…).
Для этого составим систему уравнений,
выразив один коэффициент через другой,
и решим её.
Правило составления алгоритма системы уравнений
1. Составим квадратичную матрицу из коэффициентов регрессии.
2. Слева, отступив на столбец и строку, сверху – на строку и столбец, запишем наши неизвестные.
3. Перемножим неизвестные слева и сверху на коэффициенты регрессии. Первый элемент первой строки умножим на n – количество наблюдений.
|
|
x |
y |
x |
a a |
b b |
|

a = …
b = …
Показатели корреляции
Для того, чтобы убедиться в статистической значимости уравнения регрессии, необходимо оценить тесноту связи, т.е. разброс фактических данных в поле корреляции или отклонение фактических данных от теоретической линии регрессии.
1. При
прямолинейной парной зависимости
теснота связи оценивается по парному
коэффициенту корреляции:
или
.
Коэффициент
корреляции имеет пределы: .
Если ,
то существует
Если r=0, то связь отсутствует.
функциональная зависимость.
r=1
r=-1
r=0
Если r > 0, то связь прямая; если r < 0, то связь обратная.
Коэффициент корреляции характеризует корреляционную зависимость.
Оценка тесноты связи
Если: r < 0,1 – связь отсутствует;
0,1 ≤ r ≤ 0,3 – связь слабая;
0,3 ≤ r ≤ 0,5 – связь заметная;
0,5 ≤ r ≤ 0,7 – связь умеренная;
0,7 ≤ r ≤ 0,9 – связь высокая;
0,9 ≤ r ≤ 0,99 – связь весьма высокая.
2. При криволинейной зависимости теснота связи оценивается индексом корреляции:
.
3. Чтобы
учесть колеблемость отдельных факторов
и привести их в единую систему измерения
(освободиться от различной размерности),
рассчитываются β
коэффициенты: .
Они показывают, на сколько сигм (средних квадратических отклонений) изменится результатирующий показатель при изменении x на 1 сигму (СКО).
4.
Коэффициент эластичности показывает,
на сколько процентов изменится
результатирующий показатель, при
изменении x на 1%: .
5.
Коэффициент детерминации: ,
6. -
эмпирическое корреляционное отношение.