- •Лекция №2. Парная регрессия и корреляция
- •1. Корреляционный анализ
- •1.1.Задачи корреляционно анализа
- •1.2.Ковариация
- •1.3.Дисперсия
- •1.4.Коэффициент парной корреляции
- •1.5.Качественная оценка коэффициента корреляции
- •1.6.Оценка значимости коэффициента парной корреляции
- •1.7.Парный коэффициент детерминации
- •2.Регрессионный анализ
- •2.1.Задачи регрессионного анализа
- •2.2.Линейная парная регрессия
- •2.3.Коэффициент эластичности
- •2.4.Формула определения бета - коэффициента
- •3.4.1.Проверка на случайность ряда остатков
- •3.4.2.Проверка на равенство нулю математического ожидания ряда остатков
- •3.4.3.Проверка на постоянство дисперсии ряда остатков
- •3.4.4.Проверка на независимость ряда остатков
- •3.4.5.Проверка на распределение ряда остатков по нормальному закону
- •3.5.Определение меры точности модели
- •3.6.Точечный и интервальный прогноз
1.1.Задачи корреляционно анализа
Установление численного значения корреляционной связи между изучаемыми признаками путем вычисления (парных, множественных и/или частных) коэффициентов корреляции
Измерение тесноты связи между признаками
Определение достоверности суждения о наличии связи (с помощью t-критерия Стьюдента)
Отбор факторов, оказывающих наибольшее влияние на результативный признак
Выявление ранее неизвестных причинных связей
1.2.Ковариация
Мерой взаимосвязи между двумя переменными является ковариация. Она построена на сумме отклонений индивидуальных значений признаков xi и yi от их средних значений.
Опр. При наличии n наблюдений двух переменных (x и y) ковариация между x и у задается формулой:
1.
При наличии прямой связи ковариация будет положительной.
При наличии обратной связи ковариация будет отрицательной величиной.
При отсутствии связи ковариация будет близка к нулю.
Размер ковариации зависит от масштаба признаков x и y.
Несколько основных правил расчета ковариации
Есть несколько важных правил, которые вытекают непосредственно из определения ковариации:
Правило 1
Если у = v + w, то Cov (x, у) = Cov (x, v) + Cov (x, w).
Правило 2
Если у = az, где a — константа, то Cov (x, у) = a Cov (x, z).
Правило 3
Если у = а, где я — константа, то Cov (x, у) = 0.
Альтернативное выражение для выборочной ковариации
Другим эквивалентным выражением является
1.3.Дисперсия
Опр. Дисперсия это средний квадрат отклонений индивидуальных значений признака от их средней величины:
.
Она характеризующие степень разброса
значений
(
)
вокруг своего среднего
(
,
соответственно), или вариабельность
(изменчивость) этих
переменных на множестве наблюдений.
Отсюда обозначение Var [variance].
Впрочем, более естественным было бы
измерение степени разброса значений
переменных в тех же единицах, в которых
измеряется и сама переменная. Эту задачу
решает показатель, называемый стандартным
отклонением [standard deviance - Std.Dev]
переменной
(переменной
),
определяемый соотношением:
.
Правила расчета дисперсии
Существует несколько простых и очень полезных правил для расчета дисперсии, являющихся аналогами правил для ковариации,. Эти правила в равной степени можно использовать как для выборочной, так и для теоретической дисперсии.
Правило дисперсии 1
Если у = v + w, то Var (у) = Var (v) + Var (w) + 2Cov (v,w).
Правило дисперсии 2
Если у =az, где а является постоянной, то Var(y) = a2Var(z).
Правило дисперсии 3
Если у=а, где а является постоянной, то Var (у) = 0.
Правило дисперсии 4
Если у = v + а, где а является постоянной, то Var (у) = Var (v).
Заметим, что дисперсия переменной х может рассматриваться как ковариация между двумя величинами х.
Поэтому
.
1.4.Коэффициент парной корреляции
Более точной мерой зависимости является линейный коэффициент корреляции rху [sample correlation coefficient]
Он определяется отношением:
,
где
.
1.5.Качественная оценка коэффициента корреляции
Если rху имеет максимальное значение, равное единице, то мы имеем дело со строгой линейной положительной зависимости между выборочными значениями x и у (на диаграмме рассеяния все точки находятся точно на восходящей прямой линии).
Если rху принимает минимальное значение -1, когда существует линейная отрицательная зависимость (точки лежат точно на нисходящей прямой линии). Последняя ситуация часто наблюдается при рассмотрении зависимости спроса на товар от его цены.
Величина rху = 0 показывает, что зависимость между наблюдениями x и у в выборке отсутствует.
Теснота связи |
Величина линейного коэффициента корреляции |
|
Прямая связь |
Обратная связь |
|
Практически отсутствует |
0,1 – 0,3 |
(-0,1) – (-0,3) |
Слабая |
0,3 – 0,5 |
(-0,3) –(- 0,5) |
Умеренная |
0,5 – 0,7 |
(-0,5) – (-0,7) |
Сильная |
0,7 – 1,0 |
(-0,7) – (-1,0) |
