
- •Лекция №2. Парная регрессия и корреляция
- •1. Корреляционный анализ
- •1.1.Задачи корреляционно анализа
- •1.2.Ковариация
- •1.3.Дисперсия
- •1.4.Коэффициент парной корреляции
- •1.5.Качественная оценка коэффициента корреляции
- •1.6.Оценка значимости коэффициента парной корреляции
- •1.7.Парный коэффициент детерминации
- •2.Регрессионный анализ
- •2.1.Задачи регрессионного анализа
- •2.2.Линейная парная регрессия
- •2.3.Коэффициент эластичности
- •2.4.Формула определения бета - коэффициента
- •3.4.1.Проверка на случайность ряда остатков
- •3.4.2.Проверка на равенство нулю математического ожидания ряда остатков
- •3.4.3.Проверка на постоянство дисперсии ряда остатков
- •3.4.4.Проверка на независимость ряда остатков
- •3.4.5.Проверка на распределение ряда остатков по нормальному закону
- •3.5.Определение меры точности модели
- •3.6.Точечный и интервальный прогноз
1.6.Оценка значимости коэффициента парной корреляции
Любая совокупность наблюдений представляет собой некоторую выборку. Значит, значение любого показателя, рассчитанное на основе этой выборке, не может рассматриваться как истинное. В связи с этим, возникает необходимость проверки значимости этого показателя.
Для оценки значимости коэффициента корреляции применяется t - критерий Стьюдента. Фактическое значение этого критерия рассчитывается по формуле:
.
Вычисленное по этой формуле значение
сравнивается с табличным значением
t-критерия, которое берется из таблицы
значений t-Стьюдента с учетом
заданного уровня значимости и числа
степеней свободы (α = 0,05 или 0,01, k
= n -2 ).
Если
>
,
то полученное значение коэффициента
корреляции признается значимым. Таким
образом, делается вывод о том, что между
исследуемыми переменными есть
статистическая взаимосвязь.
1.7.Парный коэффициент детерминации
Зная линейный коэффициент корреляции, можно рассчитать парный коэффициент детерминации r2ху. Он показывает, какая доля вариации переменной Y учтена в модели и обусловлена влиянием на неё переменной X.
Пример
По представленным данным о спросе и доходе населения за ряд текущих лет определить степень влияния дохода населения на его спрос. Оценить значимость коэффициента корреляции.
Год |
Доход, Х |
Спрос, Y |
|
|
|
|
|
1 |
10 |
6 |
-5 |
-3,3 |
16,5 |
25 |
10,89 |
2 |
12 |
8 |
-3 |
-1,3 |
3,9 |
9 |
1,69 |
3 |
14 |
8 |
-1 |
-1,3 |
1,3 |
1 |
1,69 |
4 |
16 |
10,3 |
1 |
1 |
1 |
1 |
1 |
5 |
18 |
10,5 |
3 |
1,2 |
3,6 |
9 |
1,44 |
6 |
20 |
13 |
5 |
3,7 |
18,5 |
25 |
13,69 |
Итого |
90 |
55,8 |
0 |
0 |
44,80 |
70,00 |
30,40 |
Среднее |
15 |
9,3 |
0 |
0 |
7,47 |
11,67 |
5,07 |
Средние значения случайных величин Х и Y рассчитаем по формулам, соответственно:
.
Стандартные ошибки случайных величин Х и Y рассчитаем по формулам, соответственно:
Рассчитаем ковариацию:
.
Аналогичные расчеты можно получить, используя встроенные возможности электронных таблиц Excel: КОВАР(массив1; массив2), которая возвращает ковариацию, то есть среднее произведений отклонений для каждой пары точек данных.
Синтаксис функции:
Массив1 — это первый массив или интервал данных.
Массив2 — это второй массив или интервал данных.
Рассчитаем коэффициент парной корреляции:
.
Аналогичные расчеты также можно получить, используя встроенные возможности электронных таблиц Excel: КОРРЕЛ(массив1;массив2), которая возвращает коэффициент корреляции меду интервалами ячеек массив1 и массив2.
Синтаксис функции:
Массив1 — это ячейка интервала значений.
Массив2 — это второй интервал ячеек со значениями.
Оценим значимость коэффициента корреляции.
Для этого рассчитаем значение t – статистики:
Табличное значение критерия Стьюдента равно:
Воспользуемся встроенными возможности электронных таблиц Excel: функция СТЬЮДРАСПОБР(вероятность;степени_свободы) возвращает t-значение распределения Стьюдента как функцию вероятности и числа степеней свободы.
Синтаксис функции:
Вероятность - вероятность, соответствующая двустороннему распределению Стьюдента (α = 0,05 или 0,01).
Степени_свободы— число степеней свободы, характеризующее распределение (k = n -2).
Сравним числовые значения критериев:
.
Полученное значение коэффициента корреляции значимо.
Вычислим парный коэффициент детерминации:
r2ху = 0,9432.
Таким образом, доход населения (Х) оказывает весьма высокое влияние на спрос (Y). На 94% спрос населения зависит от дохода. Оставшиеся 6% (100 – 94) - это влияние неучтённых факторов.