
- •1. Предмет эконометрики. Измеренияния в экономике. Типы шкал.
- •2. Линейность и аддитивность связей в функции
- •3. Типы данных. Выбор вида функции парной регрессии.
- •4. Смысл и оценка параметров линейной регрессии. Мнк.
- •5. Уравнение парной линейной регрессии в отклонениях
- •6. Геометрическая интерпретация мнк. Матричная форма записи мнк.
- •7. Линейный коэффициент корреляции. Коэффициент детерминации и его связь с коэффициентом корриляции.
- •8. Оценка существенности (значимости) линейной регрессии
- •9. Природа ошибок регрессии. Основные гипотезы для обоснования парной линейной регрессионной модели
- •10. Теорема Гаусса-Маркова для парной линейной регрессии.
5. Уравнение парной линейной регрессии в отклонениях
Обозначим через
— отклонения от средних по выборке.
Задача:
подабрать лин. ф-цию f(x)=a+bx
минимизирующую
функционал
.
Из геометрич.
соображений ясно, что решением будет
та же прямая на плоскости (x,y),
что и для исходных данных
,
только начало координат переместится
в точку в т.(
,
).
Проделаем вычисления аналогичные тем,
которые использовались для получения
в методе МНК формул:
и
,
заменив
на
и учитывая, что
:
Т.е. запишем необходимые условия экстремума:
Поделив каждое
уравнение на (-2), преобразуем и получим:
=>
т.к.
.
6. Геометрическая интерпретация мнк. Матричная форма записи мнк.
Рассм. п-мерное векторное прост-во Rn, в кот. определено стандартное евклидово скалярное произв-ние:
Где
—транспонированная
матрица-столбец (т.е. матрица строка).
Будем искать реш.
в виде:
,
где a,b
— числовые коэффициенты,
— вектор, лежащий в двумерной гиперплоскости
π,
натянутой на векторы x
и i.
Предполагается, что векторы x
и i
— неколлинеарны.
Построим
пл-ть π
на векторах x
и i,
вектор ŷ
может лежать только в этой пл-ти. Задача:
чтобы ŷ
наилучшим образом отображ. у.
Задача сводится к мин-ции длины вектора
е.
Найти такие а
и b,
чтобы вектор е
имел мин. длину.
Очевидно,
что решением является такой вектор
ŷ,
для которого вектор е
┴ плоскости
π.
Необходимо
и достаточно , чтобы е
был
ортогонален векторам i
и
х.)
Т.е.
(1)
Матричная форма записи:
Обозначим
через Х
матрицу
размерности
.
Из
того что нам известно е=у-Хβ,
условие
ортогональности (1) теперь записывается
как Х'е =
0
или Х'(у-Хβ)=X'y-Х'Хβ=0,
откуда получаем Х'Хβ=Х'у,
а значит
=(X'X)-1X'y.
Если i и х линейно независимы, то матрица Х'Х обратима.
Зам: Матрица Х'Х невырождена, т.к. матрица X имеет максимальный ранг=2.
7. Линейный коэффициент корреляции. Коэффициент детерминации и его связь с коэффициентом корриляции.
Ур-ние регрессии
дополняют показателем тесноты связи,
для чего используют лин. коэф-т корриляции rxy:
(1)
С
равнивая
между собой выражения
и (1) очевидна взаимосвязь м-ду коэффициентом
регрессии b
и линейным коэффициентом корреляции
rxy
[-1;1]
(2)
З
ам:
Величина лин. коэф-та корреляции оценивает
тесноту
связи рассм-ых признаков в ее лин. форме.
Поэтому близость его к 0 не означает
отсутствие связи м-ду признаками,возможна
связь даже очень тесная,но не линейная.
Введем понятие коэффициента детерминации, как долю дисперсии результативного признака У, объясняемую регрессией, в общей дисперсии результативного признака.
Пусть по реальным данным мн-во точек (Xt,Yt), t=1,n построено эмпирическое ур-ние регрессии Ŷ=a+bX.
Тогда наблюдаемые
значения Yt
можно
записать в виде: Yt=Ŷt+et
(3),
где Ŷt
— теоретическое
значения результатов регрессии.
Равенство (3) не изменится, если из каждой
части вычесть одну и туже величину
Yt-
=(Ŷt-
)
+ et
или Yt-
=ht+et
(4),
где Yt- — отклонение t-ой наблюдаемой точки от среднего значения результирующей переменной;
ht — отклонение t-ой точки на линии регрессии от ; et — отклонение t-ой точки от модельного значения Ŷt, определяемого по линии регрессии.
Возведем
обе части (4) в квадрат и просуммируем
результат по всем t
Можно показать, что Σ((Ŷt -Y)et)= 0. Тогда справедливо
(5)
Т.е. полная сумма
квадратов
м.
интерпретироваться как мера общего
разброса отклонения относительно
.
Σht2
— объясненная
сумма квадратов.
Σe2
— остаточная
(необъясненная)
сумма квадратов.
Разделив (5) на левую часть, получим:
Умножим числитель и знаменатель на 1/n, получим коэф-т детерминации:
1–r2 характеризует долю дисперсии Y, вызванную влиянием остальных, не учтенных в модели факторов.
Для качественной оценки линейной регрессии были введены линейным коэффициентом корреляции rxy, кот. описывает степень плотности экспериментальных точек вокруг линии регрессии
и линейный коэффициент детерминации r2
Найдем взаимосвязь между этими параметрами.