
- •1 Введение в эконометрику
- •1.1 Предмет эконометрики
- •1.2 Типы статистических данныx
- •1.3 Классы моделей
- •1.4 Оценивание моделей и типы зависимостей
- •1.5 Элементы математической статистики
- •1.5.1 Операция суммирования
- •1.5.2 Случайные переменные (величины)
- •1.5.3 Числовые характеристики распределения
- •1.5.4 Вероятность в непрерывном случае
- •2 Постоянная и случайная составляющие случайной переменной
- •2.1Способы оценивания характеристик случайной величины и оценки
- •3 Выборочная ковариация. Выборочная дисперсия. Коэффициент корреляции
- •3.1 Выборочная ковариация
- •3.2 Выборочная дисперсия
- •3.3 Коэффициент корреляции
- •4 Парный регрессионный анализ
- •4.1 Модель парной линейной регрессии
- •4.2 Метод наименьших квадратов (мнк)
- •4.3 Качество оценки: Коэффициент детерминации
4.3 Качество оценки: Коэффициент детерминации
Цель регрессионного анализа состоит в объяснении поведения зависимой переменной .
Пусть на основе выборочных наблюдений построено уравнение регрессии .
Значение
зависимой переменной
в каждом наблюдении можно разложить на
две составляющие
,
,
где
остаток
есть та часть зависимой переменной
,
которую невозможно объяснить с помощью
уравнения регрессии.
Разброс
значений зависимой переменной
характеризуется выборочной дисперсией
.
Разложим
:
Так
как
,
то
.
Замечание. Такое разложение дисперсии верно лишь в том случае, когда константа а включена в уравенение регрессии.
Итак, дисперсия разложена на две части:
–
часть,
которая объясняется регрессионным
уравнением,
– необъясненная
часть.
Разделим правую и левую часть равенства на :
,
TSS=ESS+RSS.
Получим
.
Коэффициентом детерминации называется отношение
,
Коэффициентом
детерминации
и характеризует долю дисперсии (вариации
или разброса) зависимой переменной,
объясненную с помощью уравнения
регрессии.
Максимальное
значение
.
Это
происходит в случае, когда все точки
наблюдения лежат на регрессионной
прямой (подгонка точная), т.е.
и остатки
для всех
.
Тогда
.
Если
,
то регрессия ничего не дает, т.е.
.
Это
значит, что переменная
не улучшает качества предсказания
по сравнению с горизонтальной прямой
(рисунок 4.5).
Рисунок 4.5
Чем
ближе к единице
,
тем лучше качество подгонки, т.е.
более точно аппроксимирует
.
Замечание. Вычисление корректно, если константа а включена в уравнение регрессии.
Напомню,
что выборочные дисперсии
и
:
дисперсия
наблюдаемых значений
.
дисперсия
расчетных значений
-
дисперсия остатков.
Пример 4.1 Изучается зависимость себестоимости единицы изделия (у, тыс. руб.) от величины выпуска продукции (х, тыс. шт.) по группам предприятий за отчетный период. Экономист обследовал n = 5 предприятий и получил следующие результаты (1-й и 2-й столбцы). Полагая, что между переменными х, у имеет место линейная зависимость, определим выборочное уравнение линейной регрессии. Заполним таблицу
Номер |
х |
у |
х2 |
х*у |
1 |
2 |
1.9 |
4 |
3.8 |
2 |
3 |
1.7 |
9 |
5.1 |
3 |
4 |
1.8 |
16 |
7.2 |
4 |
5 |
1.6 |
25 |
8.0 |
5 |
6 |
1.4 |
36 |
8.4 |
n = 5 |
|
|
|
|
Сред нее |
|
|
|
|
Уравнение
линейной регрессии имеет вид:
Найдем
остатки
и коэффициент детерминации.
Решение: Заполним таблицу
Но мер |
х |
y |
y2 |
-0.11x |
|
|
|
|
|
|
1 |
2 |
1,9 |
3,61 |
1,90 |
0,00 |
0,22 |
0,22 |
0,0484 |
0.0484 |
0 |
2 |
3 |
1,7 |
2,89 |
1,79 |
-0,09 |
0,02 |
0,11 |
0,0004 |
0.0121 |
0.0081 |
3 |
4 |
1,8 |
3,24 |
1,68 |
0,12 |
0,12 |
0 |
0,0144 |
0 |
0.0144 |
4 |
5 |
1,6 |
2,56 |
1,57 |
0,03 |
-0,08 |
-0,11 |
0,0064 |
0.0121 |
0.0009 |
5 |
6 |
1,4 |
1,96 |
1,46 |
-0,06 |
-0,28 |
-0,22 |
0,0784 |
0.0484 |
0.0036 |
Сумма |
20 |
8,4 |
14,26 |
|
0 |
0 |
0 |
0,148 |
0.121 |
0.027 |
Сред ние |
|
|
|
|
|
|
|
0,0296=var(y) |
0.0242= var( ) |
0.0054=var( |
var(y)=
;
var(
)=
;
var(
)=
Проверим: Var(y)=var( )+var( ); 0.0296=0.0242+0.0054
0.0296=0.0296,
отсюда
R2=
Т.е. 81,7 % общей вариации себестоимости у зависит от выпуска продукции х. Наша модель не объясняет 18,3 % вариации себестоимости. Эта часть вариации объясняется факторами, не включенными в модель.
Пример
4.2.
Показать, что
,где
-
коэффициент корреляции между
и
.
Решение:
Тогда
Пример
4.3. Показать,
что в случае парной регрессии
,
Решение:
В
случае парной регрессии коэффициент
детерминации
есть квадрат коэффициента переменных
и
.
Пример
4.4 Показать,
что в модели регрессии без свободного
члена
,
оценка МНК для
есть
Решение:
Выборочная
регрессия для данной модели
.
Наблюдаемые
значения зависимой переменной связаны
с расчетными значениями уравнением
.
Оценку найдем из минимизации величины
Найдем
Т.к.
Отсюда
Вычисление при отсутствии свободного члена некорректно.
Пример
4.5. Показать,
что в модели регрессии
Оценка
для
есть
Решение:
Выборочная
регрессия для заданной модели есть
наблюдаемые значения зависимой переменной
связаны с расчетными значениями
уравнением
Оценку а найдем из минимизации величины
Найдем
Т.к.
Итак,
выборочная регрессия
.
Контрольные вопросы:
1.Какой общий вид имеет модель парной линейной регрессии?
2.Перечислите основные причины существования случайного члена в модели парной линейной регрессии.
3.Какой метод используют для проведения регрессионного анализа?
4.В чем суть задачи регрессионного анализа?
5.Какое значение может принимать коэффициент детерминации и почему?