Лекции эконометрика 1-8 / Лекция 6
.pdf
Смещение из-за пропущенной переменной (3)
Пример №3: Парковочное пространство на одного ученика
-Коррелирован с соотношением учеников и учителей
-Не влияет на результаты тестов
↓
нет смещения
11
Смещение из-за пропущенной переменной (4)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
− |
|
|
||||
|
|
|
|
= + |
=1 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
||||||
|
|
1 |
|
|
1 |
|
1 |
|
|
− 2 |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
=1 |
|
|
|
|
|
|
Из (2) и (3) предположений МНК следует: |
|
|
|||||||||||||
|
|
|
|
|
1 |
− 2 |
|
2 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
− |
|
cov |
, |
= |
|
|||||||
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
=1 |
|
Смещение из-за пропущенной переменной (5)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Тогда: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
+ |
|
= + |
|
, |
|
|||
|
|
|
|
|||||||
1 |
|
1 |
|
2 |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
величина
смещения
где = corr , .
13
Смещение из-за пропущенной переменной (6)
1.Смещение из-за пропущенных переменных является проблемой, независимо от его величины;
2.Величина смещения зависит от величины корреляции;
3.Направление смещения зависит от знака корреляции.
14
Что делать?
Таблица 6.1 Различия в результатах тестов для школьных округов Калифорнии с низкими и высокими отношениями ученик-учитель по проценту изучающих английский язык в районе
|
|
Соотношение учеников и |
Соотношение учеников |
Разность оценок за тест, |
|||
|
|
учителей (STR) <20 |
и учителей (STR) ≥20 |
Низкое STR – Высокое STR |
|||
|
|
Средняя |
|
Средняя |
|
|
|
|
|
оценка за |
n |
оценка за |
n |
Разность |
t–статистика |
|
|
тест |
|
тест |
|
|
|
|
Все районы |
657,4 |
238 |
650,0 |
182 |
7,4 |
4,04 |
|
|
||||||
|
Процент изучающих английский язык школьников |
|
|
|
|||
|
<1,9% |
664,5 |
76 |
665,4 |
27 |
-0,9 |
-0,30 |
|
|
||||||
|
1,9-8,8% |
665,2 |
64 |
661,8 |
44 |
3,3 |
1,13 |
|
|
||||||
|
8,8-23,0% |
654,9 |
54 |
649,7 |
50 |
5,2 |
1,72 |
|
|
||||||
|
>23,0% |
636,7 |
44 |
634,8 |
61 |
1,9 |
0,68 |
15 |
|
||||||
|
|
|
|
|
|
|
|
Модель множественной регрессии: две объясняющие переменные
= 0+ 1 1 + 2 2 + , = 1, … , (4)
(4) – теоретическая модель множественной регрессии (с двумя объясняющими переменными);
= |
|
+ |
+ |
+ |
, |
= 1, = 1, … , (5) |
0 |
0 |
1 1 |
2 2 |
|
0 |
|
0 −постоянный регрессор;0 − константа; 1, 2 − угловые коэффициенты;
E( 1, = 1, 2 = 2)= 0+ 1 1+ 2 2 − линия
теоретической регрессии.
16
Модель множественной регрессии: две объясняющие переменные
Интерпретация коэффициентов:
1 характеризует влияние на Y единичного изменения в1, считая постоянной (или контролируя на) 2
или
1 - частный эффект влияния 1 на Y при постоянном 2
17
Модель множественной линейной регрессии
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
+ |
|
+ |
|
+ … + |
|
+ , i=1, …,n |
(6) |
|
0 |
1 |
1 |
2 |
2 |
|
|
|
|
|
- i-е наблюдение зависимой переменной; 1, … , - i-е наблюдения каждого из k регрессоров; - ошибка
регрессии;
Линия теоретической регрессии – отношение, которое выполняется между Y и X-ми в среднем в генеральной
совокупности:
E( 1, = 1, 2= 2, … , = )= 0+ 1 1+ 2 2 + + ;1, … , - угловые коэффициенты;
0 - свободный член.
18
МНК оценка
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
min |
|
( |
− |
− |
|
− − |
)2 |
|
0 |
, |
|
, … , |
|
|
0, 1,…, |
=1 |
|
0 |
1 |
1 |
|
|
|
|
1 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
0, 1, … , − МНК оценки коэффициентов
0+ 1 1+ … + - МНК оценка линии регрессии, (линия выборочной регрессии или функция выборочной регрессии);
= 0+ 1 1+ … + - предсказанное значение ;= − - остаток МНК регрессии
19
Пример
|
|
|
|
|
|
= 698,9 – 2,28 × STR |
(7) |
|
= 686,0 – 1,10 × STR – 0,65 × PctEL |
(8) |
|
PctEL - % школьников округа, изучающих английский
20
