
книги из ГПНТБ / Сирл, С. Матричная алгебра в экономике
.pdfсвязи, можно отметить следующие причины, вызывающие расхожде ние между Ь0 + bxxx и действительными значениями:
1)на уровень инфляции помимо уровня безработицы влияют и дру гие факторы, например мобильность рабочей силы;
2)данная экономическая система помимо общего влияния всех имеющих отношение к данному явлению факторов испытывает воздей ствие основного и непредсказываемого элемента случайности;
3)значения переменной у могут содержать ошибки измерения. Для того чтобы отразить эти расхождения, модель записывается
следующим образом:
Уь — bо + btXi -f- Cj |
(1) |
где et — член, характеризующий случайную ошибку (возмущение), связанную с одной или несколькими указанными причинами.
Введя в модель член, характеризующий случайную ошибку, мы для того, чтобы можно было пользоваться моделью, должны опреде лить теперь некоторые характеристики распределения вероятностей этой величины. Наиболее простыми и обычно принимаемыми допуще ниями будут предположения о том, что математическое ожидание et рав но нулю, ее дисперсия постоянна (и, следовательно, независима от i и xt) и значения ег для различных отрезков времени независимы друг от друга. Обозначая символом Е математическое ожидание (Е (е() — ожидаемое значение ег), запишем эти допущения как
E(et) ; 0 для всех |
г; |
|
|||
Е (О О) |
f 0 |
для |
i=j=j |
(2) |
|
{о2 |
для |
i = /. |
|||
|
|
На основании (2), отыскав математическое ожидание от (1), получим
Е (t/г) = Е {b0 + bxXi + ei) = b0 + М г + Е (ег).
Таким образом,
Е (г/г) = К + М г- |
(3) |
Это и есть ожидаемое значение y it которое мы ввели в начале раздела. Уравнения (1) — (3) определяют модель, которую нужно исследо вать. Переменная, обозначенная как у, обычно называется зависимой (поскольку она зависит от х), а переменная л; соответственно назы вается независимой1. Предположим, что у нас имеется выборка, со стоящая из п наблюдений y t и дтг. Пусть уравнение (1) существует для каждой пары наблюдений (г/;, xt). Тогда получим следующие п урав
нений:
У\ = |
b0 + |
bХх г + |
еу |
У 2 = |
Ьа + |
Ьхх г + |
е2; |
|
|
Уп — bо + |
М „ |
+ |
еп. |
||
1 Зам ети м , |
что |
в в ы р а ж ен и и (3) |
§ |
(х{) |
взя то |
равным хс, это п р е д п о л а га е т , |
|
что величины х |
о п |
р еде л ен ы з а р а н е е |
и |
они |
не |
я вл я ю тс я сл уч айн ы м и . |
260
П р и в в е д е н и и в е к т о р о в
У' = [у1 У 2— УпЬ
г' = [ei е2... еп]\
Ь' = [Ь0 Ьг]
и матрицы
эти уравнения могут быть переписаны в матричной форме как
у = Xb Jr e.
Заметим, однако, что эти уравнения не аналогичны системам, ранее рассмотренным в данной книге. Это вытекает из существа членов, ха рактеризующих ошибки и представленных символом е. По определению
эти ошибки делают уравнения совместными |
с любыми значениями |
Ь0и bv Однако значения ошибок неизвестны, |
так что-решение относи |
тельно Ъ не может быть получено в виде b = Х~г (у — е) или как |
|
b — G (у — е), где G — обобщенная обратная к X матрица. В связи |
|
с этим невозможно трчно определить Ь0 и bv |
Однако на основе этих |
же данных их можно оценить. Хотя оценки не являются точными зна |
чениями Ь0 и Ьи они дают о них полезную информацию.
Существует несколько способов получения оценок Ь0 и bv Из них наиболее часто применяется способ, который известен как способ наименьших квадратов. Здесь только он и рассматривается. Обозначим
оценки Ь0 и &i соответственно как b0n b 1вне зависимости от того, как они получены или каковы их значения. Тогда соответствующая дан
ному значению xt оценка у и обозначаемая уи будет определять ся как
Разность между оценкой и наблюдаемым значением yit корреспон дирующим с хи равна y t — уу, эта разность называется оценкой ошибки,
или остатком, et. Таким образом,
Л
et =У1 — Уи
Способ наименьших квадратов, применяемый для получения оценок
Ь0 и bv дает возможность на основе этой формулы выбрать их таким образом, что сумма квадратов оцененных ошибок (SSE)* есть вели-
*SSE — sum of squares of errors. — Прим, nepee.
261
-чина минимальная1. Это означает, что Ъ0и ^выбраны так, что при водят к минимуму.
SSE = ^ |
е- = >J |
(г/;— yi)2 = |
'ii. (Hi— ь0— b1x i)2- |
(4) |
i = 1 |
i — |
1 |
i — 1 |
|
Этот минимум достигается тогда, когда с помощью дифференциального исчисления удается минимизировать последнее выражение (4), при
чем оба коэффициента Ь0 и 1\ рассматриваются как переменные ве
личины. |
Прежде чем приступить к минимизации, внесем изменения |
|||
в обозначения, переписав (1) следующим образом: |
||||
|
ijt = |
b0xi0 + |
b1xil + |
еи |
где xi0 = |
1 и Хц ==Xi для |
всех i, |
а у х и е, |
остаются без изменений. |
Такое небольшое изменение в обозначении переменных х упрощает дальнейшее обсуждение случаев с несколькими переменными.
Внесение указанных |
изменений в обозначения в (4) приводит |
к следующему: |
|
SSE = У> |
е? = 2 (yt — Ъ0x i0— М а ) 2- |
(=1 |
/=1 |
Минимизация этого выражения предусматривает приравнивание нулю первых частных производных по Ь0 и Ьг. Таким образом, имеем
д |
|
|
п |
„ |
—р |
i |
= — 2 ^ |
*го0/г — b0xi0— ^ х г1) = 0 |
|
до0 |
|
i = i |
||
И |
|
|
|
|
- ^ - 7 |
е? = — 2 ^ |
хп (yi — %0 х го — h х п) = 0. |
||
db1 |
i |
- |
г= 1 |
|
После преобразования |
получим |
г/i хю = b0 V + b i ^ X i о хи
и
2 i y i X n = b о Ц х 10х п + Ь 1 Xi 1 .
где суммирование производится по i, i — 1, 2, ..., п. Эти выражения называются нормальными уравнениями. Решение этих двух совмест
н ы здесь не. пытаемся оправдать выбор этого критерия, отметим просто, что: а) он прочно укоренился и широко применяется в статистике; б) если функ ция затрат и потерь, связанная с оцененными ошибками, является квадратиче ской, этот критерий минимизирует ожидаемые затраты.
262
ных линейных уравнений дает величины Ь0 и Ъъ которые приводят к минимуму*
|
|
|
SSE - |
V |
e f . |
|
|
|
|
|
i==*l |
|
|
Поскольку X i(l |
=■-: 1 |
ДЛЯ i |
— 1, |
п, |
ТО 2 x f o = П, 'ZyiXin = |
и |
Их^Хц — 2 хг1. |
Отсюда нормальные уравнения сокращаются до |
|
||||
и |
|
М |
' М - П , |
У //г |
|
|
|
|
|
|
|
|
|
Решение их дает |
&o2*ii + |
|
^ У у гхп . |
(5) |
||
|
|
|
|
|
||
|
' |
£ |
хц—CZyi) (Sfti)M |
|
||
|
|
1 |
|
— (S*ii)2/« |
|
So ^Q & /i — Si2>si) /tt-
Пример. Пусть наблюдения переменных дали следующие резуль
таты:
Таблица 1
Данные для примера
i |
Vi |
|
x i0 |
Н 1 |
1 |
2 , 0 |
• |
1 |
5 , 0 |
2 |
3 , 0 |
|
1 |
4 , 2 |
3 |
3 , 2 |
|
1 |
4 , 3 |
4 |
4 , 0 |
|
1 |
3 8 |
5 |
3 , 6 |
|
1 |
4 , 4 |
6 |
2 , 1 |
|
1 |
5 , 2 |
7 |
1 , 7 |
|
1 |
6 , 0 |
8 |
1 , 2 |
|
1 |
6 , 5 |
9 |
1 , 8 |
|
1 |
5 , 9 |
10 |
2 , 4 |
|
1 |
4 , 0 |
|
10 |
|
25,0 |
Суммы |
V |
y i = |
|
|
г=1 |
|
|
Суммы квадратов |
10 |
|
9 , 94 |
V |
y j = 6 |
||
|
i — 1 |
|
Сумма произведе ний
10
2x i o — 10 — П
i— 1
—
ю
^ I V i x i l ~ 1 1 6 , 5 4 i = 1
10
= 49,3
i= 1
10
V x? = 251,03 xi l
1=1
*Нахождение частных производных (и решение соответствующих уравнений)
предполагается условиями первого порядка (необходимыми условиями) опреде ления минимума. Можно показать, что решение этой системы удовлетворяет
также условиям второго порядка. — П р и м , п е р е в .
263
. Система нормальных уравнений записывается как
10,00 Ъ0 + 49,30 Ъг ='25,00,
49,30 Ь0 + 251,03 7?! = 116,54.
Ее решение: Ь0 = 6,65 и Ьх = — 0,841. Таким образом, оценка на шей модели, полученная способом наименьших квадратов, имеет сле дующий вид:
г/г = 6,65—0,841 х п .
Если эта модель справедлива, то мы можем заключить, что не ожи
дается инфляции, |
когда безработица |
составляет |
6,65 : 0,841 = |
|
= 7,91/6, и что 1 |
% падения безработицы |
приводит |
к росту цен |
|
на 0,841%. |
|
0, |
то Е (у/) |
= Ь0. Эта вели |
Заметим, что если в уравнении (3) х, = |
чина известна как отрезок координатной оси. Он характеризует ожи даемое по модели значение у и'когда хг равен нулю. Такая модель со ответственно называется моделью с постоянным членом (с пересечением оси координат), и наоборот, модель без постоянного члена такова, что
наша прямая пересекает ось координат в |
точке 0, |
иными словами, |
это модель, у которой Е (yt) = 0 при xt = |
0. Такая |
модель—аналог |
(3) имела бы вид |
|
|
Е (tji) = b^i. |
|
|
Как уже отмечалось, в модели с пересечением отрезок Ь0 оцени вается при условии, что xi0 — 1для i = 1, 2, ..., п, т. е. при равенстве искусственной первой переменной единице в каждом наблюдении. В мо дели без постоянного члена необходимость в такой переменной отсут ствует и она не включается в процедуру оценки. Единственная исполь зованная переменная — это та, которая действительно наблюдается.
Рассмотренная в предыдущих уравнениях взаимосвязь линейна от носительно х, а анализ, который мы должны описать, называют до сих пор регрессионным анализом. Последний более точно называется
линейным регрессионньш анализом или (для случая с более чем одной независимой переменной) множественным линейным регрессионным анализом. Хотя предположение о линейности является обычным (эта форма взаимосвязи и обсуждается здесь), иногда рассматриваемая фак тическая взаимосвязь между переменными может и не быть линейной. Однако и нелинейные функции, линейные относительно параметров, которые должны быть оценены, могут быть изучены с помощью линей ного регрессионного анализа. Таким образом, Е (у) = Ьгх{ + Ъ2х% не может изучаться с помощью линейной регрессии, если должны быть оценены неизвестные параметры р и q, но если они известны, то Е (у) есть линейная функция переменных хр и xf и, следовательно, могут быть оценены Ь1и Ь2. Подобно этому уравнение Е (у) = btx + Ьгх2 + + Ь3х 3 не является линейным в переменных х, но оно линейно отно сительно трех переменных х, х2 и х3. В других случаях нелинейные функции иногда могут быть преобразованы в линейные относительно
2 6 4
трансформированных.переменных. Например, 1Челтцер [7] определил совокупный спрос на деньги как М = ara JKK где М — спрос на деньги; г — уровень процента; W — мера богатства страны; а и р — параметры, которые должны быть оценены. Прологарифмировав это выражение, он получил уравнение:
log М =- log a -f a log г + |3 log W,
которое линейно в логарифмах исходных переменных и, следователь но, имеет форму, пригодную для линейного регрессионного анализа*.
2. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ: k НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ
Процедура оценивания коэффициентов при более чем у двух (ска жем, k) переменных х является' непосредственным обобщением про цедуры, рассмотренной в предыдущем параграфе.
а) МОДЕЛЬ БЕЗ ПОСТОЯННОГО ЧЛЕНА
Уравнение для такой модели имеет вид:
т = Ьхх п + b2xi2 + ... + bkxih +
для i = 1, 2, ..., n наблюдений. Как и прежде, эти уравнения могут быть записаны в виде матричного уравнения
у = ХЬ + е, |
(6) |
где у' = 1у х у 2... уп], Ь' = [Ьх Ъ2... bk],
ё |
= |
[ех е2... еп] |
и |
1 |
х12... xlk |
|
Х ] |
|
Х = |
•*-21 |
Х22••• Х2ft |
|
|
|
|
Х п1 |
Х п 2 ••• X n k _ |
Как и раньше, нам необходимо найти способом наименьших квадратов оценки элементов вектора Ь. Если они представлены вектором Ь'= = [ЬХ Ь2 ... bh], то соответствующая оценка вектора у составит:
У-^ХЬ,
*Вообще говоря, операция логарифмирования для приведения к линейно му виду не настолько безобидна, как это кажется на первый взгляд. В работе Е. 3. Демиденко «Оценка параметров в нелинейной регрессии» (сб. «Проблемы экономического моделирования», М., ИМЭМО, 1972) показано, к какому смеще нию в оценках приводит подобная операция. — Прим, перев.
2 6 5
и вектор оцененных ошибок равен
е=--у~у = у — ХЬ.
Сумма квадратов этих ошибок при условии, что у'ХЬ --= В'Х'у, составляет величину
SSE г= V е2 v е' е — (у—хЪ)' (у—XЪ) —
i ~ 1
= (у' — в'Х') {у— ХЬ) =-у ' у — 2V Х ' у + b' X' ХЪ.
Вектор Ь определяется минимизацией е' е, т. е. при сведении к ми нимуму у'у — 2 Ь’Х ’у -f- Ь'Х’ХЬ путем приравнивания к нулю част
ных производных относительно элементов b. С помощью вектора дифференциальных операторов1 получим
д('е’ е) = — 2Х'у + 2Х'ХЬ = 0.
дЬ
Эти уравнения, эквивалентные Х'ХЬ = Х'у, представляют собой нормальные уравнения для множественной регрессии. Предполагается, что существует матрица (Х'Х)~г. Тогда решением этих уравнений будет
Ь = (Х’Х)-'Х'у, |
(7) |
в которых b суть оценка вектора Ь, полученная способом наименьших квадратов.
Произведение Х ’Х дает квадратную и симметрическую (это сле дует из существа матрицы X) матрицу сумм квадратов и попарных произведений п наблюдений переменных х:
Г 2 |
Х п |
2 хц X i 2 .■■ |
l i i x i l x ih |
||
2 |
Х а X i2 |
2 * ? 2 |
■ 2 * i a * » . |
||
Х ’ Х = - - |
|
|
|
|
|
- X |
xn xih |
2 X i2 X i k |
. ■ |
2 * & |
- |
В свою очередь Х'у есть вектор сумм произведений наблюдений пере менных х и у:
1 х а yt
Х ' у = 2.ХцУ1 ■
_ 2 x ihy t _
Таким образом, вектор оценок Ь = (Х'Х)~1Х'у равен вектору сумм произведений переменных х и у, умноженному слева на обратную матрицу сумм квадратов и произведений переменных х.
1См. параграф 5 главы XIII.
2 6 6
Пример. Предположим, у нас имеется пять следующих совокуп ностей наблюдений для модели без постоянного члена: y t = ЬгХц +
+ b2Xi2 b3Xi3 -f- еу.
1 |
У; |
Хц |
Х1\2 |
Xi3 |
1 |
24 |
1 |
1 |
3 |
2 |
26 |
1 |
0 |
1 |
3 |
20 |
2 |
1 |
1 |
4 |
20 |
3 |
2 |
1 |
5 |
23 |
1 |
2 |
0 |
Параметры |
b оцениваются |
как |
|
|
|
|
|
|
|||
|
|
|
|
|
Ь2 |
~ (X' X)-1 X' у, |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
где |
|
|
“1 |
1 |
3 |
|
|
24~ |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
1 |
0 |
1 |
|
|
26 |
|
|
|
|
|
X |
2 |
1 |
1 |
и |
у — 20 |
|
|
||
|
|
|
3 |
2 |
1 |
|
|
20 |
|
|
|
|
|
|
1 |
2 |
0 |
|
|
23 |
|
|
|
Отсюда |
|
|
|
9] - 1 |
|
|
|
|
|
|
|
(X' X)-1 |
Г16 |
11 |
1 |
Г |
28 |
—26 |
— 8~| |
||||
и |
10 |
6 |
|
— 26 |
|
37 |
1 |
||||
|
90 |
|
|||||||||
|
|
9 |
6 |
12 |
|
L |
— 8 |
|
1 |
13 |
|
|
|
|
|
|
|||||||
|
|
|
|
|
173 |
|
|
|
|
|
|
|
|
|
|
Х ’у = 130 |
|
|
|
|
|
||
так что |
|
|
|
|
138 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
28 |
—26 |
|
" 173 - |
— |
“ 4 ~ |
|
||
|
|
90 |
-26 |
37 |
1 |
|
130 |
5 |
|
||
|
|
—8 |
|
1 |
13 |
_ 138 |
|
6 |
|
||
|
|
|
|
|
|
||||||
Заметим, что для того, |
чтобы |
существовало |
b = (X'Х)~1Х'у, |
||||||||
необходимо |
существование (Х 'Х )'1; в свою очередь существование |
||||||||||
(Х 'Х )-1 обеспечивается тем, |
что X |
имеет полный |
столбцовый ранг, |
||||||||
иными словами, k векторов переменной х |
линейно-независимы (см. |
||||||||||
раздел б параграфа 12 главы VI). |
|
|
|
|
|
|
267
б ) М О Д Е Л Ь С П О С Т О Я Н Н Ы М Ч Л Е Н О М
В выражении (1) модель была представлена как yt = b0 + btXi + + sit где Ь0 — отрезок оси координат. Снова символом Ь0 обозначим отрезок, отсекаемый на координатной оси, для того, чтобы отличить его от коэффициентов blt b2, ..., bh при переменных х. Модель с пересе чением для множественной регрессии имеет вид:
Уь = Ь0 + b1x il + ... + bkxik + ei. |
|
|
Как и раньше, введем искусственную переменную xi0 = 1 |
для |
всех |
i — 1, 2, ..., п, после чего модель может быть записана как |
|
|
Уь = boxi0 + b1xil + ... + bhxih + eh |
|
(8) |
В матричном сбозначении она записывается как |
|
|
у = х*Ь* + е, |
, |
(9) |
где у и е имеют то же содержание, что и ранее, и где X* есть матрица X, дополненная первым столбцом, состоящим из единиц, а Ь* — век тор Ь, дополненный Ь0 в качестве первого элемента. Введем теперь символ 1 для обозначения вектора размером п, чьи элементы суть единицы, т. е.
V =-- [1 1 1...1].
Тогда X* и Ь* могут быть записаны как
X* = [1 X] и Ь*' = [Ь0 Ь']. |
(10) |
Теперь, несмотря на изменения в формулировке, модель (9) имеет точно такой же вид, что и (6), и, следовательно, вектор оценок полу чается способом наименьших квадратов, как и ранее1 (7), в виде
Ь* = ( Х * ' Х * ) - ! Х*'у.
Пример. Пусть параметры модели
Уi = Ь0 Ьx*ji + b2xi2 + Si
должны быть оценены на основе следующих шести совокупностей наб людений:
1 Уг ха
1 10 1 0
2 17 4 6
3 13 2 4
4 14 2 3
5 12 1 1
6 15 3 5
Действительно, дополнение X единичным первым столбцом увеличивает столбцовый ранг матрицы X на 1 для любой регрессии и не оказывает влияния
на”существование (Х 'Х ) -1 и Ь.
268
Тогда |
|
|
|
1 |
1 |
0 |
|
1 |
4 |
6 |
|
1 |
2 |
4 |
bi |
1 |
2 |
3 |
|
1 |
1 |
1 |
h |
1 |
3 |
5 |
|
Отсюда следует, |
что |
|
|
|
|
В* = (Х*' X*)-1 X*' у = —— |
129 |
— 105 |
37- ' |
8Г |
|
105 |
161 |
—77 |
189 |
||
' |
112 |
37 |
—77 |
41 |
283 |
|
|
1075
112
133
112
47
112
3. СВОЙСТВА ОЦЕНОК, НАЙДЕННЫХ СПОСОБОМ НАИМЕНЬШИХ КВАДРАТОВ
а) ДОПУЩЕНИЯ
( П )
( 12)
Мы уже видели, что когда уравнение записано как у = Xb -f- е, то вне зависимости от того, представляет ли оно модель без пересече ния или с пересечением, оценка b способом наименьших квадратов
есть b = (Х 'Х )~1 Х'у. Свойства этой оценки определяются допуще ниями, сделанными относительно элементов е.
Как уже упоминалось, часто предполагается, что элементы е яв ляются случайной выборкой из распределения, имеющего математи ческое ожидание, равное нулю, дисперсию а2 и нулевую ковариацию двух элементов. Введя Е для обозначения математического ожидания, получим Е (et) = 0, Е (е?) = о2 для всех i и Е (е,е7-) = 0 для i Ф /. Используя вектор е, получим:]
Е (е) = 0, |
(13) |
тогда ковариационная матрица элементов е (см. параграф 6 главы III) равна
var (ё) = Е [е — Е (е)] [е — Е (ё)У — Е (её) = о2 /. |
(14) |
2 6 9