Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сирл, С. Матричная алгебра в экономике

.pdf
Скачиваний:
21
Добавлен:
22.10.2023
Размер:
13.54 Mб
Скачать

где г = k — р, а подписные индексы подматриц Т указывают на раз­ меры последних; помимо этого примем ТРт= (ТгР)'. Тогда для запол­ нения табл. 5 получим следующий результат1:2

SSRft-S S R к- р = Ь'рТ-р1Ьр.

(43)

Это выражение легко вычисляется: мы уже получили Ьр как часть Ь, а на основе (Х'Х)~Л получаем Трр и находим обратную к ней мат­ рицу2. Такой путь требует значительно меньше усилий, чем непосредст­ венное получение SSR, поскольку в последнем случае требуется определить обратную матрицу порядка k — р, тогда как выражение (43) требует найти обратную матрицу только порядка р X р. Когда k существенно выше р (а это обычно так и бывает), то косвенный метод имеет явное преимущество. Особенно это проявляется тогда, когда же­ лательно испытать несколько различных подмножеств из р перемен­ ных х. Кроме того, хотя здесь рассматривалось р последних перемен­ ных в последовательности х ъ х 2, ..., xh, описанный подход применим

к любым р переменным: возьмем коэффициенты вектора Ь, относящие­

ся к р переменным, и назовем их вектором Ьр. В матрице (Х ’Х)~г выделим подматрицу р X р, соответствующую этим же переменным. Назовем ее Т рр и определим обратную к ней матрицу Трр1. Тогда для

этих Ьр и Трр применимо выражение (43).

Пример (продолжение). Предположим, что в нашем примере, содер­ жащем две переменные х, нам необходимо испытать существенность введения первой переменной при наличии второй переменной.

Тогда k = 2 и р = l,,SSRft — сумма квадратов регрессии, определен- -

ной по двум переменным. Ее значение показано в табл. 4; SSR*. = •

Для получения SSRfe — SSRfe_p с помощью (43) нам необходимо найти Ьр — коэффициент регрессии для первой переменной. На основе

(33)

находим

 

Ьр =

Трр

является

ведущим элементом матрицы

(Х 'ХУ 1, где

Х 'Х — матрица

скорректированных сумм квадратов и

произведений. Отсюда по (31)

определим Трр =

161

таким образом,

уу^ и,

по

(43) находим

 

 

 

 

 

 

 

SSRft- S S R ft_p =

133 / ни

- 1

Ш _

1332

'

 

 

 

 

 

112 [112

 

TTi

иг-i6i

Подстановка

в

(42) SST — SSRft = 263 (по данным табл. 4) и п = 6

дают

 

 

 

 

 

 

 

 

 

 

 

р

(6—2— 1) 1332

112

 

 

 

 

 

1,3 ^

1-112-161

 

263 ’

 

 

 

1Это доказано

Сирлом

(см. [10, с. 246]).

 

 

 

 

 

23десь мы используем часть обратной к X ’X матрицы.

 

2 8 0

ч т о у п р о щ а е т с я д о

F1

3 - 1 3 3 2

(44)

1 6 1 - 2 6 3

 

 

Поскольку табличное значение F с одной и тремя степенями свободы при 5%-ном уровне существенности равно 10,13, то гипотеза о том, что первая переменная не дает существенного вклада в регрессию, помимо второй, не может быть отвергнута.

На основе приведенных ранее данных может быть подсчитано зна­ чение SSR^-j,:

SSRh-p SSRfe-

После упрощений получим

1

332

3 041

1332

1 1 2 -1 6 1

~ т 11 2 -1 6 1

SSRh-p

1592

9 6 6

Можно показать, что этот результат идентичен сумме квадратов ре­ грессии только на k—р переменных (а именно, на вторую, переменную). Модель со свободным членом имеет вид: y t =-- b0 + b2xi2 + ег, и выра­ жение для оценивания параметров следует из второго уравнения (38). Оно сокращается до

(2 xh — nxl) b2 = 2 xi2 Vi— nx2 у,

где b2 есть оценка b2 для данного-случая. На основе ранее приведенных базовых данных это уравнение дает

( 87 — — )

Ьг =----283 — 'M l ) ;

^

6 I

6

и, таким образом,

Следовательно, на основе (37), которое в данном случае сокращается до

SSR = b2 ( У х 12у 1— пх2у),

получим такую сумму квадратов регрессии, которая тождественна

SSRft- p:

c q d

_ ,

1 5 9 \

159

_

1592

h~ p

\

161 j

6

~

9 6 6 ’

как было установлено ранее.

281

г) И С П Ы ТА Н И Е О ТД Е Л Ь Н Ы Х П ЕР ЕМ ЕН Н Ы Х

Испытание существенности, основанное на /‘"-статистике диспер­ сионного анализа (см. раздел а параграфа 4), относится к нулевой ги­ потезе, которая заключается в том, что все коэффициенты blt b2, ..., Ьк равны нулю. В этом смысле /^-критерий есть критерий способности мо­ дели в целом объяснить вариацию зависимой переменной. Однако в от­ личие от этого внимание можно сконцентрировать только на одной из k независимых переменных, проверяя, будет или не будет коэффициент у конкретной переменной равен нулю после того, как найдена регрес­ сия на k — 1 других переменных.

Подобное испытание представляет собой особый случай по срав­

нению с изложенным ранее, а именно при р = 1.

Тогда /^-статистика

с 1 и п k — 1 степенями свободы становится равной

F - (я — ^— В (SSRft— SSRfe-t)

 

(45)

SST—SSRft

' '

Предположим, что имеется i-я переменная х, вклад которой в рег­ рессию рассматривается. Обозначим соответствующую величину (45) через Fi. Тогда можно показать, что

F. —/?

(46)

1 I -

‘1>

где

 

 

ti

var (bi)

(47)

 

 

В этом выражении bt есть оценка коэффициента, относящегося к г-й

переменной х, полученная из вектора b, a var (bi)— оценка дисперсии bi. Таким образом, если d, — г-й диагональный элемент {Х'Х

nww')*1, то из (24) следует, что var (bi)---diO2, а при а2, определенном

по (30), var {bi) =\di0 2.

Величина t, показанная в (47), имеет распределение с п k — 1 степенями свободы1. Она дает возможность проверить существенность включения t-й переменной после выбора других k — 1 переменных.

Как

показано в

(46),

она

эквивалентна

F -критерию, получаемому

по

(45).

 

 

 

 

 

 

Пример (продолжение). Соответственно (32), (33) и (34) имеем

 

 

ПЗ

 

 

 

161

—77

 

b =

112

и

 

 

 

_47

(Х'Хnww')~1 = —

41

 

 

 

1

'

112 —77

 

 

112

 

 

 

 

 

1См., например,

[2, с.

108].

 

 

 

282

S S E — — , п р и ч е м п k — \ = 3 . О т с ю д а

j _ ___ ______

bi

_________bi_______ _

Ywar (/)

V d ^

V d^SSE M n - k -l)

__________ 133/112

_ 1331/3 _ j

1/(161/112) (263/336)

/1 6 1 -263

Поскольку табличное значение t. для 5%-ного уровня при п k

— 1 — 3 степенях свободы равно 3,182, то мы заключаем, что нуле­ вая гипотеза (Ь г 0) не может быть отвергнута при 5%-ном .уровне существенности. Заметим, что Р — 1,122 =- 1,25. Эта величина равна

F из уравнения

(44) и, таким образом, подтверждается (46). Вывод,

базирующийся

на величине t, идентичен выводу, основывающемуся

на /'’-статистике.

 

л) ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ МОДЕЛИ СО СВОБОДНЫМ ЧЛЕНОМ

Модель со свободным членом, содержащая k переменных х, экви­ валентна по процедуре анализа модели без свободного члена с k + 1 переменными,- В связи с этим (см. (18)) соответствующая сумма квадра­

тов ошибок составляет, как это показано в (29), SSE = у 'у Ь*'Х*'у.

В

табл.

6

приведена схема дисперсионного

анализа, аналогич­

ная

схеме,

данной в табл.

3, для этого случая.

 

 

 

 

Дисперсионный анализ

Т а б л и ц а 6

 

 

 

 

 

И с т о ч н и к в а р и а ц и и

D .F .

С у м м ы к в а д р а т о в

Регрессия

на

k переменных х

k + 1

$ *' X * ' у

и свободный член х

л — k 1

у ’ у S*' х*' у

Ошибка

 

 

 

 

Итого

п

У'У

Первая строка таблицы содержит сумму квадратов регрессии, содержащей k переменных и свободный член. Рассмотрим теперь под­ бор модели, содержащей только свободный член: yt =--- b0 + et. Выбор такой модели эквивалентен подбору только средней величины; соот­

ветствующая сумма квадратов равна пу2, Теперь первая строка табл. 6 может быть разбита на две строки:

Средняя

1

„ . пУ2 _

Регрессия на k переменных х

k

Ь*'Х*'у~пуг

283

г) И С П Ы ТА Н И Е О ТД Е Л Ь Н Ы Х П ЕР ЕМ ЕН Н Ы Х

Испытание существенности, основанное на /•’-статистике диспер­ сионного анализа (см. раздел а параграфа 4), относится к нулевой ги­ потезе, которая заключается в том, что все коэффициенты Ьи Ьг, ..., Ьк равны нулю. В этом смысле /•’-критерий есть критерий способности мо­ дели в целом объяснить вариацию зависимой переменной. Однако в от­ личие от этого внимание можно сконцентрировать только на одной из k независимых переменных, проверяя, будет или не будет коэффициент у конкретной переменной равен нулю после того, как найдена регрес­ сия на k — 1других переменных.

Подобное испытание представляет собой особый случай по срав­ нению с изложенным ранее, а именно при р = 1. Тогда /•’-статистика с 1 и п k — 1 степенями свободы становится равной

Р =

(n — k — 1) (SSRft —SSRft-t)

(45)

_

SST —SSRft

 

Предположим, что имеется i-я переменная х, вклад которой в рег­ рессию рассматривается. Обозначим соответствующую величину (45) через Ft. Тогда можно показать, что

Ft -П,

(46)

где

(47)

!v a r($0

Вэтом выражении bt есть оценка коэффициента, относящегося к i-я

переменной х, полученная из вектора b, a var (bi)— оценка дисперсии bt. Таким образом, если dt — /-й диагональный элемент ( Х ' Х -—

nww')-1, то из (24) следует, что var (Ьг-)— df<72, а при а2, определенном

по (30), var (bi) =зус?го2.

Величина t, показанная в (47), имеет распределение с п k — 1 степенями свободы1. Она дает возможность проверить существенность включения t-й переменной после выбора других k — 1 переменных.

Как

показано в

(46),

она

эквивалентна

/•'-критерию, получаемому

по

(45).

 

 

 

 

 

 

 

Пример (продолжение). Соответственно (32), (33) и (34) имеем

 

 

пз

 

 

 

 

161

—77

 

Ь =

112

и

(Х'Хnww')-1 =

 

j47

—77

41

 

 

 

v

112

 

 

112

 

 

 

 

 

 

1См., например,

[2, с.

108].

 

 

 

 

282

S S E — — , п р и ч е м n — k — 1 = 3 . О т с ю д а

 

 

 

 

^

h

b\

_________ bi_________ =

 

 

 

7

KdTS?

V di (SSE)/(/z—A— 1)

 

 

 

_ _ _______ 133/112

__

133 V J

} 2

 

 

 

1/(161/112) (263/336)

/1 6 1

-263

 

 

Поскольку табличное значение t для

5%-ного уровня при

п k

— 1

= 3 степенях свободы

равно 3,182, то мы заключаем,

что нуле­

вая

гипотеза

(Ь г = 0) не может быть отвергнута при 5%-ном .уровне

существенности. Заметим, что /2 =

1,122 =- 1,25. Эта величина равна

F из уравнения (44) и, таким образом,

подтверждается (46). Вывод,

базирующийся на величине t , идентичен

выводу,

основывающемуся

на Е-статистике.

 

 

 

 

 

 

д) ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ МОДЕЛИ СО СВОБОДНЫМ ЧЛЕНОМ

Модель со свободным членом, содержащая k переменных х, экви­ валентна по процедуре анализа модели без свободного члена с k + 1 переменными. - В связи с этим (см. (18)) соответствующая сумма квадра­

тов ошибок составляет, как это показано в (29), SSE = у ' у Ь*'Х*'у.

В

табл.

6

приведена схема дисперсионного

анализа, аналогич­

ная

схеме,

данной в табл.

3, для этого случая.

 

 

 

 

Дисперсионный анализ

Т а б л и ц а 6

 

 

 

 

 

И с т о ч н и к в а р и а ц и и

D . F .

С у м м ы к в а д р а т о в

Регрессия

на

k переменных х

k +1

S*' Х*’у

и свободный член х

 

у ' у — Ь*' X*' у

Ошибка

 

 

п k — 1

 

 

Итого

п

У ' У

Первая строка таблицы содержит сумму квадратов регрессии, содержащей k переменных и свободный член. Рассмотрим теперь под­ бор модели, содержащей только свободный член: y t = b0 + et. Выбор такой модели эквивалентен подбору только средней величины; соот­

ветствующая сумма квадратов равна /гг/2. Теперь первая строка табл. 6 может быть разбита на две строки:

Средняя

1

„ . пУ2 _

(48)

Регрессия на k переменных х

k

'b*'X*’y — ny2

 

283

Сумма показателей этих строк равна Ь*'Х*'у при числе степеней сво­ боды, равном k + 1. Теперь на основе (29) получим

Ь*'Х*’у пу2 = Ъ' (Х'у nyw).

(49)

Снова с помощью (48), (49) и (29) определим SSE, после чего табл. 6 трансформируем в табл. 7. Если убрать первую строку таблиц ы и вы­ честь показатель этой строки из показателя последней строки, то по­ лучим схему дисперсионного анализа табл. 3 для модели со свобод­ ным членом.

 

 

Т а б л и ц а 7

 

Дисперсионный

анализ

И сточник вариации

D.F.

С у м м ы к в а д р а т о в

Средняя

1

пу2

Регрессия на к перемен­

к

b ' ( X ' y — nyw)

ных X

 

 

Ошибка

п k — 1

SSE = у ' у пу2Ъ' ( Х' у — пу ш)

Итого

п

У'У

5.ОСНОВНЫЕ ШАГИ РАСЧЕТА РЕГРЕССИИ

Вданном параграфе обобщены и перечислены в виде удобных для вычисления формул общие выражения, связанные с оцениванием ли­ нейной регрессии на k переменных.

 

Описание данных

 

 

 

п — число

совокупностей наблюдений;

 

 

 

k — число

переменных х.

 

 

 

 

 

Оценивание (параграфы 2 и 3)

 

 

 

Х ' Х = k

х k — матрица

сумм

квадратов и про­

 

 

изведений наблюдений

перемен­

 

Х'у = k

ных х;

 

произведений наб­

 

х 1 — вектор сумм

 

 

людений

переменных

х и у.

Замечание. Для модели без свободного члена эти суммы берутся нескорректированными; для модели со свободным членом эти суммы

корректируются (с учетом средних).

средних значений х;

w = k X 1 — вектор

у — среднее значение г/;

Ъ — ( Х ' Х ^ Х ' у — оценка

коэффициентов регрес­

сии;

 

284

SSE = у'у b'X'y — сумма квадратов ошибок;

j

k

— в модели без свободного члена;

* ~ \k

+

1 — в модели со свободным членом;

о2 = SSE/(n — k*) — оценка дисперсии ошибки;

var (Ь) = ( Х ' Х ) 1^2 —оценка ковариационной матрицы.

Модель со свободным членом

Ь0 = у w'b — оценка свободного члена;

var (80) = [1/п + W [X'Xy^w] о2—оценка дисперсии Ь0;

cov (Ь0, 8) = — (Х'М)_1даа2 — оценка ковариации 80 и 8.

 

 

Проверка существенности (параграф

4)

 

 

 

 

SSR = b'X'y — сумма квадратов

регрессии;

SST =

У У

в модели без свободного члена |

общая сумма

 

в модели со свободным членом

j

квадратов;

 

у'упу2

 

 

 

R 2 = SSRSST

коэффициент детерминации;

 

 

 

 

 

SSR

 

 

 

 

 

 

 

Fk, n~k*= ----- F -критерий для проверки модели;

 

 

 

 

fco2

 

 

элемент

мат-

 

 

 

 

72i)~ I-й диагональный

 

 

 

 

 

рицы (Х 'Х )-1;

 

 

 

 

 

 

ti = biloVdi — /-критерий для

проверки суще­

 

 

 

 

 

ственности г-й переменной х пос­

 

 

 

 

 

ле того, как найдена регрессия

 

 

 

 

 

на отдельные

переменные

при

 

 

 

 

 

числе степеней свободы, равном

р

*

 

' 41

V\—н ~/

п k*;

 

 

 

: (SSRft—SSR

) / р 8 2 -

.F-критерий для проверки суще­

л

p , n - h

 

 

k-p.

ственности р переменных после

 

 

 

 

 

того, как найдена регрессия на

 

 

 

 

 

другие k р переменных'с р и

 

 

 

 

 

п k* степенями

свободы.

 

Мы показали здесь, как методы регрессионного анализа могут быть описаны с помощью ряда матричных выражений. Соответствую­ щие расчеты легко программируются для ЭВМ и поэтому программы подбора регрессий и определения сопутствующих статистик имеются в большинстве вычислительных центров.

При большом п и особенно k расчеты становятся очень громоздкими, поскольку эти величины определяют порядок матрицы Х' Х, к которой необходимо найти обратную матрицу. При k, равном 100, современные ЭВМ могут осуществить расчет менее чем за две минуты.

2 8 5

Уп р а ж н е н и я

1.Поскольку дивиденды представляют собой составную часть личного дохода, в эконометрическую модель США можно включить уравнение, связываю­ щее дивиденды с уровнем экономической активности. Наиболее логично эту взаимосвязь представить в виде функции дивидендов от дохода корпораций. Самая общая линейная запись имеет вид Dt -- bn + bj^Pt, где Dt и Pt — ди­ виденды и доход в году t. В исследовании поведения в области дивидендов Линт-

нера [6 ] отмечается,что отношения дивидендов к доходу могут считаться приемле­ мыми в весьма широком диапазоне. Если это утверждение правильно для от­ дельной компании, то оно должно быть правильным и для укрупненного объекта изучения.

а) Как такая политика в области распределения дивидендов влияет на коэффициент Ь0 в приведенном уравнении?

б.) Следующие данные взяты из экономического отчета 1968 г. (млрд, долл.):

Годы

Д о х о д корпораций

Дивиденды

после уплаты

 

налогов

 

I960

26,7

13,4

1961

27,2

13,8

1962

31,2

15,2

1963

33,1

16,5

1964

38,4

17,8

1965

45,2

19,8

1966

49,3

21,5

1967

47,2

2 2 ,8

Определите на основе этих данных

коэффициенты Ьа и Ь \ .

в)

Оцените смысл вопроса

а. Вытекает ли из вашей оценки, что наблюдение

Линтнера

правильно?

 

2.Решите уравнение (5) данной главы.

3.Покажите, что уравнения (5) являются частным случаем нормальных

уравнений X'ХЪ — Х'у.

(5) имеет .вид b = (X 'Х )~ 1Х 'у.

4. Покажите, что решение уравнений

5. Умножьте каждый у и х в примере,

приведенном в параграфе 1 (10 на­

блюдений),

на 1,1 и снова определите регрессию. Почему значение Ьг осталось

таким

же,

что и раньше? Почему значение Ь0 равно 7,315?

6 .

Прибавьте по 5 к каждому значению г/; и по 10 к х; в примере из пара­

графа

1 и определите регрессию. Объясните взаимосвязь нового ответа и резуль­

тата,

полученного в параграфе 1.

7.

Объясните для случая с одной переменной взаимосвязь между оценками

коэффициентов регрессии сгу + kx на с2х + k2 и оценками коэффициентов рег­ рессии у на х. Проиллюстрируйте полученные результаты (с помощью упражне­ ний 5 и 6).

8 . Выведите выражение В} для модели без свободного члена в том виде,

вкотором оно дано в табл. 2 .

9.Чоу [1] предложил следующую модель для характеристики платы за арен­ ду ЭВМ:

г b0tblmbzabs

logior = log1060 + &ilog10 t + 62log10 m + £>3logl0a,

где r — месячная плата за пользование ЭВМ; t — время дополнительного цик­ ла ЭВМ; т — объем памяти ЭВМ; а — время выборки из запоминающего уст­ ройства.

а) Какие знаки ожидаются у коэффициентов Ьг, Ь% и Ь3?

б) Допустим, что имеются следующие данные, относящиеся к пяти ЭВМ:

286

r

ЭВМ

(

т ы с , долл.

\

t ( м к с е к )

 

m (т ы с .

с л о в

а ( м к с е к )

'

маш.

'

длиною в

6

битов)

 

 

 

 

 

 

 

1

 

6 , 5

 

6 9 0

 

4 , 8

 

10

2

 

8 , 3

 

3 , 5

 

16

 

 

1 , 7 5

3

 

0 , 8 7 5

 

6 7 5

 

4

 

 

8

4

 

2 2 , 5

 

12

 

131

 

 

0 , 7 5

5

 

47

 

0 , 8

 

2 6 2

 

 

0 , 7 5

Найдите b0, b1 b2 и b3.

 

детерминации?

 

 

 

 

 

в) Чему

равен

коэффициент

 

 

 

 

 

г) Обеспечивает ли подбор логарифмической модели 5%-ный уровень су­

щественности? Получите ли вы другое значение

R ®, если

определите этот по­

казатель для

исходной модели,

а не для ее логарифмической формы?

д) Существенно ли Ь2 отличается от нуля при 5%-ном уровне существен­ ности?

е) Какие параметры изменятся, если вместо десятичных логарифмов взять

натуральные?

 

из

уравнений

(10) и

(22) соответственно

покажите,

что

10.

Для X* и w'

1'Х* =

[п а/ 1,

если Г

111. . . 11.

по (29)

путем подстановки

выражений

(10)

11. Докажите уравнения с (23)

в следующие за ними уравнения.

 

 

 

 

 

Замечание.

Можно

использовать

 

 

 

 

 

 

п р' 1

1

 

п -2 р 'V р

п - 1р' V

 

 

 

0

 

 

 

Р

Q

=

п

 

+

 

V

 

 

 

 

0

0

—п- 1 Vp

 

 

 

 

 

 

 

 

 

 

 

где F = [Q—/z~ 1 рр 7J—1

и п —скалярная величина.

 

 

 

ЛИ Т Е Р А Т У Р А

1.C h o w G. С. (1967). Technological change and the demand for compu­

ters. The American

Economic

Review, 57, 1115— 1130.

2.

G o l d b e r g e r A .

S. (1964). Econometric

Theory. Wiley, New York.

3.

G г a у b i 1 1 F. A.

(1961). An Introduction to Linear Statistical Models.

Vol. I, McGraw-Hill, New York.

Methods. McGraw—Hill, New

4.

J o h n s t o n

J.

(1963). Econometric

York.

K e n d a l l

M.

G.

 

and S t u a r t A.

(1958, 1961). The Advanced The­

5.

 

ory of Statistics. Vols. I and II, Charles Griffin, London. (Имеется русский перевод

тома 1:

Кендалл М. Д., Стьюарт А. Теория распределения. М., «Наука», 1966.)

6 .

L i n t n е г

J.

 

(1956).

Distribution

of

incomes of

corporations among

dividends,

retained

earnings and taxes. The American Economic Review, Papers

and Proceedings,

May,

97—113.

 

 

 

 

 

7.

M e 1 t z e r

A.

 

H.

(1963). The demand for money: the evidence from the

time series.

The Journal of Political Economy,

71,

219—246.

 

 

 

8 . M o o d

A.

M.

and

G г a у b i 1 1 F.

A.

(1963). Introduction to the The­

ory of

Statistics. McGraw-Hill, New York.

 

 

unemployment

and

9.

P h i l l i p s

A.

W.

(1958). The relation between

the rate of change in money wage rates in the United Kingdom,

1862—1957.

Eco­

nomica,

25,

283—299.

 

(1966). Matrix Algebra for the Biological

Sciences. Wiley,

10.

S e a r 1 e S. R.

New York.

Соседние файлы в папке книги из ГПНТБ