Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный университет им. аль-Фараби

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

diplom25 / suslov_ibragimov_ekonometrika

.pdf

Скачиваний:

Добавлен:

24.03.2015

Размер:

5.55 Mб

Скачать

☆

<<< < Предыдущая 15 16 17 18 19 20 21 22 23 24 25 2627 / 7427 28 29 30 31 32 33 34 35 36 37 38 39 > Следующая >>>

262	Глава8.Нарушение гипотез основной линейной модели

ei2

s22

	s2	yi
	1	yi
	1

Рис. 8.2

Такой подход применяется,если ожидае тся,что дисперсия может быть только положительно коррелирована с переменной yi .Если неизвестно,положительно или отрицательно коррелирована дисперсия с рассматриваемым фактором,то следует отклонять нулевую гипотезу как при больших,так и при малых значениях ста-

тистики s22"s21 .Можно применить следующий при ем:рассчитать статистику как

отношение максимальной из дисперсий s21 и s22 к минимальной.Такая статистика будет иметь усеченное F -распределение,где усечение происходит на уровне медианы,и берется правая половина распределения.Отсюда следует,что для достижения,например, 5%-го уровня ошибки,следует взять табличную критическуюграницу,соответствующую, 2.5%-муправому хвостуобычного(не усеченного) F -распределения.Если указанная статистика превышает данную границу,то нулевая гипотеза о гомоскедастичности отвергается.

Данный метод известен под названием метода ГолдфельдаÑКвандта.

Можно применять упрощенный вариант этого критерия,когда дисперсии s22 и s22 считаются на основе остатков из проверяемой регрессии.При этом s21 и s22 не будут независимы,и их отношение будет иметь F -распределение только приближенно.Этот метод иллюстрирует рисунок8.2.

Для того чтобы можно было применять методы третьей группы,требуется обладать конкретной информацией о том,какой именно вид имеет гетероскедастичность.

Так,например,если остатки прямо пропорциональны значениям фактора( n = 1):

x= zα + β + zε,

иε удовлетворяет необходимым гипотезам,то делением обеих частей уравнения на z ситуация возвращается вÇштатнуюÈ:

Zx = α + Z1 β + ε,

8.2.Гетероскедастичность ошибок

263

ei2

s22

	s2	yi
	1	yi
	1

Рис. 8.3

в которой,правда,угловой коэффициент и свободный член меняются местами.Тем

самым применяется преобразование в пространстве наблюдений такое,что диаго-

нальные элементы матрицы D равны 1 zi .

Если зависимость дисперсии от других переменных известна не точно,а только с точностью до некоторых неизвестных параметров,то для проверки гомоскедастичности следует использовать вспомогательные регрессии.

Так называемый метод Глейзера состоит в следующем.Строится регрессия модулей остатков |ei| на константу и те переменные,которые могут быть коррелированными с дисперсией(например,это может быть все множество независимых факторов или какое-то их подмножество).Если регрессия оказывается статистически значимой,то гипотеза гомоскедастичности отвергается.

Построение вспомогательной регрессии от некоторой переменной yi показано на рисунке8.3.

Другой метод( критерий Годфрея)использует аналогичную вспомогательную регрессию,в которой в качестве зависимой переменной используются квадраты остатков e2i .

Если с помощью какого-либо из перечисленных критериев(или других аналогичных критериев)проверены различн ые варианты возможной зависимости и нулевая гипотеза во всех случаях не была отвергнута,то делается вывод,что ситуация гомоскедастична или гетероскедастична без негативных последствий и что для оценки параметров модели можно использовать обычный МНК.Если же нулевая гипотеза отвергнута и поэтому,возможно,имеет место гетероскедастичность с негативными последствиями,то желательно получить более точные оценки,учитывающие гетероскедастичность.

Это можно сделать,используя для оц енивания обобщенный МНК(см.уравнение(8.2)).Соответствующее преобразование в пространстве наблюдений состоит

264	Глава8.Нарушение гипотез основной линейной модели

в том,чтобы каждое наблюдение умножить на di ,т.е.требуется оценить обычным методом наименьших квадратов преобразованную регрессию с переменными diXi и di Zi .При этом не следует забывать,что если матрица факторов Z содержит свободный член,то его тоже нужно умножить на di ,поэтому вместо свободного члена в регрессии появится переменная вида (d1, . . . , dN ).Это приводит к тому, что стандартные статистические пакеты выдают неверные значения коэффициента детерминации и F -статистики.Чтобы этого не про исходило,требуется пользоваться специализированными процедурами для расчета взвешенной регрессии. Описанный методполучил названиевзвешенного МНК,посколькуонравнозначен

минимизации взвешенной суммы квадратов остатков %N d2i e2i .

i=1

Чтобы это можно было осуществить,необ ходимо каким-то образом получить оценкуматрицы D,используемойдляпреобразованиявпространственаблюдений. Перечисленные в этом параграфе методы дают возможность не только проверить гипотезу об отсутствии гетероскедастичности,но и получить определенные оценки матрицы D (возможно,не очень хорошие).

Если S2 Ñоценка матрицы σ2Ω ,где S2 Ñдиагональная матрица,составленная из оценок дисперсий,то S−1 (матрица,обратная к ее квадратному корню) Ñоценка матрицы σD.

Так,после проверки гомоскедастичности методом Глейзера в качестве диа-

гональных элементов матрицы S−1 можно взять 1		e c ,где ei c Ñрасчетные
значения ei	.Если используются критерии Бартлетта"\|илиi\| Голдфельда\| \|		ÑКвандта,
\| \|

то наблюдения разбиваются на группы,для каждой из которых есть оценка дис-

персии, s2.Тогда для этой группы наблюдений в качестве диагональных элементов

l "

матрицы S−1 можно взять 1 sl .

В методе ГолдфельдаÑКвандта требуется дополнительно получить оценку дисперсии для пропущенной средней части наблюдений.Эту оценку можно получить непосредственнопоостаткампропущенныхналюденийиликаксреднее (s21 +s22)/2.

Если точный вид гетероскедастичности неизвестен,и,как следствие,взвешенный МНК неприменим,то,по крайней мере,следует скорректировать оценку ковариационной матрицы оценок параметров,оцененных обычным МНК,прежде чем проверять гипотезы о значимости коэффициентов. (Хотя при использовании обычного МНК оценки будут менее точными,но как ужеупоминалось,они будут несмещенными и состоятельными.)Простейший метод коррекции состоит в замене неизвестной ковариационной матрицы ошибок σ2Ω на ее оценку S 2,где S 2 Ñдиагональная матрица с типичным элементом e2i (т.е.квадратыостатковиспользуются как оценки дисперсий).Тогда получается следующая скорректированная оценка ковариацион-

ной матрицы a (оценка Уайта или устойчивая к гетероскедастичности оценка):

(Z "Z )−1 Z "S 2Z (Z "Z )−1 .

8.3.Автокорреляция ошибок

265

8.3.Автокорреляция ошибок

Если матрица ковариаций ошибок не является диагональной,то говорят об автокорреляции ошибок.Обычно при этом предполагают,что наблюдения однородны по дисперсии,и их последовательнос ть имеет определенный смысл и жестко фиксирована.Как правило,такая ситуация имеет место,если наблюдения проводятся в последовательные моменты времени.В этом случае можно говорить о зависимостях ошибок по наблюдениям,отстоящим друг от друга на 1, 2, 3 и т.д. моментавремени.Обычнорассматривается частныйслучайавтокорреляции,когда коэффициенты ковариации ошибок зависят только от расстояния во времени между наблюдениями;тогда возникает матрица ковариаций,в которой все элементы каждой диагонали(не только главной)одинаковы 1.

Поскольку действие причин,обуславливающих возникновение ошибок,доста-
точноустойчивововремени,автокорреляцииошибок,какправило,положительны.
Это ведет к тому,что значения остаточной дисперсии,получе нные по стандартным
(ÇштатнымÈ)формулам,оказываются ниже их действительных значений.Что,как
отмечалось и в предыдущем пункте,чревато ошибочными выводами о качестве
получаемых моделей.
Это утверждение иллюстрируется рисунком8.4 ( n = 1).
На этом рисунке:
a Ñлиния истинной регрессии.Если в пер вый момент времени истинная ошибка
отрицательна,то в силу положительной автокорреляции ошибок все облако наблю-
дений сместится вниз,и линия оцененной регрессии займет положение b.
Есливпервый момент времени истиннаяошибкаположительна,топотем жепричи-
нам линия оцененной регрессии сместится вверх и займет положение c.Поскольку
1В теории временных рядов это называется слабой стационарностью.
x	c

	a
	b
	время
	Рис. 8.4

266	Глава8.Нарушение гипотез основной линейной модели

ошибки случайны и в первый момент времени они примерно с равной вероятностью могут оказаться положительными или отрицательными,то становится ясно, насколько увеличивается разброс оценок регрессии вокруг истинных по сравнению с ситуацией без(положительной)автокорреляции ошибок.

Типичный случай автокорреляции ошибок,рассматриваемый в классической эконометрии, Ñэто линейная авторегрессия ошибок первого порядка AR(1):

εi = ρεi−1 + ηi ,

где η Ñостатки,удовлетворяющие обычным гипотезам; ρ Ñкоэффициент авторегрессии первого порядка.

Коэффициент ρ вляется также коэффициентом автокорреляции(первого порядка).

Действительно,по определению,коэффициент авторегрессии равен(как МНКоценка):

=cov(εi , εi−1)

ρvar(εi−1) ,

но,в силу гомоскедастичности, var(εi−1) =			var(εi )var(εi−1)	и,следовательно,
ρ,также по определению,является	коэффициентом автокорреляции.
		Z

Если ρ = 0,то εi = ηi и получаемÇштатнуюÈситуацию.Таким образом, проверку того,что автокорреляция отсутствует,можно проводить как проверку нулевой гипотезы H0: ρ = 0 для процесса авторегрессии1-го порядка в ошибках.

Для проверки этой гипотезы можно использовать критерий ДарбинаÑ Уотсона или DW-критерий.Проверяется нулевая гипотеза о том,что автокорреляция ошибок первого порядка отсутствует. (При автокорреляции второго и более высоких порядков его мощность может быть мала,и применение данного критерия становится ненадежным.)

Пусть была оценена модель регрессии и найдены остатки ei , i = 1, . . . , N . Значение статистики ДарбинаÑУотсона(отношения фон Неймана),или DW-ста- тистики,рассчитывается следующим образом:

	N	(ei − ei−1)2
=2		(ei − ei−1)2
dc =	i%		.	(8.3)
dc =		N	.	(8.3)
		i%
		e2
		i
		=1

Оно лежит в интервале от 0 до 4,в случае отсутствия автокорреляции ошибок приблизительно равно 2,при положительной автокорреляции смещается в мень-

8.3.Автокорреляция ошибок

267

0		2	4
dL	dU	4&dU	4&dL

Рис. 8.5

шую сторону,при отрицательнойÑв большую сторону.Эти факты подтверждаются тем,что при больших N справедливо следующее соотношение:

dc ≈ 2(1 − r),

(8.4)

где r Ñоценка коэффициента авторегрессии.

Минимального значения величина dc достигает,если коэффициент авторегрессии равен +1.В этом случае ei = e, i = 1, . . . , N , и dc = 0.Если коэффициент авторегрессии равен −1 и ei = (−1)ie, i = 1, . . . , N ,то величина dc достигает

значения 4 NN− 1 (можно достичь и более высокого значения подбором остатков),

которое с ростом N стремится к 4.Формула(8.4)следует непосредственно из(8.3) после элементарных преобразований:

%		−	%			%N
	N			N		N
	ei2			ei−1ei		ei2	1
						−
dc =	i=2		2	i=2	+	i=2		,
%			%			i%
	N			N
	e2			e2		e2
	i			i		i
	i=1			i=1	=1

поскольку первое и третье слагаемые при больших N близки к единице,а второе слагаемое является оценкой коэффициента автокорреляции(умноженной на −2).

Известно распределение величины d,если ρ = 0 (это распределение близко к нормальному),но параметры этого р аспределения зависят не только от N и n, как для t- и F -статистик при нулевых гипотезах. ПоложениеÇколоколаÈфункции плотности распределения этой величины зависит от характера Z .Тем не менее, ДарбиниУотсонпоказали,чтоэтоположениеимеетдвекрайниепозиции(рис.8.5).

Поэтому существует по два значения для каждого(двустороннего)квантиля, соответствующего определенным N и n:его нижняя dL и верхняя dU границы. Нулевая гипотеза H0: ρ = 0 принимается,если dU ! dc ! 4 −dU ;она отвергается в пользу гипотезы о положительной автокорреляции,если dc < dL ,и в пользу


268	Глава8.Нарушение гипотез основной линейной модели
гипотезы об отрицательнойc		автокорреляции,если dc > 4 −dL .Если dL ! dc < dU
или 4−dU < d	! 4−dL ,вопросостаетсяоткрытым(этоÑзонанеопределенности

DW-критерия).

Пусть нулевая гипотеза отвергнута.То гда необходимо дать оценку матрицы Ω.

Оценка r параметра авторегрессии ρ может определяться из приближенного равенства,следующего из (8.4):

dc r ≈ 1 − 2 ,

или рассчитываться непосредственно из регрессии e на него самого со сдвигом на одно наблюдение с принятиемÇкруговойÈгипотезы,которая заключается в том, что eN +1 = e1.

Оценкой матрицы Ω является
			1					r			r2				ááá rN −1
			r					1			r				ááá		rN −2
															ááá
1
			r		2			r			1						r	N	−	3	,
	1 r2				2													N		3	,
	1 r2														ááá
															ááá
	−	.						.			.				.	..		.
		..						..			..					..		..

					−			−				−						1
		r			−		r	−			r	−			ááá			1
															ááá

		N				1		N 2			N		3
а матрица D преобразований в пространстве наблюдений равна
		√						0 0 ááá								0
		√		1 − r2				0 0 ááá								0
					−		r	1			0		ááá			0
					−								ááá

					0					r	1						.
					0			−		r	1		ááá			0
								−					ááá
		.							. . .					..		.
		..							.. ..					..		..


					0			0			0
					0			0			0		ááá			1
													ááá

Для преобразования в пространстве наблюдений,называемом в данном случае авторегрессионным,используют обычно указанную матрицу без1-й строки, что ведет к сокращению количества наблюдений на одно.В результате такого преобразования из каждого наблюдения,н ачиная со2-го,вычитается предыдущее, умноженное на r,теоретическими остатками становятся η ,которые,по предположению,удовлетворяют гипотезе g4.

8.3.Автокорреляция ошибок

269

После этого преобразования снова оцениваются параметры регрессии.Если новое значение DW-статистики неудовлетворительно,то можно провести следующее авторегрессионное преобразование.

Обобщает процедуру последовательных авторегрессионных преобразований метод КочренаÑОркатта,который заключается в следующем.

Для одновременной оценки r, a и b используется критерий ОМНК(в обозначениях исходной формы уравнения регрессии):

1 !N ((xi − rxi−1) − (zi − rzi−1)a − (1 − r)b)2 → min,

N i=2

где zi Ñ n-вектор-строка значений независимых факторов в i-м наблюдении (i-строка матрицы Z ).

Поскольку производные функционала по искомым величинам нелинейны относительно них,применяется итеративная процедура,на каждом шаге которой сначала оцениваются a и b при фиксированном значении r предыдущего шага (на первом шаге обычно r = 0),а затемÑ r при полученных значениях a и b. Процесс,как правило,сходится.

Как и в случае гетероскедастичности,мож но не использовать модифицированные методы оценивания(тем более,что точный вид автокорреляции может быть неизвестен),а использовать обычный МНК и скорректировать оценку ковариационной матрицы параметров.Наиболее часто используемая оценка НьюиÑУэста (устойчивая к гетероскедастичности и автокорреляции)имеет следующий вид:

(Z "Z )−1 Q (Z "Z )−1 ,

где

	N		L	N
	!		!k	!
Q =	ei2	+		λk eiei−k (zi zi"−k + zi−k zi"),
	i=1		=1 i=k+1

а λk Ñпонижающие коэффициенты,которые Ньюи и Уэст предложили рассчи-

тывать по формуле	λk = 1 −	k	.При k > L	понижающие коэффициенты
		L + 1
становятся равными нулю,т.е.более дальние корреляции не учитываются

Обоснование этой оценки достаточно сложно2.Заметим только,что если заменить попарные произведения остатков соответствующими ковариациями и убрать понижающие коэффициенты,то получится формула ковариационной матрицы оценок МНК.

Приведенная оценка зависит от выбора параметра отсечения L.В настоящее вре-

мя не существует простых теоретически обоснованных методов для такого выбора.
(		"	)	=.
На практике можно ориентироваться на грубое правило L = <4	T	100	2/9	=.

2Оно связано с оценкой спектральной плотности для многомерного временного ряда.

270	Глава8.Нарушение гипотез основной линейной модели

8.4.Ошибки измерения факторов

Пусть теперь нарушается гипотеза g2,и независимые факторы наблюдаются с ошибками.Предполагается,что изучае мая переменная зависит от истинных значений факторов(далее в этом пункте используется сокращенная форма уравнения регрессии), zö0,а именно:

xö = zö0α + ε,

но истинные значения неизвестны,а вместо этого имеются наблюдения над некоторыми связанными с zö0 переменными zö:

	zö = zö0 + εz ,
где εz	Ñвектор-строка длиной n ошибок наблюдений.
В разрезе наблюдений:
	ö	ö0	α + ε,
	X	= Z	α + ε,
	ö	ö0	+ εz ,
	Z	= Z	+ εz ,
ö0	и εz Ñсоответствующие N × n-матрицы значений этих величин по на-
где Z

блюдениям(т.е.,в зависимости от контекста, εz обозначает вектор или матрицу ошибок).

Предполагается,что ошибки факторов по математическому ожиданию равны нулю,истинныезначениярегрессоровиошибкинезависимыдруготдруга(покрайней мере не коррелированы друг с другом)и известны матрицы ковариации:

E(εz ) = 0,	E(öz0!, ε) = 0,		E(öz0!, εz ) = 0,		(8.5)
					(8.5)
E(öz0!, zö0) = M 0, E(ε!		, ε ) =Ω , E(ε!		, ε) = ω.
	z	z	z

Важно отметить,что эти матрицы и ве ктора ковариации одинаковы во всех наблюдениях,а ошибки в разных наблюдениях не зависят друг от друга,т.е.речь, фактически,идет оÇматричнойÈгомоскедастичности иотсутствии автокорреляции ошибок.

Через наблюдаемые переменные xö и zö уравнение регрессии записывается

в следующей форме:
xö = zöα + ε − εz α.	(8.6)

В такой записи видно,чтоÇновыеÈостатки не могут быть независимыми от факто- ров-регрессоров zö,т.е.гипотезы основной модели регрессии нарушены.В рамках

8.4.Ошибки измерения факторов	271
сделанных предположений можно доказать,что приближенно
E(a) ≈ (M 0 +Ω) −1(M 0α + ω) = α + (M 0 +Ω) −1(ω − Ωα),	(8.7)

т.е.МНК-оценки теряют в такой ситуации свойства состоятельности и несмещенности3,если ω =! Ωα (в частности,когда ошибки регрессии и ошибки факторов не коррелированны,т.е.когда ω = 0, а Ω и α отличны от нуля).

Для обоснования (8.7) перейдем к теоретическому аналогу системы нормальных уравнений,для чего обе части соотношения (8.6) умножаются на транспонированную матрицу факторов:

E (öz"xö) = E (öz"zö) α + E (öz"ε) − E (öz"εz ) α.

Здесь,как несложно показать,пользуясь сделанными предположениями,

E (öz"zö) = M 0 + Ω,

E(öz"ε) = ω,

E(öz"εz ) =Ω ,

Поэтому

E (öz"xö) = E (öz"zö) α + ω − Ωα

или

E (öz"zö)−1 E (öz"xö) = α + 0M 0 + Ω1−1 (ω − Ωα) .

Левая часть приближенно равна E(a).

Действительно, a = M −1 ационные матрицы M и сходятся по вероятности к

,где = 1 ö" ö и = 1 ö"ö.Выборочные ковари- m M N Z Z m N Z x

m по закону больших чисел с ростом числа наблюдений своим теоретическим аналогам:

M −→E (öz"zö)

и m −→E (öz"xö) .

Посвойствамсходимостиповероятностипределфункцииравенфункцииотпредела, если функция непрерывна.Поэтому

a = M −1m −→ E (öz"zö)−1 E (öz"xö) = (M 0 +Ω) −1(M 0α + ω).

Существуют разные подходы к оценке параметров регрессии в случае наличия ошибок измерения независимых факторов.Здесь приводятся два из них.

3Они смещены даже асимптотически,т.е.при стремлении количества наблюдений к бесконечности смещение не стремится к нулю.

<<< < Предыдущая 15 16 17 18 19 20 21 22 23 24 25 2627 / 7427 28 29 30 31 32 33 34 35 36 37 38 39 > Следующая >>>

Соседние файлы в папке diplom25

#
24.03.20151.55 Mб2812233.docx
#
24.03.2015160.08 Кб19NonParametrics1.pdf
#
24.03.20155.55 Mб31suslov_ibragimov_ekonometrika.pdf
#
24.03.2015412.09 Кб87Vsya_Diplomka.docx