Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный университет им. аль-Фараби

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Диплом / Algebra_lineynoy_regressii.docx

Скачиваний:

Добавлен:

24.03.2015

Размер:

2.49 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 148 9 10 11 12 13 14 > Следующая >>>

7.4. Прогнозирование

Пусть получены оценки параметров уравнения (7.11). Задача прогнозирования заключается в определении возможного значения (прогноза) переменной x, объ- ясняемой этой моделью, при некоторых заданных значениях факторов z, которые не совпадают ни с одним из наблюдений в матрице Z . Более того, как прави- ло, z лежит вне области, представляемой матрицей Z . При этом предполагается,

что гипотезы g1−g3 по-прежнему выполняются.

Обычно термин «прогнозирование» используется в случае, когда наблюдения i = 1, . . . , N в матрице Z даны по последовательным моментам (периодам) вре- мени, и заданные значения факторов z, для которых требуется определить прогноз x, относятся к какому-то будущему моменту времени, большему N (т.е. z лежит вне области, представляемой матрицей Z ).

Методы прогнозирования могут быть различными. Если применяются отно- сительно простые статистические методы, как в данном случае, то часто исполь- зуют термин «экстраполирование». Если аналогичная задача решается для z, лежащих внутри области, представляемой наблюдениями в матрице Z (например, для «пропущенных» по каким-то причинам наблюдений), то используют термин

«интерполирование». Процедуры экстраполирования и интерполирования с ис- пользованием модели (7.11) с формальной точки зрения одинаковы.

Итак, задан некоторый z_r= [z_r₁··· z_rn1], который отличается от всех z_i,

i = 1, . . . , N (если i — обозначает момент времени, то r > N ).

x_r= z_rα + ε_r— истинное значение искомой величины,

_x0

_r= z_rα — ожидаемое значение,

_xp

_r= z_ra — искомый (точечный) прогноз.

Предполагаем, что гипотезы g1−g4 выполнены как для i = 1, . . . , N , так и для r > N .

Это линейный (относительно случайных величин X ) прогноз: x^p⁽⁷^.²⁶⁾z LX ,

r ⁼^r

он не смещен относительно ожидаемого значения вслед за несмещенностью a:

E (x^p) = x⁰. Его ошибка ε^p= x_r− x^p

имеет нулевое математическое ожидание

r r r r

и дисперсию

_σ2

_p= σ

²^1+ z_r^.Z^tZ^.⁻¹

^t^, (7.63)

Прогнозирование 245

которая минимальна на множестве всех возможных линейных несмещенных про- гнозов.

_εp

Действительно:

_r= z_r(α − a)+ ε_r.

Поскольку случайные величины a и ε_rне зависят друг от друга,

_σ2 p 2^.

r r 2

_p= E ^.(ε_r)

= E (z_r(α − a)(α − a) z_r)+ E ^.ε_r^.=

= z_rM_az^r+ σ²

(7.29)

₂

= σ

z_r(Z^rZ)⁻¹z^r^.

_r1+ _r

Эта дисперсия минимальна среди всех возможных дисперсий линейных несмещен- ных прогнозов вслед за аналогичным свойством оценок a. Это является прямым следствием того, что оценки МНК относятся к классу BLUE. Для того чтобы в этом

убедиться, достаточно в доказательстве данного свойства оценок a, которое приве- дено в п. 7.2, заменить c^rна z_r.

Следует иметь в виду, что ошибка любого расчетного по модели значения x^c, являясь формально такой же: ε^c= x_i− x^c, имеет также нулевое математическое

i i

ожидание, но принципиально другую, существенно меньшую, дисперсию:

_σ2

_i= σ

²^1 − z_i^.Z^tZ^.⁻¹^t^

Видно, что эта дисперсия даже меньше остаточной.

Действительно, как и прежде: ε^c= z_i(α − a)+ ε_i. Но теперь случайные величины

a и ε_i

коррелированы и поэтому:

_σ2

_i= σ

²^1+ z_i(Z^rZ)⁻¹^r^

←−−−→

+ 2z_iE((α − a) ε_i)

(7.27)

= −Lε

^E^(εεi ⁾⁼^σ^oi ^,

^где^oi ^—ⁱ^-^й^орт

= σ²^1+ z_i(Z^rZ)⁻¹z^r^− 2σ²z_i(Z^rZ)⁻¹z^r= σ²^1 − z_i(Z^rZ)⁻¹z^r^.

i i i

Величины 1 − z_i(Z^rZ)⁻¹z^r(i = 1, . . . , N ), естественно, неотрицательны, посколь- ку они являются диагональными элементами матрицы B из (7.32), которая поло- жительно полуопределена.

Структуру дисперсии ошибки прогноза (7.63) можно пояснить на примере n = 1. В этом случае (используются обозначения исходной формы уравнения ре- грессии, и все z — одномерные величины):

_σ2 2

1 (z_r− z¯)²^.

_p= σ

1+ +

^zˆ²

. (7.64)

246 Глава 7. Основная модель линейной регрессии

В этом легко убедиться, если перейти к обозначениям исходной формы урав- нения регрессии, подставить в (7.63) вместо z_rи Z , соответственно, ^.z_r1^.

и ^.Z 1_N^.и сделать необходимые преобразования (правило обращения матрицы

(2 × 2) см. в Приложении A.1.2), учитывая, что

^^−1

ξ ξ

 

1 ^ξ⁻^ξ

 1 2

 

₌ 4

ξ₁ξ₄− ξ₂ξ₃^

²^и Z^rZ = ^zˆ²+ N z¯²:



ξ₃ξ₄

−ξ₃ξ₁

  ₋₁ 

_σ2 2

^. .Z^rZ N z¯

z_r₌

_p= σ

^1+





z_r1





N z¯

  

  

N 1

   

= σ²^1+¹^.

^.1 z¯

−



  r  ₌

^Z^rZ − N z¯

_z_r₁

  

^.2 ¹

−z¯

¹Z^rZ 1

₂_.. . ₂.

= σ²

z_r− 2z¯z_r+ _N^.^zˆ_i+ N z¯

1+ ^_z_ˆ₂

= σ²

1+ +

(z_r− z¯) _.

^zˆ²

Что и требовалось доказать.

Это выражение показывает «вклады» в дисперсию ошибки прогноза собствен- но остаточной дисперсии, ошибки оценки свободного члена и ошибки оценки угло- вого коэффициента. Первые две составляющие постоянны и не зависят от горизон- та прогнозирования, т.е. от того, насколько сильно условия прогноза (в частности, значение z_r) отличаются от условий, в которых построена модель (в частности,

значение

z¯). Третья составляющая — ошибка оценки углового коэффициента —

определяет расширяющийся конус ошибки прогноза.

Мы рассмотрели точечный прогноз. Если дополнительно к гипотезам g1−g4 предположить выполнение гипотезы g5 для i = 1, . . . , N и для r > N , то можно построить также интервальный прогноз.

По формуле (7.27) ошибка прогноза имеет вид:

_εp

_r= z_r(α − a)+ ε_r= z_rLε + ε_r.

Таким образом, она имеет нормальное распределение:

_εp p 2

_r= x_r− x_r∼ N (0, σ_p).

Если бы дисперсия ошибки σ²была известна, то на основе того, что

x_r− x^p

_σ_p∼

N (0, 1),

Упражнения и задачи 247

для x_rможно было бы построить (1 − θ)100-процентный прогнозный интервал:

Таблица 7.1

x_r∈ [x^p± σ_pεˆ₁

_θ] .

X	^Z1	^Z2
65.7	26.8	541
74.2	25.3	616
74	25.3	610
66.8	31.1	636
64.1	33.3	651
67.7	31.2	645
70.9	29.5	653
69.6	30.3	682
67	29.1	604
68.4	23.7	515
70.7	15.6	390
69.6	13.9	364
63.1	18.8	411
48.4	27.4	459
55.1	26.9	517
55.8	27.7	551
58.2	24.5	506
64.7	22.2	538
73.5	19.3	576
68.4	24.7	697

r ⁻

2 2 t

−1 t

Вместо неизвестной дисперсии σ_p= σ

берется несмещенная оценка

(1+ z_r(Z Z)

z_r)

_s2 2

t −1 t

_p= sˆ_e(1 + z_r(Z Z)

z_r).

По аналогии с (7.44) можно вывести, что

x_r− x^p

_s_p∼

^tN −n

−1^.

Тогда в приведенной формуле прогнозного интервала необ- ходимо заменить σ_pна s_pи εˆ₁₋_θна t^ˆ_N₋_n₋₁_,₁₋_θ:

x_r∈ ^.^p^..

^xr ^±^s^p^t^ˆ^N⁻ⁿ⁻¹^,¹⁻^θ

<<< < Предыдущая 1 2 3 4 5 6 78 / 148 9 10 11 12 13 14 > Следующая >>>

Соседние файлы в папке Диплом

#
24.03.201581 б15.~lock.NonParametrics1.pdf#
#
24.03.201581 б18.~lock.suslov_ibragimov_ekonometrika.pdf#
#
24.03.2015247.12 Кб14012_Регрессионный_анализ.docx
#
24.03.20152.49 Mб40Algebra_lineynoy_regressii.docx
#
24.03.2015160.08 Кб24NonParametrics1.pdf
#
24.03.20155.55 Mб41suslov_ibragimov_ekonometrika.pdf
#
24.03.201530.82 Кб28vopros gosy.docx
#
24.03.201559.9 Кб40Лекция 16 регр анализ.doc