Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика для начинающих - В.П. Носко.doc
Скачиваний:
80
Добавлен:
24.05.2014
Размер:
9.34 Mб
Скачать

2.12. Использование оцененной модели для прогнозирования

Пусть мы имеем модель наблюдений в виде модели простой линейной регрессии

и хотим дать прогноз, каким будет значение объясняемой переменной при некотором выбранном (фиксированном) значенииобъясняющей переменной, если мы будем продолжать наблюдения.

Мы умеем оценивать коэффициенты иметодом наименьших квадратов, и естественно использовать для целей прогнозирования получаемую в результате такого оценивания (подобранную) модель линейной связи

что приводит к прогнозируемому значению объясняемой переменной, равному

Вопрос только в том, сколь надежным является выбор такого значения в качестве прогнозного. И здесь надо иметь в виду следующее.

Поскольку мы используем для прогноза оценки, полученные, исходя из модели наблюдений то для того, чтобы этот прогноз был осмысленным, нам по необходимости приходится предполагать, что структура модели наблюдений и ее параметрыне изменятся при переходе к новому наблюдению, так что соответствующее значениедолжно описыватьсятем же линейным соотношением . В таком случае, мы по-существу имеем дело с расширенной линейной моделью снаблюдениями, в которой дополнительное наблюдение удовлетворяет соотношению

При этом, случайная величина должна иметьто жераспределение, что и случайные величиныи должна образовывать вместе с ними множество случайных величин, независимых в совокупности.

Итак, мы договорились, что в расширенной модели

Выбирая в качестве прогноза для значениемы тем самым допускаемошибку прогноза, равную

Поскольку вычисленные оценки являются (как мы уже выяснили выше) реализациями случайных величин, наблюдаемая ошибка прогноза также является реализацией случайной величиныи включает два источника неопределенности:

  • неопределенность, связанную с отклонением вычисленных значений случайных величин от истинных значений параметров;

  • неопределенность, связанную со случайной ошибкой в- м наблюдении.

При наших стандартных предположенияхо линейной модели наблюдений ошибка прогноза являетсяслучайной величиной, имеющей математическое ожидание

(Мы использовали здесь справедливые при выполнении стандартных предположений соотношения )

Точность прогноза характеризуется дисперсией ошибки прогноза

Здесь использован тот факт, что сумма неслучайна(хотя ее точное значение и не известно). Далее, из предположенной независимости случайных ошибокивытекает независимость случайных величин(эта величина зависит от случайных ошибок) и(последняянезависит от случайных ошибок). В силу же независимостии,

(использовано правило сложения дисперсий). Остается заметить, что

где, как обычно, (Мы не будем выводить эту формулу.) Таким образом,

Если случайные ошибки имеютнормальноераспределение, то тогда случайные величиныи

также имеют нормальные распределения. При этом, ошибка прогноза имеет нормальное распределение с нулевым математическим ожиданием и дисперсией, вычисляемой по последней формуле.

Разделив разность на квадратный корень из ее дисперсии, получаем случайную величину

имеющую стандартноенормальное распределение. Заменяя в правой части выражения длянеизвестное значениеего несмещенной оценкой, получаем оценку дисперсиив виде

Заменяя, наконец, в знаменателе отношения, имеющего стандартное нормальное распределение, неизвестное значение его оценкой, приходим к-статистике (-отношению)

имеющей при выполнении сделанных предположенийо модели наблюдений-распределение Стьюдентасстепенями свободы.

Последний факт дает возможность построения -процентного доверительного интерваладля значения

а именно,

на основании которого получаем -процентный доверительный интервалдля:

— здесь мы использовали то, что в силу симметрии распределения Стьюдента, .

Заметим, что при заданных значениях (по которым строится прогноз) доверительный интервал длябудеттем длинее, чем больше значение. Последнее же равноприи возрастает с ростом. Это означает, что длина доверительного интервалавозрастаетпри удалении значения, при котором строится прогноз, от среднего арифметического значений.

Таким образом, прогнозы для значений , далеко отстоящих от, становятся менее определенными, поскольку длина соответствующих доверительных интервалов для значений объясняемой переменной возрастает.

Пример. Для данных о размерах совокупного располагаемого дохода и совокупных расходах на личное потребление в США в период с 1970 по 1979 год (в млрд. долларов, в ценах 1972 года), оцененная модель линейной связи имеет вид.

Представим себе, что мы находимся в 1979 году и ожидаем увеличения в 1980 году совокупного располагаемого дохода (в тех же ценах) до млрд. долларов. Тогда прогнозируемый по подобранной модели объем совокупных расходов на личное потребление в 1980 году равен

так что если выбрать уровень доверия , то

и доверительный интервал для соответствующего значенияимеет вид

т. е.

или

Заметим, что интервал достаточно широк и его нижняя граница допускает даже возможность некоторого снижения уровня потребления по сравнению с предыдущим годом.

В действительности, в 1980 г. совокупный располагаемый доход достиг  млрд. долларов, а совокупное потребление —  млрд. долларов. Тем самым, ошибка прогноза составила

Если бы мы исходили при прогнозе из действительного значения, а не из, то прогнозируемое значение дляравнялось быи ошибка прогноза составила всего лишь

Проиллюстрируем, наконец, как изменяется в этом примере длина %-доверительных интервалов в интервале наблюдавшихся значений объясняющей переменной. На графике приведены отклонения нижней и верхней границ таких интервалов от центра интервала:

В случае модели множественной линейной регрессии

точечный прогноззначениясоответствующегофиксированномунаборузначений объясняющих переменных, дается формулой

где — оценки наименьших квадратов параметров.Интервальный прогноз имеет вид

где

  • оценка дисперсии ошибки прогноза, а - несмещенная оценка дисперсиислучайных ошибок.