Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4ПМ_Б_Комп_Модел_Власова / Теоретический материал / Компютерное моделирование_Лекции.doc
Скачиваний:
93
Добавлен:
28.03.2016
Размер:
1.95 Mб
Скачать

3.4. Использование оцененной модели для прогнозирования

Пусть мы имеем модель наблюдений в виде модели простой линейной регрессии

и хотим дать прогноз, каким будет значение объясняемой переменной при некотором выбранном (фиксированном) значенииобъясняющей переменной, если мы будем продолжать наблюдения.

Мы умеем оценивать коэффициенты иметодом наименьших квадратов, и естественно использовать для целей прогнозирования получаемую в результате такого оценивания (подобранную) модель линейной связи

что приводит к прогнозируемому значению объясняемой переменной, равному

Вопрос только в том, насколько надежным является выбор такого значения в качестве прогнозного. Поскольку мы используем для прогноза оценки, полученные из модели наблюдений , то для того, чтобы этот прогноз был осмысленным, предполагаем, что структура модели наблюдений и ее параметрыне изменятся при переходе к новому наблюдению. Тогда соответствующее значениедолжно описываться тем же линейным соотношением. В таком случае, мы имеем дело с расширенной линейной моделью снаблюдениями, в которой дополнительное наблюдение удовлетворяет соотношению

При этом, случайная величина должна иметьто жераспределение, что и случайные величиныи должна образовывать вместе с ними множество случайных величин, независимых в совокупности.

Итак, мы договорились, что в расширенной модели

Выбирая в качестве прогноза значение мы тем самым допускаемошибку прогноза, равную

Поскольку вычисленные оценки являются (как мы уже выяснили выше) реализациями случайных величин, наблюдаемая ошибка прогноза также является реализацией случайной величиныи включает два источника неопределенности:

  • неопределенность, связанную с отклонением вычисленных значений случайных величин от истинных значений параметров;

  • неопределенность, связанную со случайной ошибкой в- м наблюдении.

При наших стандартных предположениях о линейной модели наблюдений ошибка прогноза является случайной величиной , имеющей математическое ожидание

(Мы использовали здесь справедливые при выполнении стандартных предположений соотношения )

Точность прогноза характеризуется дисперсией ошибки прогноза

Здесь использован тот факт, что сумма не случайна(хотя ее точное значение и не известно). Далее, из предположенной независимости случайных ошибокивытекает независимость случайных величин(эта величина зависит от случайных ошибок) и(последняянезависит от случайных ошибок). В силу же независимостии,

(использовано правило сложения дисперсий). Остается заметить, что

где, как обычно, (Мы не будем выводить эту формулу.) Таким образом,

Если случайные ошибки имеютнормальноераспределение, то тогда случайные величиныитакже имеют нормальные распределения. При этом, ошибка прогнозаимеет нормальное распределение с нулевым математическим ожиданием и дисперсией, вычисляемой по последней формуле.

Разделив разность на квадратный корень из ее дисперсии, получаем случайную величину

которая имеет стандартное нормальноераспределение. Заменяя в правой части выражения длянеизвестное значениеего несмещенной оценкой, получаем оценку дисперсиив виде

Заменим в знаменателе отношения, имеющего стандартное нормальное распределение, неизвестное значение его оценкой, приходим к-статистике (-отношению)

имеющей при выполнении сделанных предположенийо модели наблюдений-распределение Стьюдентасстепенями свободы.

Последний факт дает возможность построения -процентного доверительного интерваладля значенияа именно,

на основании которого получаем -процентный доверительный интервалдля:

— здесь мы использовали то, что в силу симметрии распределения Стьюдента, .

При заданных значениях по которым строится прогноз, доверительный интервал длябудеттем длиннее, чем больше значение. Последнее же равноприи возрастает с ростом. Это означает, что длина доверительного интервалавозрастаетпри удалении значения, при котором строится прогноз, от среднего арифметического значений.

Таким образом, прогнозы для значений , далеко отстоящих от, становятся менее определенными, поскольку длина соответствующих доверительных интервалов для значений объясняемой переменной возрастает.

Пример. Для данных о размерах совокупного располагаемого дохода и совокупных расходах на личное потребление в США в период с 1970 по 1979 год (в млрд. долларов, в ценах 1972 года), оцененная модель линейной связи имеет вид.

Представим себе, что мы находимся в 1979 году и ожидаем увеличения в 1980 году совокупного располагаемого дохода (в тех же ценах) до млрд. долларов. Тогда прогнозируемый по подобранной модели объем совокупных расходов на личное потребление в 1980 году равентак что если выбрать уровень доверия, то

и доверительный интервал для соответствующего значенияимеет вид

т. е.

или

Заметим, что интервал достаточно широк и его нижняя граница допускает даже возможность некоторого снижения уровня потребления по сравнению с предыдущим годом.

В действительности, в 1980 г. совокупный располагаемый доход достиг  млрд. долларов, а совокупное потребление —  млрд. долларов. Тем самым, ошибка прогноза составила

Если бы мы исходили при прогнозе из действительного значения, а не из, то прогнозируемое значение дляравнялось быи ошибка прогноза составила всего лишь

Проиллюстрируем, наконец, как изменяется в этом примере длина %-доверительных интервалов в интервале наблюдавшихся значений объясняющей переменной. На графике приведены отклонения нижней и верхней границ таких интервалов от центра интервала:

Рис. 6.1.

В случае модели множественной линейной регрессии

точечный прогноззначениясоответствующегофиксированномунаборузначений объясняющих переменных, дается формулойгде— оценки наименьших квадратов параметров.Интервальный прогноз имеет вид:

Где - оценка дисперсии ошибки прогноза, а- несмещенная оценка дисперсиислучайных ошибок.