Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
konspekt_matematicheskoe_modelirovanie.doc
Скачиваний:
42
Добавлен:
22.02.2015
Размер:
3.61 Mб
Скачать

Проверка адекватности моделирования

Адекватность – соответствие модели реальной системе.

не могут служить индикаторами адекватности, так как модель фактически оценена из условия SSres -> min, и эти показатели всегда будут неплохими. Но это жесткая привязка к обучающим данным, а как будет с данными вообще (новыми) – неясно.

Полотно 178

На рисунке звездочками показаны данные, по которым была оценена модель. Их она описывает хорошо, и SSres будет мала. Кружочками показаны новые данные, которые, очевидно, будут описываться плохо, т. е., оцененная модель не адекватна реальной системе.

Для проверки адекватности можно:

- или ждать прихода новых данных;

-или зарезервировать часть исходных данных в качестве экзаменующих:

: .

Основной и, в сущности, единственный показатель адекватности модели (в случае ее линейности):

,

– “стандартная ошибка адекватности”.

По сравнению с – стандартной ошибкой аппроксимации – , но именно она указывает погрешность предсказания: ,

~ 95 % интервал.

Скользящий экзамен (cross-validation)

Для повышения надежности определения поступают так:

1) разбить выборку на частей;

2) обучить на всех, кроме первой части, экзаменовать на первой;

3) обучить на всех, кроме второй, экзаменовать на второй;

4) и т. д.;

5) обучить на всех, кроме последней, экзаменовать на последней;

6) рассчитать:

.

Процедура bootstrap

Если N мало, для повышения надежности можно использовать процедуру bootstrap:

1) составить обучающую выборку с возвращением из случайно выбранных – элементов;

2) обучить модель на этом наборе;

3) экзаменовать модель на остальных данных, в набор не попавших;

4) повторить S раз.

Модели с лаговыми переменными

Пример: изучается зависимость – общие расходы населения в -м году от – наблюдаемых доходов за предыдущие годы. Так как имеет место накопление, т. е. трата не сразу, а через какое-то время, запаздывание, то приходим к модели:

(15)

,

;

где – доля дохода, которая тратится через лет после его приобретения,

– запаздывание (лаг);

– максимальный лаг;

– ошибка модели в момент (неучтенные факторы): не зависит от ;

, (16)

– расходы при нулевых наблюдаемых доходах.

, .

В принципе, модель (15, 16) есть КЛММР, если не случайны, либо модель со стохастическими независимыми переменными, некоррелированными с ошибками.

В обоих случаях оценки коэффициентов могут быть получены с помощью МНК с регрессорами:

,

,

.

Матрица плана содержит в соседних столбцах доходы, отстающие в одну временную единицу, следовательно, соседние столбцы почти одинаковые, а это ведет к мультиколлинеарности и плохой обратимости матрицы , так как .

Поэтому, отправляясь от содержательной сущности моделируемой зависимости (от смысла ), постулируют с небольшим числом параметров: ; задача сводится к их оценке: . Например, это реализовано в полиномиальной лаговой структуре Ш. Алмон (1965 г.).

Полиномиальная лаговая структура Алмон

Аппроксимируем зависимость β от лага l многочленом невысокой степени M (M <= 3):

,

или

(17)

Подставляя (17) в (15) и приводя подобные, получим

Переменные уже не мультиколлинеарны, и МНК идет без проблем. Подбор L осуществляется исходя из длины имеющихся временных рядов эмпирически.

Пример: по данным

xt

10

18

18

16

18

20

24

24

20

21

22

25

27

27

30

28

32

32

30

yt

28

30

31

32

33

32

33

34

36

37

38

40

41

41

оценить параметры модели (15) с L = 5 при структуре Алмон с M = 3.

Переобозначая , имеем модель множественной регрессии

(18)

Матрица плана , .

МНК-оценка вектора коэффициентов :

.

Подставляя это в (17), находим искомые оценки коэффициентов модели (15):

и

.

Коэффициент детерминации:

. R2 = 0.9931.

Кстати, можно найти и так: .

Дисперсионный анализ нужно проводить на основе модели (18):

H0: a1 = a2 = … = aM+1 = 0, (a0 не равно 0),

H1: это не так.

, SL = 1.03*10-9 – высокая значимость данных против H0, то есть оцененная модель в целом значима.

Прогноз по модели. Пусть известно новое значение независимой переменной x20 = 24. Очевидно, прогноз соответствующего значения зависимой переменной находится по формуле

. .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]