Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
фиктивные переменные1.docx
Скачиваний:
15
Добавлен:
15.08.2019
Размер:
502.1 Кб
Скачать

Два временных тренда

Когда представлены два временных тренда, то фиктивная переменная должна быть выбрана для каждого из них. Эта задача может иметь два уровня сложности в зависимости от того, известно ли, какому тренду принадлежат данные, или же это не из­вестно.

1. Когда известно, какие точки принадлежат каким трендам. Пусть, например, есть два временных тренда, причем оба линейные. Тогда мы можем выделить в этой ситуации еще два подкласса:

  • когда об абсциссе точки пересечения двух линий можно предположить, что она соответствует определенному значению, в котором есть одно или несколько наблюдений;

  • когда абсцисса точки пересечения этих двух линий не известна.

В качестве иллюстрации первого случая рассмотрим следующий пример. Известно, что первые пять точек лежат (если пренебречь случайной ошибкой) на первой прямой, а последние пять точек (опять же если пренебречь случайной ошиб­кой) - на второй. Значит, пятая точка в этом случае оказывается общей для обеих прямых.

Рисунок 1 - Использование фиктивных переменных. Две линии, абсцисса точки пересечения известна

Мы можем ввести две фиктивные перемен­ные t1 и t2 для этих двух прямых следующим образом. Положим обе фиктивные переменные равными нулю в известной точке пересече­ния, а именно в точке пятого наблюдения, из которой t1 для первой прямой пойдет назад, а t2 для второй прямой - вперед, причем каждая переменная будет обращаться в нуль там, где действует другая. Получаем следующую таблицу с данными:

Таблица 1 - Фиктивные переменные для примера с двумя прямыми, абсцисса точки, пересечения которых известна

Дата

yt

t1

t2

Альтернативное представление

t1

t2

1996г.

2,3

-4

0

1

0

1997г.

3,8

-3

0

2

0

1998г.

6,5

-2

0

3

0

1999г.

7,4

-1

0

4

0

2000г.

10,2

0

0

5

0

2001г.

10,5

0

1

5

1

2002г.

12,1

0

2

5

2

2003г.

13,2

0

3

5

3

2004г.

13,6

0

4

5

4

Модель в данном случае имеет вид:

Полученные оценки имеют следующую интерпритацию:

а0 - значение y в точке пересечения, t1 = t2 = 0;

а1 - угловой коэффициент прямой первого тренда;

а2 - угловой коэффициент прямой второго тренда.

Предложенное представ­ление фиктивных переменных не единственно. Пример альтернативного представления пока­зан в таблице 1, где (t новая) = (t1 старая)+5. Это представле­ние даст точно такие же оценки угловых коэффициентов, что и преды­дущее, но зато постоянный член a0, соответствующий значению y, когда t1 = t2 = 0, стал бы теперь свободным членом первого урав­нения.

Рассмотрим пример относящийся ко второму ва­рианту. Здесь из­вестно, что первые че­тыре точки лежат (если пренебречь случайной ошибкой) на первой пря­мой, а последние пять (снова без учета случай­ной ошибки) - на вто­рой.

Рисунок 2 - Использование фиктивных перемен­ных. Две линии, абсцисса точки пересечения не известна

Однако точка их пересечения не известна. Чтобы обнаружить эту неизвестную точку, по­надобится третья фик­тивная переменная t3. Ее естественно поло­жить равной нулю для всех точек первой прямой и соответственно единице для точек второй прямой, чтобы отразить скачок (положи­тельный или отрицательный) от первой прямой ко второй. Фиктив­ные переменные t1 и t2 выбираются точно так же, как это сделано в предыдущем примере.

Таблица 2 - Фиктивные переменные для примера с двумя прямыми, точка пересечения которых не известна

Дата

yt

t1

t2

t3

1996г.

1,8

1

0

0

1997г.

4,3

2

0

0

1998г.

5,6

3

0

0

1999г.

8,2

4

0

0

2000г.

9,1

5

0

1

2001г.

10,7

5

1

1

2002г.

11,5

5

2

1

2003г.

12,5

5

3

1

2004г.

14,0

5

4

1

В итоге имеем следующую модель:

Параметр а3 представляет собой шаг изменения, приводящий к эф­фекту наблюдения в пятой точке. Фактически это вертикальное рас­стояние, на котором в этой точке вторая прямая проходит выше пер­вой. (Если вторая прямая лежит ниже первой, то коэффициент а3 будет отрицательным.)

2. Когда не известно, какие точки относятся к какому тренду. В случае когда не известны точки пересечения прямых ре­шение следовало бы получать, просматривая все возможные варианты разбиения точек между двумя прямыми, оценивая в каждом таком разбиении параметры линейным методом наименьших квадратов и вычисляя остаточные суммы квадратов. А затем можно выбрать та­кое разбиение вместе с набором оценок параметров, которое порож­дает наименьшее из всех значение остаточной суммы квадратов. (На практике обычно нет никакой необходимости просматривать каж­дое возможное разбиение точек, поскольку даже малые вычисления обычно показывают ту «танцплощадку», где и находится наилучшее разбиение. Только этот ограниченный набор разбиений и надо сосчи­тать.) С другой стороны, эту задачу можно представить как задачу нелинейного оценивания.