Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
учеба / Ekonomiko-matematichn__metodi_ta_model__Ekono.pdf
Скачиваний:
41
Добавлен:
04.03.2016
Размер:
720.07 Кб
Скачать

Модуль 2. Економетрика

Змістовий модуль 2. Різні аспекти економетричного моделювання

Тема 4. Фіктивні змінні в економетричних моделях

Мета : ознайомити студентів з особливостями використання фіктивних

змінних при моделюванні процесів з сезонною складовою, визначення

параметрів, точкової та інтервальної оцінок прогнозу.

План вивчення теми

1.Випадки використання фіктивних змінних в моделюванні.

2.Моделювання динамічного ряду з сезонними коливаннями.

3.Використання фіктивних змінних для регресій з однаковим нахилом та різним перетином.

4.Побудова моделей з фіктивними змінними у випадку різних нахилів.

5.Урахування в моделях різних нахилів та перетинів.

Методичні рекомендації до самостійної роботи

 

 

Використання фіктивних змінних

 

 

 

Одним

із

методів моделювання динамічного

ряду

з

сезонними

коливаннями

є

побудова моделі регресії з фактором

часу

та

фіктивними

змінними. Кількість фіктивних змінних в такій моделі має бути на одиницю менше кількості періодів часу в середині одного циклу коливань. Наприклад,

при моделюванні поквартальних даних модель повинна включати чотири незалежні змінні: фактор часу і три фіктивні змінні. Кожна фіктивна змінна відображає сезонну (циклічну) компоненту динамічного ряду для будь-якого одного періоду. Вона дорівнює одиниці для даного періоду і нулю для всіх інших періодів.

Розглянемо динамічний ряд з циклічними коливаннями періодичностіk .

Модель регресії з фіктивними змінними для цього ряду має вигляд:

 

уt = a + bt + c1x1 + . . . + ck -1xk -1 + et ,

(39)

39

a + c3 ; a .

де x j = 1 для кожного j в середині кожного циклу, x j = 0 в інших

випадках.

Наприклад, при моделюванні сезонних коливань на основі поквартальних даних за декілька років кількість кварталів в серединіодного року k=4, і

відповідно загальний вигляд моделі наступний:

уt = a + bt + c1x1 + c2 x2 + c3 x3 + et ,

де , x1 = 1 для 1-го кварталу та 0 для всіх інших, x2 = 1 для 2-го кварталу та 0 для всіх інших, x3 = 1 для 3-го кварталу та 0 для всіх інших.

Рівняння тренду для кожного кварталу має вигляд:

для 1-го кварталу: уt = a + bt + c1 + et ;

для 2-го кварталу: уt = a + bt + c2 + et ;

для 3-го кварталу: уt = a +bt + c2 +et ;

для 4-го кварталу: уt = a + bt + et .

Таким чином, фіктивні змінні дозволяють диференціювати величину вільного члена рівняння регресії для кожного кварталу. Вона складає:

для 1-го кварталу: a + c1 ;

для 2-го кварталу: a + c2 ;

для 3-го кварталу:

для 4-го кварталу:

Параметр b у цій моделі характеризує середню абсолютну зміну рівнів ряду під впливом тенденції. По суті, ця модель є аналогом адитивної моделі часового ряду : фактичний рівень часового ряду– це сума трендової, сезонної та випадкової компонент.

Для такої моделі з n факторами ( один фактор часу таn-1 фіктивна змінна) застосовують такий саме спосіб побудови, як для будь-якої багатофакторної регресійної моделі.

40

У розглянутому випадку сезонності можна виділити , регресіїякі розрізняються перетином і не відрізняються нахилом. Аналогічно можна ввести фіктивні змінні для виокремлення регресій, які відрізняються нахилом.

Якщо в практичній задачі не чітко зрозуміло, чи регресії, побудовані на одних і тих самих даних, відрізняються нахилом або перетином, то можна вводити фіктивні змінні для взаємодії факторів, що відповідає їх добутку.

Завдання для самостійного виконання

Фактичні удої молока(кг) від однієї корови на сільськогосподарських

підприємствах за 2005-2010 р. наведені в таблиці:

Рік

Квартал У

 

Рік

 

Квартал У

Рік

Квартал У

 

2005

1

640

 

2007

 

1

612

2009

1

727

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1082

 

 

 

2

1060

 

2

1202

 

 

3

1315

 

 

 

3

1305

 

3

1388

 

 

4

924

 

 

 

4

908

 

4

984

 

 

 

 

 

 

 

 

 

 

 

 

 

2006

1

668

 

2008

 

1

704

2010

1

752

 

 

2

1126

 

 

 

2

1182

 

2

1240

 

 

3

1380

 

 

 

3

1430

 

3

1425

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

945

 

 

 

4

920

 

4

1018

 

 

 

 

 

 

 

 

 

 

 

 

 

Перевірити

гіпотезу

про

наявність

сезонності. Побудувати модель

залежності удоїв від фактору часу без урахування сезонності (однофакторну) та

з урахуванням сезонності (багатофакторну з фіктивними змінними).

Оцінити параметри та їх значимість, якість регресії. Знайти прогноз для У за обома моделями для 3-го кварталу 2011 року.

Питання для самоконтролю

1.Наведіть приклади використання фіктивних змінних в моделюванні.

2.Як моделюється динамічний ряд з сезонними коливаннями?

3.Використання фіктивних змінних для регресій з урахуванням однакового нахилу та різних перетинів.

4.Побудова моделей з фіктивними змінними у випадку різних нахилів.

Література

[1-9]

41

Модуль 2. Економетрика Змістовий модуль 2. Різні аспекти економетричного моделювання

 

Тема 5. Узагальнені економетричні моделі

 

Мета :

ознайомити студентів з поняттям гетероскедастичності,

її

наслідками,

методами усунення та оцінкою параметрів регресії

з її

урахуванням.

 

 

План вивчення теми

1.Поняття гомо- і гетероскедастичності.

2.Вплив гетероскедастичності на властивості оцінок.

3.Узагальнений метод найменших квадратів для оцінки параметрів моделі з гетероскедастичними залишками.

4.Прогноз з урахуванням гетероскедастичності.

Методичні рекомендації до самостійної роботи

Класична регресійна модель задовольняє всім умовам Гауса-Маркова.

Зокрема, друга умова s 2 = const означає, що дисперсія випадкового члена

повинна бути постійною для всіх спостережень. Перші дві умови вказують, що випадкові збурення ei , i = 1...n , з’являються на основі імовірних розподілів, що мають нульове математичне сподівання і ту саму дисперсію. Тобто імовірність

того, що випадкове збурення прийме визначене значення, буде однакова для всіх спостережень. Ця умова відома якгетероскедастичність, що означає

"однаковий розкид". Якщо дисперсія імовірного розподілу випадкового члена різна для різних спостережень, то буде мати місцегетероскедастичність, що означає "неоднаковий розкид". При стандартному методі оцінки параметрів регресії стають неефективними і зсуненими. При цьому перевірка значущості параметрів регресії і довірчі інтервали для значень теоретичної регресії на базисних даних стають некоректними.

42

Появу

 

проблеми

гетероскедастичності

часто

можна

передбачити

заздалегідь,

ґрунтуючись

на

 

значеннях

.

данихДопущення

про

гомоскедастичність виправдане, якщо

об’єкти, що

спостерігаються досить

однорідні, наприклад, при

дослідженні

однотипних

підприємств. Якщо

ж

досліджуються

неоднорідні

об’єкти, то, як правило,

виникає

проблема

гетероскедастичності.

 

 

 

 

 

 

 

 

 

Отже, гетероскедастичність стає проблемою, коли значення змінних у

рівнянні

регресії

значно

відрізняються

 

в

різних

спостереж.

Гетероскедастичність може бути усунена, якщо ліквідувати розкид у даних.

 

 

 

 

Виявлення гетероскедастичності

 

 

 

Одним

з

тестів

на

виявлення

гетероскедастичностітестє

рангової

кореляції Спірмена.

Припускається, що дисперсія випадкового члену буде або збільшуватися,

або зменшуватися при збільшенні , Хі тому в регресії, яка оцінюється за допомогою МНК. абсолютні значення залишківе та значенняХ будуть корельовані. Дані по Х та абсолютні значення залишківе упорядковуються, і

коефіцієнти рангової кореляції визначаються так:

n

 

r

= 1 -

6åDi2

,

 

 

(40)

 

i =1

 

 

 

 

 

 

 

Хе

 

n(n2 -1)

 

 

 

 

 

 

 

 

 

 

 

де Di

– різниця між рангом Х та рангом е в спостереженні і.

Якщо припустити, що відповідний коефіцієнт кореляції для генеральної

сукупності дорівнює нулю, то коефіцієнт рангової кореляції має нормальний

розподіл

з математичним

сподіванням0 та дисперсією 1/(n-1) у великих

вибірках. Відповідна тестова статистика дорівнює rХе

 

 

, і при використанні

 

n -1

двостороннього критерію

нульова

гіпотеза

про

гомоскедастичність буде

відхилена при рівні значимості 5%, якщо її абсолютна величина буде більшою за 1,96, та при рівні значимості 1%, якщо її абсолютна величина буде більшою за 2,58.

43

Узагальнений метод найменших квадратів для моделі з

гетероскедастичними залишками

(метод зважених найменших квадратів)

Нехай

множинна

регресія виглядає

наступним

чином i для-го

спостереження:

 

 

 

 

yi = a0 + a1x1i

+ a2 x2i + ... + a p xpi + ei , i = 1,..., n .

(41)

При наявності гетероскедастичності в кожнім спостереженні випадкове

відхилення має різну, але постійну, дисперсію: sei

= si = const.

 

Тому

через розходження дисперсій різні

доданкив сумі åei2 будуть

давати різний внесок у значення цієї ,сумищо в остаточному підсумку

приводить до неефективності

 

МНК-оцінок. Ця неоднорідність може бути

усунена , якщо "зважити" кожне

спостереження

 

за

допомогою

коефіцієнта

1/ si :

 

 

 

 

 

 

 

 

 

 

 

 

 

æ e

ö2

æ y

i

- a

- a x

-... - a

p

x

 

ö2

 

ç

 

i ÷

ç

 

0

1 1i

 

 

pi ÷

 

åç

 

 

÷

= åç

 

 

 

 

 

 

 

 

÷ .

(42)

 

 

 

 

 

si

 

 

 

 

èsi ø

è

 

 

 

 

 

 

 

ø

 

Теоретична дисперсія випадкового члена i в-му спостереженні стає рівною одиниці. Отже, модель

y

i

 

 

a

0

 

x

 

 

 

xpi

 

 

e

i

 

 

 

 

=

 

 

+ a

1i

+ ... + a

 

 

 

+

 

 

,

i = 1,..., n

(43)

s

 

 

 

 

 

p s

 

s

 

i

 

s

i

1 s

s

 

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

стає гомоскедастичною, і проблема гетероскедастичності усунута.

На практиці числаsi , як правило, невідомі, і , оскільки число цих параметрів дорівнює n , то без додаткових обмежень немає надії одержати прийнятні оцінки дисперсії. Існує декілька способів для постановки додаткових обмежень, які накладаються із аналізу даних. В залежності від обмежень,

використовують різні тести на гетероскедастичність: Тостера-Стюарта,

Голфреда-Кванта, Глейзера. З цими підходами можна ознайомитися у рекомендованій літературі.

44

Завдання для самостійної роботи

Дані наведено в таблиці:

Країна

ВВП

Продукція

Країна

ВВП

Продукція

промисловості

промисловості

 

 

 

 

Бельгія

232006

44517

Малайзія

72505

18874

 

 

 

 

 

 

Канада

547203

112617

Мексика

420788

55073

 

 

 

 

 

 

Чилі

50919

13096

Нідерланди

334286

48595

 

 

 

 

 

 

Данія

151266

25927

Норвегія

122926

13484

 

 

 

 

 

 

Фінляндія

97624

21581

Португалія

87352

17025

 

 

 

 

 

 

Франція

1330998

256316

Сінгапур

71039

20648

 

 

 

 

 

 

Греція

98861

9392

Словакія

13746

2720

 

 

 

 

 

 

Гонконг

130823

11758

Словенія

14386

4520

 

 

 

 

 

 

Угорщина

41506

7227

Іспанія

483652

80104

 

 

 

 

 

 

Ірландія

52662

17572

Швеція

198432

34806

 

 

 

 

 

 

Ізраїль

74121

11349

Швейцарія

261388

57503

 

 

 

 

 

 

Італія

1016286

145013

Сирія

44753

3317

 

 

 

 

 

 

Южна Корея

380820

161318

Турція

135961

31115

 

 

 

 

 

 

Кувейт

24848

2797

Велика Британія

1024609

244397

 

 

 

 

 

 

Перевірити

наявність

гетероскедастичності. Побудувати

модель

залежності випуску

продукції

промисловості від валового

внутрішнього

продукту

 

 

 

Якщо гетероскедастичність існує, то переоцінити параметри методом

зважених найменших квадратів. У випадку гомоскедастичності

оцінити

параметри регресії звичайним МНК.

 

 

Питання для самоконтролю

1.Що означають поняття "гомоскедастичність" та "гетероскедастичність"?

2.Чим характеризується вплив "гетероскедастичності" на оцінки параметрів регресії?

3.Якими способами можна позбутися гетероскедастичності?

4.В чому полягає метод зважених найменших квадратів?

45

5.Які властивості оцінок параметрів методу зважених найменших квадратів у порівнянні зі звичайним МНК?

Література

[1–9]

46

Соседние файлы в папке учеба