
- •Лекція 6. Особливі випадки в багатофакторному регресійному аналізі.
- •1. Основні критерії перевірки адекватності моделій
- •2. Неадкватність моделі. Приклади й наслідки Приклад. Розглянемо статистичні дані по сша за період з 1959 по 1985 р. Г. Про наступні макроекономічні показники:
- •3. Корекція статистичних висновків при наявності гетероскедастичності
- •4. Мультіколінеарність та ії наслідки.
- •Приклад побудови регресійного рівняння
3. Корекція статистичних висновків при наявності гетероскедастичності
Приклад. Для дослідження питання про залежність кількості керівників від розміру підприємства були зібрані статистичні дані по 27 промислових підприємствах. Далі позначено:
— чисельність персоналу на i-м підприємстві,
— кількість керівників на i-м підприємстві.
Оцінюємо лінійну модель спостережень
Регресійний аналіз дає наступні результати: R2= і
Variable |
Coefficient |
Std. Error |
t-Statistic |
P-value. |
1 |
14.448 |
9.562 |
1.511 |
0.1433 |
X |
0.105 |
0.011 |
9.303 |
0.0000 |
Наступні два графіки демонструють діаграму розсіювання з підібраній прямій (лівий графік) і залежність стандартизованих залишків від значень (правий графік).
/ /
Схоже, що має місце тенденція лінійного зростання абсолютних величин залишків з ростом , що відповідає наявності наближеної залежності виду для дисперсій помилок. Щоб погасити таку неоднорідність дисперсій, розділимо обидві частини співвідношення на :
т. е. перейдемо до моделі спостережень
де
Якщо дійсно виконується співвідношення , то тоді в перетвореній моделі
т. е. неоднорідність дисперсій помилок переборюється.
Результати оцінювання перетвореної моделі:
Variable |
Coefficient |
Std. Error |
t-Statistic |
P-value. |
1 |
0.121 |
0.009 |
13.445 |
0.0000 |
1/x |
3.803 |
4.570 |
0.832 |
0.4131 |
У вихідних змінних це відповідає моделі лінійного зв'язку
Відзначимо зменшення оцінених стандартних помилок оцінок обох параметрів і . Саме на ці значення варто опиратися при побудові довірчих інтервалів для цих параметрів. Середніми крапками цих інтервалів будуть, відповідно, і . Наступний графік показує характер залежності стандартизованих залишків у перетвореній моделі від .
Цього разу неоднорідності дисперсій залишків (принаймні явної) не виявляється.
Розглянемо уважніше наші дії при оцінюванні перетвореної моделі. Оцінки коефіцієнтів, наведені в останній таблиці, отримані застосуванням методу найменших квадратів до моделі спостережень тобто шляхом мінімізації суми квадратів
яку, згадуючи, що позначають змінні із зірочками, можна записати у вигляді
Позначаючи тепер
одержуємо, що задача мінімізації суми квадратів відхилень у перетвореній моделі рівносильна задачі мінімізації зваженої суми квадратів відхилень у вихідній (неперетвореної) моделі. Величина інтерпретується в цьому контексті як вага, приписувана квадрату відхилення в - м спостереженні. Ця вага буде тим менше, чим більше значення , що у силу наших припущень пропорційно дисперсії випадкової помилки в -м спостереженні. Отже, чим більше дисперсія випадкової помилки , тим менше вага, з яким входить квадрат відхилення в -м спостереженні в минимизируемую суму.
Маючи на увазі, що оцінювання перетвореної моделі спостережень зводиться до мінімізації суми
розглянутий метод оцінювання називають зваженим методом найменших квадратів (хоча точніше його варто було б називати методом найменших зважених квадратів).
Зауваження. У деяких руководствах по эконометрике й у деяких пакетах статистичного аналізу даних (наприклад, у пакеті EVIEWS) використовується трохи інше рівносильне подання минимизируемой суми квадратів у перетвореній моделі спостережень:
У цьому випадку вага приписується не квадрату відхилення, а самому відхиленню Зрозуміло, у розглянутому прикладі при такому визначенні ваги останній буде дорівнює
На цю обставину варто звернути увагу при специфікації ваг у процедурах, що реалізують зважений метод найменших квадратів.