Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Звіт по роботі.doc
Скачиваний:
2
Добавлен:
13.09.2019
Размер:
193.54 Кб
Скачать

Дослідження мультиколінеарності

Мультиколінеарність – лінійна залежність або кореляція між двома і більше незалежними змінними. Тестування моделі на наявність мультиколінеарності проводимо за алгоритмом Феррара-Глобера.

Спочатку для кожного фактора моделі обчислюємо середнє арифметичне і дисперсію. Потім будуємо нову матрицю Х* – матрицю, елементами якої нормалізовані незалежні змінні х*ij та обчислюємо кореляційну матрицю (матрицю моментів нормалізованої системи нормальних рівнянь).

Рахуємо визначник кореляційної матриці R: = 0,000203597.

Визначаємо критерій χ2 = 157,2382937, χ2t = 41,33713813.

χ2 > χ2t → наявність мультиколінеарності в сукупності факторів

Визначаємо матрицю С – помилок і розраховуємо F – критерії. Порівнявши критерії F з табличним, бачимо, що лише Х4 не мультиколінеарний з іншими факторами.

Знаходимо часткові коефіцієнти кореляції rij, які характеризують тісноту зв’язку між двома змінними xi та xj за умови, що всі інші змінні не впливають на цей зв’язок.

Розраховуємо t – критерії і порівнюємо їх з табличним. Таким чином, ми встановили, що мультиколінеарність існує між такими парами незалежних змінних: 1 і 3 (обсяг реалізованої промислової продукції та вантажооборот), 1 і 4 (обсяг реалізованої промислової продукції та пасажирооборот), 5 і 6 (експорт та імпорт товарів та послуг), 2 і 7 (обсяг продукції сільського господарства та оборот роздрібної торгівлі), 1 і 8 (обсяг реалізованої промислової продукції та середньомісячна зарплата).

Так як між незалежними змінними існує мультиколінеарність, то не обхідно вирішувати питання про її вилучення. Для цього вводимо нові змінні: z = x3 + x4 та z’ = x7 – x2 та виключаємо фактор х1. Знову тестуємо нові дані на наявність мультиколінеарності за алгоритмом Феррара-Глобера. Бачимо, що ми ще не позбавились мультиколінеарності, тому оцінку параметрів моделі слід отримувати за допомогою іншого методу, наприклад, методу головних компонентів.

Аналіз багатофакторної регресійної моделі

Продовжимо дослідження отриманої моделі, а саме знайдемо МНК-оцінки параметрів, користуючись покроковим алгоритмом побудови та дослідження множинної регресійної моделі.

1. Запишемо рівняння регресії у вигляді: У = β0 + β1x1 + β2х2 + β3х3 + β4х4 + β5х5 + β6х6 + β7х7 + β8х8 + u. Матричним методом розв’яжемо отриману систему і знайдемо шукані оцінки параметрів моделі.

2. Запишемо шукану функцію регресії з урахуванням знайдених оцінок коефіцієнтів моделі:

= 103,6372474 - 6,74959E-05·х1 - 6,78062E-06·х2 + 3,61719E-05·х3 - 0,000389095·х4 + 3,33047E-05·х5 + 0,000128347·х6 + 1,58679E-05·х7 + 0,00171964·х8

Отже, ми побудували загальну лінійну модель залежності індексу споживчих цін від восьми факторів. Наступним кроком наших досліджень є проведення дисперсійно-кореляційного аналізу та аналізу залишків.

3. Середнє значення відносної похибки становить 0 %, отже, це означає, що дані розраховані з високою точністю.

4. Залишкова середньоквадратична помилка дисперсії збурювань становить S = 0,845924435. Чим вона більша, тим гірше підібрана функція регресії відповідає дослідним даним.

5. Так як коефіцієнт детермінації досить малий (R2 = 0,494250693), то варіація залежної змінної Y на 49,4% визначається варіацією незалежних змінних.

6. Коефіцієнт кореляції досить великий (R = 0,703029653), тому існує тісний лінійний зв’язок усіх незалежних факторів із залежною змінною.

7. Так як tR > tt (3,7 > 2,5), то можна зробити висновок про достовірність коефіцієнта кореляції.

Інтервал, в який потрапляє дійсне значення кореляції з високою ступінню ймовірності 0,95, становить (R-∆R; R+∆R)=(0,5476; 0,8584). І ми можемо зробити висновок, що існує тісний лінійний зв’язок між показником і факторами.

8. Так як F < Ft (1,71 < 2,7), то модель неадекватна.

9. Обчислимо t–статистику і значення tj–критерію порівняємо з табличним: tt = 2,509569405. Так як лише > tt , то відповідно оцінка b0 є значущою, а всі інші не значущі.

10. Так як усі δbj більші, ніж 20%, то усі оцінки зміщені.

11. Обчисливши значення граничного вкладу кожного регресора в коефіцієнт детермінації, було виявлено, що якщо 4-ий фактор (пасажирооборот) буде виключений із рівняння, то частковий коефіцієнт детермінації зменшиться найбільше (на 0,148129433).

12. Загальна еластичність від усіх факторів дорівнює α = -0,0305. Вона показує, що на 0,03% зменшиться індекс споживчих цін, якщо одночасно збільшити на один відсоток всі фактори.