
- •1. Прості лінійні регресійні моделі
- •2. Оцінка тісноти та значимості зв’язку між змінними моделі
- •3. Оцінка точності моделі
- •4. Перевірка значущості та довірчі інтервали
- •4.1. Перевірка значущості коефіцієнта детермінації
- •4.2. Перевірка значущості коефіцієнта кореляції
- •4.3. Оцінка статистичної значущості параметрів моделі
- •5. Прогнозування за лінійною моделлю
- •Контрольні запитання
3. Оцінка точності моделі
Визначаємо стандартні похибки оцінок параметрів моделі з урахуванням дисперсії залишків:
(8)
де
– дисперсія
залишків:
(9)
– елемент
матриці похибок С
(матриця, обернена до матриці
коефіцієнтів системи нормальних
рівнянь);
т1 – кількість параметрів моделі.
В залежності від значення стандартної похибки робиться висновок про ступінь незміщеності оцінок параметрів.
Коли стандартні помилки параметрів
не перевищують абсолютні значення цих
параметрів, то це може означати, що
оцінки параметрів є незміщеними відносно
їх істотних значень. Параметри можуть
мати зміщення, яке обумовлене невеликою
сукупністю спостережень.
Порівнюються стандартні похибки оцінки
з величиною оцінки:
.
Якщо ці величини є невеликими (менше
10%) – це характеризує модель з хорошої
сторони.
Визначається також середньоквадратичне відхилення (похибка)
(10)
Якщо Syx= 0,55 свідчить про те, що фактичні значення Y відхиляються від розрахункових його значень на 0,55 тис.грн./чол.
Теорія похибок рекомендує при кількості вибірок меншої від 25–30 у знаменнику підкорінної дробі використовувати (n-1) замість n.
Відносна похибка
(11)
Величина відносної похибки теоретично в економічних розрахунках повинна складати не більше 6%.
4. Перевірка значущості та довірчі інтервали
Розглянуті показники якості моделі побудовані за даними спостережень, тобто є деякими вибірковими характеристиками генеральної сукупності.
З математичної статистики відомо, що будь-яка статистика має бути перевірена на значущість. За допомогою спеціальних критеріїв необхідно встановити, чи зумовлено значення цієї функції лише похибками вимірювання, чи вона відображає якусь суттєву інформацію.
Неперевірений статистичний результат є лише деякою гіпотезою, яка може бути прийнята чи відхилена.
Стосовно кожного статистичного результату висувається так звана нульова гіпотеза (про рівність нулю деякої випадкової величини) і альтернативна до неї гіпотеза (про її суттєву відмінність від нуля).
У нульовій гіпотезі формулюють результат, який бажано відхилити, а в альтернативній, яка інакше називається експериментальною, – той, що його необхідно підтвердити.
4.1. Перевірка значущості коефіцієнта детермінації
Для перевірки статистичної значущості коефіцієнта детермінації R2 висувається нульова гіпотеза H0: R2=0. Це означає, що досліджуване рівняння не пояснює змінювання залежної змінної (Y) під впливом відповідних незалежних змінних. У такому разі всі коефіцієнти при незалежних змінних мають дорівнювати нулю. При цьому нульову гіпотезу можна подати у вигляді
H0 : 1 = 2 = ... = n = 0.
Альтернативною до неї є НА: значення хоча б одного параметра моделі відмінне від нуля (j ≠ 0), тобто хоча б один із факторів впливає на змінювання залежної змінної.
Для перевірки цих гіпотез застосовують F-критерій Фішера з m і n–m–1 ступенями свободи. За отриманими в моделі значеннями коефіцієнта детермінації R2 обчислюють експериментальне значення F-статистики:
(12)
яке порівнюють з табличним значенням розподілу Фішера при заданому рівні значущості a (як правило, a = 0,05 або a = 0,01). Якщо Fексп > Fтабл нульова гіпотеза відхиляється, тобто існує такий коефіцієнт у регресійному рівнянні, який суттєво відрізняється від нуля, а відповідний фактор виливає на досліджувану змінну. Відхилення нуль-гіпотези свідчить про адекватність побудованої моделі. У протилежному випадку модель вважається неадекватною.