Лекція 4
.docxЛекція 4
Множинна лінійна регресія
Теоретичне та емпіричне лінійні рівняння
Відхилення в матричній формі
Оператор оцінювання класичного МНК
Дисперсійно-коваріаційна матриця параметрів регресії
Множинна кореляція та детермінація
Тест Фішера (на адекватність моделі)
Перевірка гіпотез щодо параметрів багатофакторної регресії
Довірчі інтервали
Множинна лінійна регресія
Як правило, декілька причин є впливовими на будь-який чинник (економічний показник).
Замість парної регресії розглядається множинна
Найбільш вживана і досить проста модель множинної лінійної регресії.
Теоретичне лінійне рівняння регресії
Для індивідуальних спостережень числом n (i = 1, 2, …, n)
j-m теоретичн. коеф. регресії: характеризує чутливість Y до зміни X; або відображає вплив на умови математичного сподівання залежн. зм. Y пояснювальної зм. Хj при сталості всіх інших.
оцінювання , для яких має місце найкраще наближення при спостереженнях; часткові коефіцієнти регресії
число ступенів вільності. Вважається: при оцінюванні множинною лінійною регресією для забезпечення статистичної надійності вимагається, що число спостережень щонайменше в 3 р. перевищувало число оцінюваних параметрів.
Емпіричне рівняння регресії записується
,
оцінки для ; .
Для індивідуальних значень
За даними вибірки об’єму n треба оцінити значення параметрів (параметризація моделі).
Відхилення
Скористаємося матричними позначеннями:
n – вимірний стовпець (вектор) спостережень;
Матриця n * (m+1) вимірності спостережень, i-й рядок якої відповідає спостереженням вектора значень незалеж. зм. ;
Зауваження!
вектор-стовпець коефіцієнтів рівняння регресії
вектор-стовпець відхилень реальних значень yi залежної зм. Y від модельних, отриманих по рівнянню регресії.
Економетрична матрична модель записується
В матричній формі похибка записується , її квадрат має вигляд .
Результатом процедури МНК у матричній формі буде вираз
,
який називається оператором оцінювання 1 МНК, ним визначаються емпіричні коефіцієнти множинної лінійної регресії.
Зауваження. Якщо незалежні змінні в матриці Х взяти як відхилення кожного значення від свого середнього, то величина ( ) назив. матрицею моментів. Елементи її головної діагоналі є величини дисперсії незалежних змінних, інші елементи відповідають взаємним коваріаціям.
В матричній формі похибка записується утворимо квадрат похибки
,
де індекс Т – транспонування; матричні співвідношення:
відомі.
Умова існування extr:
Якщо незалежні змінні в матриці Х взяті як відхилення кожного значення від свого середнього, то матрицю назив. матрицю моментів.
Структура матриці моментів відбивав зв’язки між незалеж. змінними.
Зауваження. Вираз назив. оператором оцінювання 1 МНК, тобто ним визначаються емпіричні коеф. множинної лінійної регресії.
Дисперсійно-коваріаційна матриця параметрів регресії (оцінок параметрів моделі) записується
На головній діагоналі матриці містяться оцінки дисперсії параметрів, інші її елементи відображають оцінки коваріації між bj та bk параметрами.
Має місце
,
де дисперсія ВВ її формули
Нехай Cjk елемент матриці , на перетині j-го рядка і k-го стовпця. Тоді елементи головної діагоналі дисперсійної матриці обчислюються як , інші її елементи як .
Стандартні помилки оцінок параметрів моделі є
У випадку лінійної регресії коефіцієнт детермінації дорівнює квадратної вибіркового коефіцієнта кореляції між двома рядами спостережень – експериментальними значеннями регресанда (yi) і його розрахункового .
.
Враховано, що класич. регрес. моделі .
Мірою ступеня відповідності модельних даних фактичним (і- 1, 1,… n) є коефіцієнт множинної кореляції
R= Для класичної регресійної моделі
Його квадрат є коефіцієнтом множинної детермінації
<≡
Як у випадку простої лінійної регресії: SST=SSE+SSR<=>
=1= ≡
При зростанні кількості факторів також ↑ і ніколи не зменшується.
Розглядається оцінений коефіцієнт детермінації
(скориговані на їхні ступені вільності)
Суми квадратів у чисельнику та знаменнику діляться на відповідні ступені вільності, в яких ураховується число факторів моделі
Має місце формула (k>1; ).
Якщо кількість факторів ↑, то оцінений коефіцієнт детермінації ↑ повільніше, ніж . Цим користуються при порівнянні різних регресійних моделей.
Перевірка моделі на адекватність за F-критерієм Фішера
Нульова гіпотеза Н₀: =0 (j=1…m) <=> H₀:
Проти альтернативної Н₁: хоча б одне =0
Для перевірки Н₀ гіпотези розраховується F-статистика Фішера з m та
(n-m-1) ступенями вільності
, де -число факторів; - число спостережень.
За F-таблицями Фішера шукається критичне значення з та α-рівнем помилки (або (1-α)100% рівнем довіри).
Якщо F > , то нуль-гіпотеза відкидається; модель адекватна. У протилежному випадку нульова гіпотеза приймається, модель неадекватна.
F-тест, який є мірою адекватності регресійної моделі, також виступає мірою статистичної значущості коефіцієнта детермінації.
Зауваження! F-відношення Фішера (статистика) розраховується на підставі формули:
F= , k=m+1
За F-таблицями Фішера шукається (k-1; n-k; α- рівень помилки)
Якщо F > (k-1; n-k; α), тоді Н відкидається; у протилежному випадку приймається. Таким чином, тестування на адекватність моделі за допомогою тільки коефіцієнтів детермінації.
Перевірка гіпотез щодо параметрів багатофакторної регресії у матричному вигляді
Кожний параметр відповідає В~Ɲ [β, нормальний закон розподілу, де β- матем. сподівання=параметру узагальненої регр.моделі
Заміна справжнього значення дисперсії ВВ на його оцінку приводить до того, що Ʉ елемент вектора В відповідає t-розподілу Стьюдента з (n-k) ступенями вільності.
Задаємось α*100% рівнем значимості; для кожного параметра окремо будується t-статистика
t = з (n-k) ступенями вільності, де - оцінка параметра ; - гіпотетичне значення, яке має прийняти ; - оцінка дисперсії параметра (з регресії); n- кількість спостережень; k- загальна кількість оцінених параметрів.
В економетриці поширеною формулою нуль-гіпотези є така:
Н₀: = 0.
t-статистика є = її значення порівнюються з табличним, яке дає змогу знайти критичну зону з (n-k) ступенями вільності.
Якщо потрапляє не у критичну зону, то з ймовірністю (1-α) 100% оцінка є статистично незначима (Н₀ приймається)
В протилежному випадку – Н₀ відкидається.
Зауваження! = є відношення до оцінки свого стандартного відхилення (середнього квадратичного).
Після перевірки адекватності моделі та значимості знайдених параметрів за t-критерієм Стьюдента виконуються прогнози, будуються інтервали довіри, вивчається вплив окремих факторів на залежний чинник.
По аналогії з процедурою тестування нуль-гіпотези для параметрів за t-тестом Стьюдента інтервали довіри записуються
= ± .
Побудова довірчих інтервалів: для математичного сподівання залежної змінної з рівнем довіри (1-α) 100% здійснюється за формулою
Або в матричній формі
<= M (Y│X₀) <= ,
Де = Х₀В розглядається як точкова оцінка математичного сподівання прогнозного значення Y₀, а також як індивідуальне значення Y₀ для вектора незалежної мінної Х₀, що лежить за межами базового періоду.
Для індивідуального значення залежної змінної
<= Y₀<= ;
В координатній формі
.