Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метод_МСА_КП.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
6.64 Mб
Скачать

1.3 Розрахунок невідомих параметрів багатофакторної регресії за мнк

Нехай ми маємо ряд спостережень за залежною змінною та за незалежними змінними

y={y1, y2, ..., yn}; x1=={x11, x12, ..., x1n}; x2=={x21, x22, ..., x2n}; ...; xp=={xp1, xp2, ..., xpn};

На підставі цих спостережень побудуємо лінійну багатофакторну вибіркову модель

y=b0+b1x1+b2x2+...+bpxp+e (4.5)

Знайдемо невідомі параметри за МНК, тобто мінімізуючи суму квадратів відхилень фактичних даних від теоретичних (даних, які ми оторимали з регресійної моделі)

F(b0, b1, ..., bn)= (4.6)

Щоб знайти мінімум функції (4.6) необхідно прирівняти нулю часткові похідні функції за аргументами b0, b1, ..., bn і отримати систему нормальних рівнянь

Перетин розраховується аналогічно до простої регресії за допомогою середніх значень

b0=y-b1x1-...bpxp (4.7)

1.3.2 Коефіцієнт множинної кореляції та детермінації

Коефіцієнт множинної кореляції є мірою ступеня відповідності даних { , i=1,n}, отриманих з регресійної моделі, фактичним даним {yi, i=1,n} і визначається як коефіцієнт кореляції між у та y^

(4.12)

Квадрат коефіцієнта множинної кореляції, як і у випадку багатофакторної регресії називають коефіцієнтом детермінації і позначають через R2. Можна показати, що вигляд у випадку багатофакторної регресії ідентичний коефіцієнту детермінації простої лінійної регресії

=SSR/SST=1-SSE/SST=1- (4.13)

У цьому виразі знаменник не залежить від кількості факторів х, а чисельник при збільшенні факторів х спадає (або хоча б не зростає). Таким чином, якщо додати новий фактор у модель, то R2 зросте.

Якщо ми порівнюємо дві регресійні моделі з однаковою залежною змінною, але з різною кількістю факторів х, то перевагу віддаємо моделі з більшим значенням R2.

Для порівняння значень коефіцієнтів детермінації у різних моделях використовують оцінений коефіцієнт детермінації R2, у якому зменшено вплив кількості факторів на значення коефіцієнта

R2=1- (4.20)

де k– кількість параметрів регресійної моделі, включаючи перетин;

- оцінена дисперсія залишків;

S2y- вибіркова дисперсія незалежної змінної у.

На відміну від простого коефіцієнта детермінації оцінений коефіцієнт детермінації коригується з урахуванням ступенів вільності суми квадратів залишків та загальної суми квадратів. Як бачимо з (4.20), суми квадратів у чисельнику і знаменнику діляться на відповідні ступені вільності, в яких ураховано кількість факторів, що входять до моделі.

З (4.21) видно, що при k>1 R2<R2. Крім того, якщо зростає кількість факторів х, то R2 зростає повільніше, ніж R2, тобто зменшується вплив кількості факторів на величину коефіцієнта детермінації, тому на практиці частіше використовують R2, особливо при порівнянні різних регресійних моделей. На відміну від R2 R2 може бути й негативним. Коли R2 прямує до негативної величини, R2 прямує до нуля, а коли R2=1, то R2 теж R2 =1.

Розглянемо приклад. Маємо дві моделі

lnyi= b0+b1x1i+...+bpxpi+ei, (4.22)

yi= a0+a1x1i+...+apxpi+ei (4.23)

Розраховані коефіцієнти детермінації у цих моделях не можна порівняти між собою, тому що у (4.22) коефіцієнт детермінації вимірює частку дисперсії залежної змінної lny, яку можна пояснити факторами х1і, х2і, …, хрі, а у (4.23) вимірює частку дисперсії у. Зміна lny в у забезпечує відносну зміну у , а зміна в самому у є абсолютною зміною. Таким чином, величини var(y^i)/var(yi) var(lny^i)/var(lnyi). Коефіцієнт детермінації для (4.22)

R2==1- (4.24)

а для (4.23)

R2==1- (4.25)

Знаменики у (4.24) і (4.25) різні, тобто порівняти іх неможливо. Щоб зробити це порівняння, потрібно знайти логарифм за моделлю (4.22), обчислити антилогарифм і розрахувати коефіцієнт детермінації між антилогарифмом та значенням yi, який можна вже порівнювати з коефіцієнтом детермінаціх регресійної моделі (4.23). Можливим є й зворотний шлях: обчислити за моделлю (4.22) lny^i, розрахувати y^i, обчислити R2 за формулою (4.13) і порівняти з R2, знайденим для моделі (4.25).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]