
4. Моделі множинної лінійної регресії
Подібні
моделі застосовуються у випадку, коли
необхідно встановити кількісне
співвідношення між результативною
ознакою (відгуком)
у
та
певною кількістю незалежних змінних
xj(j
=(
),
що
впливають
на значення у.
У загальному випадку модель множинної лінійної регресії має вид:
у = ао + а1х1 + а2х2 +….+ аmхm (4.1)
Щоб краще зрозуміти одержання коефіцієнтів рівняння регресії, розглянемо спочатку просту модель множинної регресії при т =2, тобто
у = а0 + а1х1 + а2х2 .
Для пошуку оптимальних значень ao;a1;a2, скористаємося, як і для парної лінійної регресії, методом найменшого квадрата відхилень (МНК), тобто таким вибором цих коефіцієнтів, що забезпечує мінімум функціонала:
,
де N - кількість експериментальних значень кожного аргументу хj.
Диференціюючи вказаний функціонал по параметрах моделі, зажадаємо, як і раніш, щоб
(4.2)
Після введення центрованих значень змінних:
і виконання операції диференціювання з урахуванням формули (4.2), одержимо систему З -х рівнянь (тут і далі піде сумування по i від 1 до N)
(4.3)
(4.4)
Після розрахунку центрованих значень, що входять до формул (4.4), вони використовуються як коефіцієнти системи алгебраїчних рівнянь (4.3). Рішення ж цієї системи відносно невідомих змінних ao;a1;a2, (наприклад за правилом Крамера, або методом Гаусса) дозволяє визначити чисельне значення цих коефіцієнтів регресивної моделі.
Для зручності та спрощення розрахунків рекомендується звести експериментальні і розрахункові величини в одну таблицю 4.1.
Таблиця 4.1
Таблиця для розрахунку коефіцієнтів рівняння множинної регресії.
№ даних |
Уі |
Х1і |
Х2і |
Х1і2 |
Х2і2 |
Х1і Х2і |
Х1і Уі |
Х2і Уі |
1 |
У1 |
Х11 |
Х21 |
Х112 |
Х212 |
Х11 Х21 |
Х11 У1 |
Х21 У1 |
2 |
У2 |
Х12 |
Х22 |
Х12і2 |
Х222 |
Х12 Х22 |
Х12 У1 |
Х22 У1 |
. . . . . . |
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
N |
УN |
Х1N |
Х2N |
Х1N2 |
Х2N2 |
Х1N Х2N |
Х1N УN |
Х2N УN |
Суми |
Уі |
Х1і |
Х2і |
(Х1і)2 |
(Х2і)2 |
(Х1і Х2і) |
(Х1і Уі) |
(Х2і Уі) |
Сер. знач |
|
|
|
. . |
. . . |
. . . |
. . . |
. . . |
|
. . . |
. . . |
. . . |
N |
N |
N |
N |
N |
К-ти Рівн(4.3) |
|
|
|
e
|
e |
e |
e |
e |
Спочатку розраховуються суми стовпчиків, потім для перших трьох стовпчиків розраховуються середні значення шляхом розподілу на N відповідних сум (третій з низу рядок). Отримані середні значення ; ; - використовується в рядку розрахункових значень (другий з низу рядок). Потім з отриманих у четвертому з низу рядку сум віднімаються відповідні розрахункові значення. Отримані різниці заносяться в останній рядок таблиці 4.1 і використовуються як коефіцієнти системи алгебраїчних рівнянь(4.3).
Відзначимо, що коефіцієнти а1 і а2 у рівнянні лінійної множинної регресії називаються частковими (іноді чистими) коефіцієнтами регресії у по х1 і по х2, які відображають вплив тільки відповідної змінної. Якщо ми досліджуємо тільки вплив х1 на у за допомогою рівняння у = а0 + а1х1, зневажаючи впливом х2, то коефіцієнт а1 у цьому рівнянні називається - повним коефіцієнтом регресії у по хі і чисельно не дорівнює частковому коефіцієнтові а1 у рівнянні лінійної множинної регресії, тому що враховує також і непрямий вплив неврахованої змінної х2.
У випадку побудови моделі з трьома і більш незалежними змінними можливе, в принципі, використання допоміжних таблиць, аналогічних таблиці 4.1, з відповідним збільшенням числа стовпців. Однак в даний час при т≥3 ручний метод підрахунку практично не використовується через значне зростання обсягу обчислень. Набагато простіше доручити цю роботу ЕОМ, що має у своєму програмному забезпеченні комплекси стандартних програм кореляційного та регресивного аналізу даних експерименту.
Розглянемо найбільш загальний випадок множинної лінійної регресії з т незалежними перемінними хj (j = ), що має наступний вигляд:
у = ао + а1х1 + а2х2 +….+ аmхm (4..5)
Нехай
необхідно визначити значення коефіцієнтів
регресивного рівняння.
Для цього проведемо заміну натуральних
змінних (yi
та
хji
(j
=
);
і =
)
на
нормовані змінні:
(4..6)
Очевидно,
що для нормованих змінних
Виходячи
з того, що
рівняння (4.5) можна представити у вигляді:
(4.7)
Враховуючи
,
для
варіацій у
відносно
в
нормованих
змінних матимемо:
де
(4.8)
При цьому вільний член нормованого рівняння множинної регресії α0 = 0.
Коефіцієнти
рівняння (4.8) знаходимо, як завжди, з
умови мінімізації середньої
квадратичної похибки, тобто із
застосуванням методу найменших
квадратів (МНК):
де
-
розрахункове
значення
нормованої змінної.
Взявши відповідні похідні та прирівнявши їх до нуля:
. . .
і враховуючи, що
та
( k≠j
), (4.9)
де ryx є нормований коефіцієнт кореляції між хj та хk , отримаємо систему т рівнянь , аналогічну системі (4.3), яка була записана лише для двох незалежних змінних а1 і та а2:
(4.10)
-
нормований
коефіцієнт кореляції між у
та
xj;
-
нормований
коефіцієнт кореляції між хj,
та хk
з
числа решти
змінних,
що
залишилися.
Розв’язання
системи (4.10) відносно
проведемо, наприклад,
за
допомогою
правила Крамера:
( j=1,2,…m),
де
1 r12 r13
…
r1m
∆ = r21 1 r23 … r2m
……..………………….
rm1 rm2 rm3 … 1
-
головний
визначник системи,
визначник
Крамера, який отриманий з головного
визначника шляхом заміни j-го
стовпчика на стовпчик
{ryx1
ryx2
ryxm}.
Відмітимо, що значення rух
та
rjk
легко
знаходяться
з експериментальних даних за допомогою
(4.6; 4.9). Після
визначення аj
знаходимо
по (4.8)
.
Потім, після визначення aj знаходимо a0:
Таким чином знайдено коефіцієнти множинної регресії, які входять до формули (4.5).