
- •Тема: корреляционный анализ
- •1. Корреляционная зависимость двух случайных переменных величин X и y
- •2. Формы представления выборочных данных для корреляционного анализа
- •3. Парная линейная регрессия
- •4. Корреляционный анализ как один из приемов прогнозирования
- •5. Уравнение множественной линейной регрессии
5. Уравнение множественной линейной регрессии
Рассмотрим случай
множественной
линейной регресии:
и(x)
= и(x1,
x2,…,
xт)
=
+
x1
+
x2
+ … +
xт,
и в результате п
измерений получены п
значений и(i)
для каждого набора значений аргументов
(
).
В этом случае минимизируется функция
F(
,
,
…,
)
=
.
Из условий: F/
= 0,…, F/
= 0, получаем (т
+ 1) уравнений:
или, полагая B
=
,
V
=
,
А =
,
получим АВ
= V,
откуда В =
А–1V.
Если построить
матрицы Х
=
и U
=
,
то Х
ТХ
=
=
п = пА; Х ТU=
= п
= пV,
следовательно, А
=
Х
ТХ,
V
=
Х
ТU,
и равенство
АВ =
V
принимает вид
Х
ТХВ
=
Х
ТU,
откуда
В = (Х ТХ)– 1Х ТU .
Эта формула позволяет достаточно быстро, используя, например, табличный редактор Ехсеl, получить значения числовых параметров эмпирической функции при множественной линейной регрессии. Для этого достаточно составить матрицы Х и U по результатам выполненных п измерений, т.е. по выборке объема п.
Для установления
значимости на уровне
уравнения множественной линейной
регрессии и(x)
=
+
x1
+
x2
+ … +
xт,
в котором
по выборочным данным определяются m
+
1 параметров,
используется F-критерий
Фишера-Снедекора. Наблюдаемое значение
критерия Kн
= (n
–
m
–
1)·QR/Qост,
где QR
=
–
вариация зависимой переменной, учтенная
регрессией; Qост
=
– остаточная вариация, характеризующая
влияние неучтенных факторов. Если Kн
F(k1,
k2),
где степени свободы k1
= m,
k2
= n
– (m
+ 1), то на уровне
полученное уравнение регрессии значимо.