- •Множественный регрессионный анализ
- •210100 Электроника и наноэлектроника
- •1. Теоретические сведения
- •1.1 Предпосылки для выполнения множественного регрессионного анализа
- •1.2 Переход к новому базису
- •1.3 Нормирование переменных уравнения регрессии
- •1.4 Расчёт коэффициентов нормированного уравнения регрессии методом наименьших квадратов
- •1.5 Оценка значимости коэффициентов нормированного уравнения регрессии
- •1.6 Расчёт абсолютных коэффициентов уравнения регрессии
- •1.7 Статистическая оценка результатов множественного регрессионного анализа
- •2. Практические упражнения
1.6 Расчёт абсолютных коэффициентов уравнения регрессии
После окончательного определения коэффициентов βm осуществляется обратный переход к ненормированному уравнению регрессии. Это делают путём расчёта коэффициентов Am по выражениям:
2020\* MERGEFORMAT ()
2121\* MERGEFORMAT ()
1.7 Статистическая оценка результатов множественного регрессионного анализа
Оценку результатов МРА и качества полученной регрессионной модели осуществляют по двум параметрам: работоспособности и адекватности уравнения регрессии.
Работоспособность полученного уравнения регрессии определяется по значению множественного коэффициента корреляции R и показывает «похожесть» изменения прогнозируемых (рассчитанных по уравнению регрессии) значений функции цели и данных эксперимента. В [3] показано, что уравнение регрессии имеет хорошую работоспособность, если выполняется условие:
R > 0,8
Если оценка R окажется меньше 0,8, причинами этого могут быть:
в уравнение регрессии не включены ещё какие-то значимые факторы, существенно влияющие на функцию цели;
регрессионная зависимость должна быть описана полиномом более высокого порядка;
базовая точка в проведённом эксперименте находится вблизи главного экстремума целевой функции.
В первом случае исследователю необходимо более детально изучить объект исследования и учесть все значимые факторы в уравнении регрессии. Во втором случае необходимо постулировать иной вид уравнении регрессии и определить его коэффициенты методом множественного регрессионного анализа. В третьем случае необходимо расширить диапазон изменения входных переменных и также перейти к уравнению регрессии более высокого порядка.
Регрессионная модель (уравнение) считается адекватной, если ошибка прогнозирования среднего значения функции цели не превышает отклонений функции цели, вызванных наличием шума в эксперименте.
Адекватность
уравнения регрессии проверяется в том
случае, когда для каждой комбинации
входных параметров xi(t)
выполнено K
параллельных
измерений
функции цели y
(столбцы y1..yK
таблицы 1). В этом случае существует
возможность расчёта дисперсии
воспроизводимости
,
характеризующей уровень шума в
эксперименте. Дисперсия воспроизводимости
(при условии выполнения предпосылок
МРА) рассчитывается как среднее значение
дисперсий параллельных наблюдений
функции цели y:
, 2222\* MERGEFORMAT ()
, 2323\* MERGEFORMAT ()
2424\* MERGEFORMAT ()
Ошибка прогнозирования
характеризуется остаточной дисперсией
,
рассчитываемой по отклонениям расчётных
значений
от средних значений по параллельным
наблюдениям в эксперименте
для каждой комбинации входных параметров
(j
= 1..N):
. 2525\* MERGEFORMAT ()
В выражении (25) символом d обозначено количество коэффициентов уравнения регрессии после исключения незначимых слагаемых.
Сравнение дисперсии шума и дисперсии ошибки прогнозирования осуществляют при помощи F-статистики Фишера. С этой целью рассчитывают эмпирическое значение F-статистики:
2626\* MERGEFORMAT ()
и сравнивают его с критическим значением, выбранным для необходимого уровня значимости q = 1 – p, числа степеней свободы числителя fЧИСЛ = fОСТ = N – d и числа степеней свободы знаменателя fЗНАМ = fВ = N∙(K-1). Если выполняется условие
2727\* MERGEFORMAT ()
то делается вывод об адекватности уравнения регрессии.
