Определение нелинейной регрессии
Для уравнения нелинейной регрессии вида
y=bm1X1* m2X2* ...*mnXn (3)
применяется функция ЛГРФПРИБЛ( ). Для ознакомления с работой этой функции и ее наглядным представлением в виде графиков рассмотрим уравнение регрессии (3) для случая n=1, т.е. парной регрессии
y=bmX.
Функция ЛГРФПРИБЛ( ) имеет точно такой же формат ввода, как и функция ЛИНЕЙН( ), и вычисление уравнения нелинейной регрессии с помощью функции ЛГРФПРИБЛ( ) ведется аналогично работе с функцией ЛИНЕЙН( ).
На 13 листе (ЛГРФПРИБЛ) вашей рабочей книги рассчитайте коэффициенты уравнения регрессии для исходных данных представленных в таблице на рис.6. Для наглядности постройте график y=f(x). Определите минимальное и максимальное значение X (см. рис. 6).
Определим уравнение регрессии для функции, имеющей максимум. Данные для расчета представлены в интервале B25:C31 текущего рабочего листа таблицы и представлены на рис.7.
Оценка достоверности полученного уравнения регрессии R2=0,02. Следовательно, полученное уравнение регрессии описывает статистические данные не удовлетворительно.
Определение уравнения нелинейной регрессии в форме пользователя
Рассмотрим определение уравнения регрессии для исходных данных, приведенных в таблице на рис. 8 в ячейках B3:D13. Определите уравнение линейной регрессии для этих данных на листе 14 (Пользователь). Результаты расчетов представьте в ячейках B18:D22. Достоверность полученного уравнения регрессии в ячейке B20 равна R2=0,64. Эта величина является недостаточной.
Выполните расчет уравнения нелинейной регрессии с помощью функции ЛГРФПРИБЛ( ). Результаты разместите в интервал ячеек B25:D29. Полученное в данном случае значение R2=0,52 тоже нельзя признать удовлетворительным. В таких случаях уравнение регрессии рекомендуется находить в виде функции, вид которой назначает пользователь.
Будем искать уравнение нелинейной регрессии в виде полинома второй степени:
y=b+m1x1+ m2x2+ m3x12+ m4x22+ m5x1x2. (4)
В этом случае для нахождения уравнения регрессии необходимо определить величину b и 5 коэффициентов при остальных членах уравнения регрессии. Таким образом, число искомых величин М=6, что следует из зависимости
M=(n+2)*(n+1)/2.
Для определения искомых величин необходимо иметь число строк с исходными данными не менее чем
K=M+2=6+2=8.
В рассматриваемом примере число строк с исходными данными равно 11, что вполне достаточно для определения нелинейной регрессии в виде (4). Поставленную задачу выполним по следующему алгоритму.
Скопируйте исходные данные текущего листа из интервала ячеек B3:C13 на F3:G13 и D3:D13 на интервал ячеек K3:K13.
Введите обозначения переменных в ячейки F2:J2 и функции - в K2 (рис.9).
Введите формулы для вычисления переменных в H3:J3, как функций F3 и G3.
Скопируйте формулы из интервала H3:J3 на интервал ячеек H4:J13.
Исходные данные для решения задачи имеются в интервале ячеек F3:K13. Используйте функцию ЛИНЕЙН( ) для определения коэффициентов. Результаты будут представлены в интервале ячеек B18:K22 (рис. 9).
Рис. 9.Определение уравнения регрессии в форме пользователя
На основании полученных данных уравнение регрессии имеет вид
y=130+832*X1-482*X2+197*X12+156*X22-364*X1*X2.
При этом оно справедливо для значений X1, X2 в пределах
1<= X1<=17; 2<= X2<=20.
Величина R2 =0,97, т.е. значительно выше, чем для случая линейной регрессии, а также для нелинейной , полученной с помощью функции ЛГРФПРИБЛ( ).
Из рассмотренного примера следует, что в случае недостаточной достоверности линейной регрессии лучше определять уравнение нелинейной регрессии в форме задаваемой пользователем.