
4. Нелинейные регрессионные модели
4.1. Линеаризация функций
Во второй главе мы изучили методы оценивания неизвестных коэффициентов линейной функции регрессии. То, что зависимость между результирующим признаком y и фактором x линейная, постулировалось после изучения экономических предпосылок и статистической эмпирической информации.
Предположим, что у нас есть основание считать, что зависимость между экономическими переменными y и x имеет, например, следующий вид:
,
(4.1.1)
,
(4.1.2)
В этих функциях – х входит нелинейно
,
(4.1.3)
-
показательная функция.(4.1.4)
4.1.3 и 4.1.4
– Бэта входит нелинейно
Пусть х~ = x^2
Тогда:
Y=B0+B1*(x~)+E =>
(Y^)=(B0^)+(B1^)*(x^2)
Коэффициенты β0 , β1 во всех уравнениях неизвестны. Чем отличаются эти функции от рассмотренных ранее?
●Во-первых, зависимость между x и y во всех уравнениях нелинейная.
●Во-вторых, сами коэффициенты β0 , β1 в уравнения (4.1.1), (4.1.2) входят линейно, а в уравнения (4.1.3), (4.1.4) нелинейно.
●В-третьих, в уравнения (4.1.1) и (4.1.2) случайная составляющая e входит как слагаемое (аддитивно), а в уравнения (4.1.3), (4.1.4) как сомножитель (мультипликативно).
Как всё сказанное влияет на методы отыскания неизвестных коэффициентов β0 , β1?
Если оба коэффициента входят в уравнение линейно, а случайная составляющая e аддитивно, то исходная нелинейная функция путем замены переменных сводится к линейной функции вида (2.1.2).
Процесс преобразования нелинейной функции к линейной называют линеаризацией.
Например,
обозначим в уравнении (4.1.1) через
новую переменную:
.
В уравнении (4.1.2) также произведем замену переменной:
=
.
Тогда
оба
эти
уравнения могут быть переписаны в виде:
.
(4.1.5)
Структура этого уравнения совпадает с уравнением (2.1.2). Значит, оценки в0 и в1 параметров линейной регрессии, которые мы найдем по методу наименьших квадратов для модели (4.1.5), будут искомыми и для исходных моделей (4.1.1) и (4.1.2).
2) Для линеаризации (приведения нелинейной функции к линейной) функций (4.1.3) и (4.1.4) поступим следующим образом: прологарифмируем обе части этих уравнений по произвольному основанию. (В экономических задачах чаще всего используют натуральные логарифмы ln). Уравнение (4.1.3) преобразуется к виду:
.
(4.1.6)
а уравнение (4.1.4) будет следующим:
.
(4.1.7)
Проанализируем оба последних уравнения. Для этого в уравнении (4.1.6) произведем следующую замену переменных:
.
и введем такие обозначения для новых коэффициентов:
Тогда уравнение (4.1.6) примет вид:
.
(4.1.8)
В уравнении (4.1.7) введем такие переменные:
.
и обозначения для новых коэффициентов:
Тогда уравнение (4.1.7) также запишется в виде (4.1.8), совпадающим по виду с линейным уравнением (2.1.2).
Параметры
линейной регрессионной модели (4.1.8) мы
можем оценить, используя для этого
МНК. Обозначим найденные оценки для
через
и используем обратное преобразование,
для того, чтобы найти оценки в0
и в1
уравнений (4.1.3)
,
. (4.1.9)
и (4.1.4) соответственно:
,
.
(4.1.10)
Безусловно, проводить линеаризацию функции при помощи логарифмирования, можно только в том случае, если логарифмируемое выражение положительно. И все должно быть положительно, каждый изначальный множитель функции. Подводя итог, отметим, что логарифмирование нелинейных функций и переход к линейной модели дает возможность решить задачу нахождения неизвестных коэффициентов для моделей вида (4.1.3), (4.1.4).
Для 4.1.3:
y^=e2x-3, если оценка lnB0=2, lnB1=-3
Для 4.1.4:
y^= e3,5x+1, если оценка lnB0=1, lnB1 = 3,5
Приведем теперь пример ещё одной функции
,
(4.1.11)
как пример нелинейной функции, которая не может быть приведена к модели, линейной относительно неизвестных коэффициентов β0 и β1 . Поэтому, необходимы уже другие методы для нахождения оценок этих коэффициентов, отличные от методов, рассмотренных в этой главе.
Замечание
1.
Функции вида (4.1.2) при
β1<0
и вида
при β0 >0 и β1>0 используют для описания кривых Энгеля, которые, характеризуют, спрос на товар и услуги (переменная, y) в зависимости от доходов населения (переменная x). В то же время, если в уравнении (4.1.2) β1 >0,
а в уравнении
коэффициенты удовлетворяют условиям:
β0 <0 и β1>0
или,
β0 >0 и β1<0,
то эти функции могут быть использованы при изучении спроса на товар (переменная y) в зависимости от цены товара (переменная x).
Функции вида (4.1.3) используют при аппроксимации производственных функций. В роли y выступает объем производства, а в роли x - один из основных факторов производства. В частности, функция (4.1.2) использовалась при изучении взаимосвязи показателей инфляции и безработицы в Великобритании в период 1950 - 1966 [10].
В свою очередь, функции вида
применяют при анализе урожайности сельскохозяйственного производства, а функции вида (4.1.3) могут быть использованы при изучении изменения ставок межбанковского кредита (переменная y) в зависимости от срока его предоставления (в днях) (переменная x).
Замечание
2.
Одним из существенных предположений
при изучении линейной регрессионной
модели было предположение о том, что
случайные составляющие
распределены по нормальному закону и
входят в уравнение аддитивно. Это
предположение играло существенную роль
при изучении свойств оценок регрессии.
В случае нелинейной регрессии, если
входит в уравнение для y аддитивно, то
по-прежнему достаточно предположить
нормальный закон распределения для
ошибок
(уравнения типа (4.1.1), (4.1.2)). Если же,
входит в нелинейную зависимость y от x
мультипликативно, как в уравнениях
(4.1.3), (4.1.4), то после линеаризации, вместо
мы получаем ln
. Только в том случае, если закон
распределения случайной величины
будет логнормальным, закон распределения
ln
будет нормальным. ▲