
Эконометрика.-6
.pdf
Глава 4
НЕЛИНЕЙНЫЕ МОДЕЛИ РЕГРЕССИИ
ИЛИНЕАРИЗАЦИЯ
4.1Нелинейные связи в экономике. Линеаризация модели
До сих пор мы рассматривали лишь линейные модели регрессионной зависимо-
сти y от X x 1 x 2 . . . x p T . В то же время многие важные связи в экономике являются нелинейными. Примеры такого рода регрессионных моделей доставляет нам изучение так называемых производственных функций (зависимостей, существующих между объемом произведенной продукции и основными факторами производства — трудом, капиталом и т. п.), функций спроса (зависимостей, существующих между спросом на какой-либо вид товаров или услуг, с одной стороны, и доходом и ценами на этот и другие товары — с другой). Этап параметризации регрессионной модели, т. е. выбора параметрического семейства функций f X ; Θ ,
врамках которого производится дальнейший поиск неизвестной функции регрессии f X M y X , является одновременно наиболее важным и наименее формализованным и теоретически обоснованным этапом регрессионного анализа. Если же
врезультате реализации этого этапа мы приходим к выводу, что функция f X ; Θ нелинейна, то далее действуем следующим образом:
1)вначале пытаемся подобрать такие преобразования к анализируемым переменным y, x 1 , . . ., x p , которые позволили бы представить искомую зависимость в виде линейного соотношения между преобразованными пере-
менными; другими словами, если 30, 31, . . ., 3p — те самые искомые функции, которые определяют переход к преобразованным переменным, т. е.
y 30 |
y , x 1 |
31 |
x 1 , . . ., x p |
3p x p , то связь между y и X |
x 1 |
x 2 . . . |
x p |
T может быть представлена в виде линейной функции |
регрессии y по X , а именно:
62 |
Глава 4. Нелинейные модели регрессии и линеаризация |
|
|
yi |
Θ0 |
Θ1x |
1 |
. . . Θpx |
p |
εi, i 1, 2, . . ., n. |
|
|
|
i |
|
i |
|
Эту часть исследования обычно называют процедурой линеаризации модели;
2)в случае невозможности линеаризации модели приходится исследовать искомую регрессионную зависимость в терминах исходных переменных, а именно:
yi f Xi; Θ εi,
если спецификация регрессионных остатков εi соответствует условиям классической модели, то для вычисления МНК-оценок ΘMHК векторного параметра Θ решается оптимизационная задача вида
|
|
n |
2. |
ΘMHК |
arg min |
yi f Xi; Θ |
|
|
Θ |
i 1 |
|
4.2 Использование априорной информации о содержательной сущности анализируемой зависимости
Анализируя содержательную сущность изучаемой зависимости, исследователь еще до обращения к исходным статистическим данным может попытаться ответить на ряд вопросов по поводу характера искомой регрессионной связи:
а) будет ли искомая функция f X монотонной или она должна иметь один экстремум (может быть, несколько)?
б) следует ли ожидать стремления в процессе x k f X к асимптомам (по одной или нескольким предикторным переменным) и какова их содержательная интерпретация? Так, например, если f X — средний объем благ определенного вида, потребляемых семьями группы X по доходам, то, очевидно, при x k следует ожидать «насыщения», т. е. f X будет стремиться (снизу) к горизонтальной асимптоте;
в) какова принципиальная природа воздействия объясняющих переменных x 1 , x 2 , . . ., x p на формирование результирующего показателя y — аддитивная или мультипликативная? Так, например, многие схемы зависимостей в экономике характеризуются мультипликативной природой воздействия предикторов на y;
г) не диктует ли содержательный смысл анализируемой зависимости обязательное прохождение графика искомой функции f X через одну или несколько априори заданных точек в исследуемом факторном пространстве?
При выборе общего вида искомой функции регрессии f X , помимо соображений и приемов, описанных выше, полезно учитывать следующие общие рекомендации.
1. Не следует гнаться за чрезмерной сложностью функции, описывающей поведение искомой функции регрессии, руководствуясь исключительно соображениями

4.2 Использование априорной информации |
|
о содержательной сущности анализируемой зависимости |
63 |
оптимизации критерия качества аппроксимации. Дело в том, что если и оценки Θ неизвестных параметров модели, и значение критерия качества вычисляются на основании одной и той же выборки, то за счет увеличения размерности k оцениваемого векторного параметра Θ можно добиться, на первый взгляд, идеального результата. Возможность эта основана на известном в математическом анализе результате, в соответствии с которым для любой заданной системы точек x1, y1 , x2, y2 , . . ., xn, yn (c неповторяющимися абсциссами) можно подобрать алгебраический полином степени n 1, проходящий в точности через все точки этой системы. А это значит, что все «невязки» yi f xi , на основании которых строится критерий качества, равны нулю, т. е. «лучше» модели для описания поведения функции регрессии подобрать невозможно. На самом деле при таком подходе мы как бы заставляем функцию f x реагировать на случайные флюктуации, объясняемые наличием остаточной случайной компоненты ε X . Поэтому если мы попробуем применить полученный таким образом результат к другой выборке из той же самой генеральной совокупности, то увидим явное рассогласование модельных f Xi и наблюденных (yi) значений результирующего показателя. Поэтому при подборе общего вида функции регрессии, как правило, идут от простого к сложному, т. е. начиная с анализа возможности использовать простейшую линейную модель.
2.Следует добиваться компромисса между сложностью регрессионной модели
иточностью ее оценивания. Из общих результатов математической статистики, относящихся к анализу точности оценивания исследуемой модели при ограниченных объемах выборки, следует, что с увеличением сложности модели (выраженной, например, размерностью k векторного параметра Θ, участвующего в ее уравнении) точность оценивания падает. Например, ширина доверительного интервала для неизвестного значения y X при прочих равных характеристиках анализируемой схемы, увеличивается с ростом размерности параметра Θ, участвующего в вычислении функции регрессии f X ; Θ . Именно поэтому в ситуациях, когда исследователь располагает ограниченной исходной выборочной информацией вида, он вынужден искать компромисс между степенью общности привлекаемого класса допустимых решений и точностью оценивания, которой возможно при этом добиться.
3.При обнаружении нелинейности в парных статистических связях анализи-
руемых переменных x j и y j 1, 2, . . ., p следует попытаться применить к этим переменным линеаризующие преобразования. Простейший пример такого приема мы имеем, когда вместо анализа степенной зависимости вида
yΘ0xΘ1
исследователь рассматривает линейную зависимость между логарифмами исходных переменных, а именно:
yΘ0 Θ1x,
где y ln y, x ln x, Θ0 ln Θ0. В зависимости от типа нелинейной связи, существующей между исходными переменными, подбираются и другие линеаризующие преобразования.
4. Анализ регрессионных остатков. Ряд статистических критериев проверки адекватности используемой аппроксимирующей модели регрессии основан на ана-

64 Глава 4. Нелинейные модели регрессии и линеаризация
лизе регрессионных остатков (невязок). В основе их конструирования — положение,
в соответствии с которым правильный выбор модели fa |
X предопределяет асимп- |
|
тотическую (по n |
) независимость остатков ε Xi |
. Поэтому статистическая |
проверка правильности выбора общего вида функции регрессии сводится к проверке статистической независимости остатков, для чего могут быть использованы, например, критерии, описанные в п. 6.4.
5. Поиск модели, наиболее устойчивой к варьированию состава выборочных данных, на основании которых она оценивается. Идея этого подхода к выбору общего вида исследуемой регрессионной зависимости основана на следующем простом соображении. Если общий параметрический вид зависимости f x 1 , x 2 , . . ., x p ; Θ «угадан» правильно, то результаты оценивания Θ1, Θ2, . . . параметра Θ по
различным подвыборкам выборки x |
1 |
, x |
2 |
, . . ., x |
p ; y |
i |
, i 1, . . ., n будут мало от- |
|
i |
|
i |
|
i |
|
личаться друг от друга (а следовательно, не сильно будут различаться между собой
и соответствующие значения f x 1 , x 2 , . . ., x p ; Θ1 , f x 1 , x 2 , . . ., x p ; Θ2 , . . .). И наоборот, при неудачном выборе общего вида искомой зависимости результаты
ее восстановления по различным выборкам, как правило, будут сильно отличаться один от другого.
4.3 Некоторые виды нелинейных зависимостей, поддающиеся линеаризации. Зависимости гиперболического типа
Пусть y и X x 1 x 2 . . . x p T — исходные анализируемые переменные (соответственно результирующая и объясняющие), а ε— случайная остаточная компонента, участвующая в записи регрессионной зависимости, связывающей между собой y и X . За редким исключением вопросы линеаризации анализируемых связей решаются на основе рассмотрения парных зависимостей (и графически представ-
ляющих их парных корреляционных полей) типа x |
j , y |
и x |
j , yl |
, i 1, 2, . . ., n. |
i |
i |
i |
i |
|
Поэтому ниже будут представлены и проанализированы именно парные регрессионные зависимости, поддающиеся линеаризации.
Зависимости гиперболического типа.
1. Предположим, что анализируемые переменные и случайные регрессионные остатки соответственно x, y и ε связаны между собой статистической зависимостью вида
y Θ0 |
Θ1 |
1 |
ε, |
0 x |
. |
|
x |
||||||
|
|
|
|
|
||
Соответствующая кривая регрессии f |
x; Θ f |
x; Θ0; Θ1 Θ0 Θ1 x (рис. 4.1) |
характеризуется двумя асимптотами (т. е. прямыми, к которым график функции неограниченно приближается, не достигая их) — горизонтальной (y Θ0) и вертикальной (x 0).
С помощью преобразования объясняющей переменной x 1 x (т. е. при переходе к новой объясняющей переменной x) эта зависимость приводится к линейному виду y Θ0 Θ1x ε. Соответственно при вычислении МНК-оценок пара-

4.3 Некоторые виды нелинейных зависимостей, |
|
поддающиеся линеаризации. Зависимости гиперболического типа |
65 |
метров Θ0 и Θ1 второй столбец матрицы X должен быть сформирован из чисел 1 x1, 1 x2, . . ., 1 xn.
Рис. 4.1 – График гиперболической зависимости вида f x; Θ Θ0 Θ1 x
2. Пусть переменные x, y и случайные регрессионные остатки ε связаны между собой статистической зависимостью вида
y |
|
1 |
, |
|
Θ0 |
x |
. |
Θ0 |
Θ1x ε |
|
Θ1 |
||||
|
|
|
|
|
|||
Мы придем к линейной модели y |
|
Θ0 Θ1x |
ε, если в качестве результи- |
||||
рующего признака рассмотрим переменную y |
1 y. Следует не забыть только, |
что при вычислении МНК-оценок Θ0 и Θ1 надо использовать в качестве вектора
наблюденных значений зависимой переменной вектор Y 1 y1 1 y2 . . . 1 yn T . 3. Если этап параметризации модели регрессии приводит нас к зависимости
вида |
x |
|
|
Θ1 |
|
|
|
y |
|
|
, |
x |
, |
||
|
|
|
|
||||
|
Θ0x |
Θ1 |
xε |
Θ0 |
|
|
то линеаризацию исследуемой связи обеспечит переход к новым переменным y 1 y и x 1 x.
Легко видеть, что эти переменные будут связаны между собой зависимостью вида
yΘ0 Θ1x ε.
Матрицы X и Y , используемые в формулах метода наименьших квадратов при вычислении оценок Θ0 и Θ1, должны формироваться не из наблюденных значений, соответственно xi и yi, а из обратных к ним величин yi 1 yi и xi 1 xi.
Функции, изображенные на рисунках 4.1 (вариант Θ1 0) и 4.3 (вариант б), используются в определенных ситуациях при построении так называемых кривых Энгеля, которые описывают зависимость спроса на определенный вид товаров или услуг (y) от уровня доходов (x) потребителей. При этом спрос определяется либо абсолютными, либо относительными расходами на данный вид товаров или услуг. Функции, изображенные на рисунках 4.1 (вариант Θ1 0), 4.2, а и 4.3, а, могут оказаться полезными при изучении спроса на товар (y) в зависимости от его цены (x).

66 |
|
|
|
|
|
Глава 4. Нелинейные модели регрессии и линеаризация |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 4.2 – График гиперболической зависимости вида f x; Θ |
1 Θ0 |
Θ1x : |
||||||||||||||||||
а) случай Θ 0; Θ1 0 (для x Θ0 Θ1); б) случай Θ0 0; Θ1 |
0 (для x |
Θ0 Θ1) |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 4.3 – График гиперболической зависимости вида f x; Θ |
x Θ0x |
Θ1 : |
а) случай Θ0 0; Θ1 0 (для x Θ1 Θ0); б) случай Θ0 0; Θ1 |
0 (для x |
Θ1 Θ0) |
4.4 Зависимости показательного (экспоненциального) типа
Достаточно широкий класс экономических показателей характеризуется приблизительно постоянным темпом относительного прироста во времени. Этому соответствует следующая форма зависимости этого показателя (y) от времени (x):
yΘ0eΘ1x ε.
Если пренебречь влиянием случайной остаточной компоненты ε (т. е. положить
ε0, см. рис. 4.4, а), то непосредственные расчеты дают:
dydx Θ1Θ0eΘ1x Θ1y,

4.4 Зависимости показательного (экспоненциального) типа |
67 |
|
|
так что относительный прирост y за единицу времени (т. е. за единицу «количества» x) определяется выражением
dydx y Θ1 в долях y .
Рис. 4.4 – График показательной (экспоненциальной) зависимости вида f x; Θ Θ0eΘ1x: а) случай Θ1 0; б) случай Θ1 0
Переход к новой переменной y ln y позволяет свести исследуемую зависимость к линейному виду:
yΘ0 Θ1x ε,
где Θ0 ln Θ0. Располагая наблюдениями x1; y1 , x2; y2 , . . ., xn; yn и формируя вектор-столбец Y из ln y1, ln y2, . . ., ln yn, мы с помощью МНК можем построить
оценки Θ0 и Θ1 параметров Θ0 и Θ1, а затем получить оценку Θ0 eΘ для параметра Θ0 исходного уравнения.
Если в результате параметризации модели мы пришли к необходимости исследовать экспоненциальную статистическую зависимость вида
Θ1
y Θ0e x ε,
то линеаризация искомой зависимости достигается с помощью следующих преобразований переменных: y ln y, x 1 x.
В терминах переменных (x, y) исследуемая зависимость будет иметь вид
yΘ0 Θ1x ε,
где Θ0 ln Θ0. Соответственно вектор-столбец Y и матрица X , участвующие в фор-
мулах МНК, определяются по исходным наблюдениям xi, yi |
, i 1, 2, . . ., n сле- |
||||||
дующим образом: |
|
|
|
|
|
|
|
|
|
|
1 |
1 . . . |
|
1 |
T |
T |
; |
|
|
|
|||
Y ln y1 ln y2 . . . ln yn |
X |
1 x1 |
1 x2 . . . |
1 |
xn |
. |
|
|
|
|
|
Графики показательной зависимости представлены на рисунке 4.5.

68 |
Глава 4. Нелинейные модели регрессии и линеаризация |
|
|
Рис. 4.5 – График показательной (экспоненциальной) зависимости вида |
|||||||||||||
f |
x; Θ |
Θ0eΘ1 x: а) случай Θ1 |
0; б) случай Θ1 |
|
0 |
|
|||||||
Гибкую форму параметризации искомой регрессионной зависимости представ- |
|||||||||||||
ляет один из частных случаев так называемой логистической кривой |
|||||||||||||
|
|
y Θ0 |
|
1 |
ε 0 x |
|
|
. |
|
|
|
|
|
|
|
Θ1e x |
|
|
|
|
|
|
|||||
Кривая f x; Θ имеет две горизонтальные асимптомы y |
0 и y |
1 Θ0 и «точку |
|||||||||||
перегиба» (x0 |
ln Θ1 Θ0 , y0 |
1 2Θ0). Линеаризация этой зависимости произ- |
|||||||||||
водится с помощью перехода к переменным y |
1 y и x |
e x. Соответственно, |
|||||||||||
вектор-столбец Y и матрица X , участвующие в формулах МНК, определяются по |
|||||||||||||
исходным наблюдениям |
xi, yi |
, i |
1, 2, . . ., n следующим образом: |
|
|||||||||
|
1 y1 1 |
y2 . . . 1 |
T |
; X |
|
1 |
|
1 |
. . . |
|
1 |
|
|
Y |
yn |
e |
x1 |
e |
x2 |
. . . |
e |
xn . |
|||||
|
|
|
|
|
|
|
|
|
|
||||
График логистической кривой представлен на рисунке 4.6. |
|
|
|
||||||||||
Рис. 4.6 – График логистической кривой вида f |
x; Θ |
1 |
Θ0 |
Θ1e x |
|||||||||
|
|
|
(случай Θ1 |
0) |
|
|
|
|
|
|
|
||
Логистические кривые используются для описания поведения показателей, име- |
|||||||||||||
ющих определенные «уровни насыщения», например для описания зависимости |
|||||||||||||
спроса на товар (y) от дохода (x). |
|
|
|
|
|
|
|
|
|
|

4.5 Зависимости степенного типа |
69 |
|
|
4.5 Зависимости степенного типа
Широко распространены в практике социально-экономических исследований так называемые степенные зависимости. Степенная модель множественной регрессии имеет вид
|
|
|
|
|
y Θ0 x |
1 |
Θ1 |
x |
2 Θ2 |
. . . x |
p |
Θp |
|
ε |
|
|
|
|
|
|
|
|
|
|
|
e . |
|
||||
|
|
При переходе к переменным y |
ln y, x j |
ln x j |
j |
|
1, 2, . . .p |
можно предста- |
|||||||
вить эту зависимость в виде КЛММР: |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
y Θ0 |
Θ1x 1 |
|
. . . Θpx p |
ε, |
|
|||||
где Θ0 |
ln Θ0. При оценке параметров Θ0, Θ1, . . ., Θp |
|
участвующие в формулах |
||||||||||||
МНК вектор-столбец Y и матрица X будут определяться по исходным наблюдениям |
|||||||||||||||
x |
1 |
, x 2 |
, . . ., x p ; y |
i |
i 1, 2, . . ., n следующим образом: |
|
|
|
|||||||
|
i |
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y ln y1 ln y2 . . . ln yn |
T , |
|
|
|||||||
а |
j |
1 -й столбец матрицы X есть |
|
ln x1j |
ln x2j . . . |
ln xnj T , j |
1, 2, . . ., p (первый |
||||||||
столбец матрицы X , как обычно, составлен из одних единиц). Графики зависимо- |
|||||||||||||||
стей данного типа для случая p |
1 представлены на рисунке 4.7. |
|
Рис. 4.7 – График степенной зависимости вида f x; Θ Θ0xΘ1 : а) случай Θ1 0; б) случай Θ1 0
Важную роль играют зависимости степенного типа в задачах построения и анализа производственных функций (y — объем произведенной продукции, x 1 , x 2 , . . . — основные факторы производства: труд, капитал и т. д.). Достаточно часто используются степенные зависимости и при построении и анализе функций спроса (y — спрос на определенный вид товаров или услуг, x 1 — доход потребителя, x 2 , x 3 , . . . — цены на данный и другие виды товаров).
При анализе степенных регрессионных зависимостей прозрачную содержательную интерпретацию получают коэффициенты Θ1, Θ2, . . ., Θp, а именно: в соответствии с определением коэффициента эластичности признака y по объясняющей переменной x j величина Θj ∂ ln f x; Θ ∂ ln x j есть не что иное, как коэффициент эластичности анализируемого результирующего показателя по j-й объясняющей

70 |
Глава 4. Нелинейные модели регрессии и линеаризация |
|
|
переменной. Можно показать, что если эластичность y по каждой из объясняющих переменных x j постоянна (т. е. не зависит от того, при каких именно значениях объясняющих переменных она вычисляется), то y и X могут быть связаны только зависимостью степенного типа.
4.6 Зависимости логарифмического типа
На рисунке 4.8 представлены графики зависимостей логарифмического типа
y Θ0 Θ1 ln x ε 0 x |
. |
Рис. 4.8 – График логарифмической зависимости вида f x; Θ Θ0 Θ1 ln x:
а) случай Θ1 0; б) случай Θ1 |
0 |
Кривые на рисунке 4.8 проходят через точку 1; Θ0 |
и имеют в качестве верти- |
кальной асимптоты ось y (т. е. прямую x 0). Переход к линейному виду зависимости осуществляется с помощью логарифмического преобразования объясняющей
переменной x |
ln x. Второй столбец матрицы X , участвующей в формулах МНК, |
|
будет иметь вид |
ln x1 ln x2 . . . ln xn |
T . |
4.7 Оценка значимости уравнения регрессии. Коэффициент детерминации
Проверить значимость уравнения регрессии — значит, установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Проверка значимости уравнения регрессии производится на основе дисперсионного анализа.
В математической статистике дисперсионный анализ рассмотрен как самостоятельный инструмент статистического анализа.
Здесь же он применяется как вспомогательное средство для изучения качества регрессионной модели.