Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методичка__Сарычева Т.В

..pdf
Скачиваний:
28
Добавлен:
03.06.2015
Размер:
1.38 Mб
Скачать

Таблица 1 – Коэффициенты эластичности

Первая

Вид функции

производная,

 

 

 

y

 

 

 

 

 

yx

 

 

 

 

 

Линейная

 

b

y a b x

 

 

 

 

 

Парабола

 

второго

 

 

 

порядка

 

 

b 2 c x

y a b x c x2

 

 

 

Гипербола

 

 

b

 

y a

b

 

 

 

 

 

 

x2

x

 

 

 

 

 

 

 

 

Показательная

 

lnb a bx

y a bx

 

Степенная

 

a b xb 1

y a xb

 

Коэффициент эластичности,

x

Э yx y

Э b x a b x

Э

b 2 c x

a b x c x2

b

Э

a x b

Эx ln x

Эb

В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразованным уравнениям. Если в линейной модели и моделях, нелинейных по переменным, при оценке

параметров исходят из критерия (y yˆx )2 min, то в

моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным данным результативного признака, а к их преобразованным

величинам, т. е ln y, 1 . Так, в степенной функции МНК y

применяется к преобразованному уравнению ln y ln ln xln . Это значит, что оценка параметров

31

основывается на минимизации суммы квадратов отклонений в логарифмах.

ln y ln yˆx 2 min

Соответственно если в линейных моделях (включая нелинейные по переменным) (y yˆx ) 0,то в моделях,

нелинейных по оцениваемым параметрам,

(ln y ln yˆx ) 0.

Вследствие этого оценка параметров для линеаризуемых функций МНК оказываются несколько смещенной.

Корреляция для нелинейной регрессии

Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции ( R ):

 

 

2

 

1/2

 

R 1

ост

 

,

 

 

 

 

2

 

 

 

у

 

 

где у2 - общая дисперсия результативного признака y

ост2 - остаточная дисперсия, определяемая исходя из уравнения регрессии yˆx f (x)

Так как у2 1n y y 2 , а ост2 1n y yˆx 2 ,

то индекс корреляции можно выразить как

32

Ryx ryz

R

1

y yˆx

2

.

y

y

2

 

 

 

Величина данного

показателя

находится в границах

0 R 1, чем ближе

к единице, тем теснее связь

рассматриваемых признаков, тем более надежно уравнение регрессии.

Парабола второй степени, как и полином более высокого порядка, при линеаризации принимает вид уравнения множественной регрессии. Если же нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого в этом случае совпадет с индексом корреляции

где z— преобразованная величина признака-

фактора, например z 1 или z ln x. x

Обратимся для примера к равносторонней гиперболе

yˆx

a

b

.

Заменив

1

на

z,

имеем линейное уравнение

 

 

x

yˆx

 

x

 

 

 

 

 

 

 

 

 

a bz для которого может быть определен линейный

коэффициент

корреляции:

ryz

b

z

. Возводя данное

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

выражение в квадрат, получим:

 

 

 

 

 

 

 

 

 

 

r2 yz b2

2z

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 y

 

 

33

где

2

z

(z

z

)2

и

2

(y

y

)2

 

n

y

.

 

 

 

 

 

n

Преобразовывая далее, придем к следующему выражению для r2 yz :

r2yz b2 (z z)2 .

(y y)2

Как было показано выше b2 (z z)2 (yˆz y)2 и

соответственно

r2 yz (yˆz y)2 .

(y y)2

Но так как (y y)2 = (yˆz y)2 + (y yˆz )2 и

(yˆz y)2 = (y y)2 - (y yˆz )2 ,

то

r2 yz (y y)2 (y yˆz )2

(y y)2

т.е. приходим к формуле индекса корреляции:

 

 

 

(y yˆz )2

1/2

 

2

 

 

r

 

yz 1

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

(y y)

 

 

 

 

 

34

Заменим далее z на

1

, получим

yˆz yˆx ,

 

соответственно ryz Ryx.

x

 

 

 

 

Иначе обстоит дело, когда преобразования уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции.

Так,

для

степенной функции yˆx a xb после

перехода

к

логарифмически линейному

уравнению

ln y lna bln x может быть найден линейный

коэффициент

корреляции не для фактических значений переменных x и y, а для их логарифмов, т. е. rln yln x . Соответственно

квадрат его значения будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не для y, а для его логарифмов:

 

ln y

 

2

1 ln y ln y 2 .

r2

ln y

lnylnx

ln y

 

2

ln y

 

2

ln y

ln y

Между тем при расчете индекса корреляции используются суммы квадратов отклонений признака y, а

не их логарифмов. С этой целью определяются теоретические значения результативного признака, т. е. yˆxy ,

как

антилогарифм рассчитанной по

уравнению величины

ln y

и

остаточная

сумма

квадратов

как

y antilog(ln y) 2 . Индекс корреляции определяется по формуле

35

Rxy

1

(y antilog(ln y)2

(y

y

)2

 

 

В знаменателе расчета Ryx2 участвует общая сумма

квадратов

отклонений

фактических

значений

y от их

средней

величины,

а в расчете

r2

участвует

ln y

 

2

 

 

ln yln x

 

 

 

ln y

. Соответственно различаются и числители

рассматриваемых показателей:

 

 

(y yˆx )2 = (y antilog(ln y)2 - в индексе корреляции и

ln y ln y 2

в коэффициенте корреляции.

Не совпадают данные показатели и для уравнения регрессии в виде экспоненты, ибо при преобразовании в линейную форму рассчитывается линейный коэффициент

корреляции

между

x и

логарифмом y, т. е.

опять

(y

 

 

 

 

ln y

 

2

 

y

)2

заменяется

на

ln y

и

(y antilog(ln y)2

заменяется на

ln y ln y 2 .

При

использовании в преобразовании нелинейных соотношений в линейную форму обратных значений результативного

признака, т. е. 1 , индекс корреляции Rxy , также не будет y

совпадать с линейным коэффициентом корреляции. В этом случае при определении индекса корреляции практически используется формула

Rxy

1

(y 1/(1/ y)2

 

 

 

(y y)2

 

 

36

т. е. теоретические значения yˆx определяются не непосредственно по данным y и x, а на основе уравнения

1

a b x , которое может быть дополнено линейным

y

коэффициентом корреляции между x и 1 y

При определении rx(1/ y) используется сумма квадратов

 

 

 

 

2

 

1

 

1

 

 

 

 

 

 

, которая раскладывается на

отклонений

 

 

y

 

y

 

факторную и остаточную.

Вследствие близости результатов и простоты расчета с использованием компьютерных программ для характеристики тесноты связи по нелинейным функциям широко используется линейный коэффициент корреляции. Несмотря на близость значений Ryx и rln ylnx или Ryx и

rln y,x в нелинейных функциях с преобразованием значений признака y, следует помнить, что если при линейной

зависимости признаков один и тот же коэффициент корреляции характеризует регрессию как yˆx a b x, так и xˆy A B y, так как ryx rxy , то при криволинейной зависимости Ryx . для функции y j x не равен Rxy для регрессии x f (y).

Поскольку в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов

отклонений, то R2 имеет тот же смысл, что и коэффициент

детерминации. В специальных исследованиях величину R2 для нелинейных связей называют индексом детерминации.

37

Оценка существенности индекса корреляции проводится, так же как и оценка надежности коэффициента корреляции.

Индекс детерминации используется для проверки существенности в целом уравнения нелинейной регрессии по F-критерию Фишера:

F

R2

 

n m 1

 

 

,

1 R2

 

 

 

m

где R2 - индекс детерминации; n - число наблюдений;

m- число параметров при переменных x.

Величина m характеризует число степеней свободы для факторной суммы квадратов, а n m 1 — число степеней свободы для остаточной суммы квадратов.

Для степенной функции формула F -критерия примет тот же вид, что и при линейной зависимости:

F

R2

(n 2).

1 R2

 

 

Для параболы второй степени y a b x c x2 -

m 2:

F

R2

 

n 3

 

 

 

1 R2

2

 

Расчет F -критерия можно вести и в таблице дисперсионного анализа результатов регрессии, как это было показано для линейной функции.

Индекс детерминации Ryx2 можно сравнивать с

коэффициентом детерминации ryx2 для обоснования возможности применения линейной функции. Чем больше

38

кривизна линии регрессии, тем величина коэффициента детерминации ryx2 меньше индекса детерминации. Близость

этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически если

величина ( Ryx2 -ryx2 ) не превышает 0,1, то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различия Ryx2 ,

вычисленных по одним и тем же исходным данным, через t- критерий Стьюдента:

 

 

 

 

 

 

 

 

 

 

 

 

 

R2

 

r2

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

yx

 

 

yx

 

 

 

где m

 

 

 

 

 

m

 

R r

 

 

между Ryx2

и ryx2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R r

 

— ошибка

 

разности

 

 

 

определяемая по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

R2 r2

R2 r2

2 2 R2 r2

 

R r

 

 

2

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tфакт tнабл,

 

 

 

 

 

Если

 

 

 

то

различия

между

рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Практически если величина t 2, то

различия между Ryx2 и ryx2 несущественны, и,

следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

39

Средняя ошибка аппроксимации

Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии, т. е. y и Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, лучше качество модели. Величина отклонений фактических и расчетных значений результативного признака ( y yˆx ) по

каждому наблюдению представляет собой ошибку аппроксимации. В отдельных случаях ошибка аппроксимации может оказаться равной нулю. Отклонения ( y yˆx ) несравнимы между собой, исключая величину,

равную нулю. Так, если для одного наблюдения y yˆx = 5, а

для другого она равна 10, то это не означает, что во втором случае модель дает вдвое худший результат.

Поскольку ( y yˆx ) может быть как величиной

положительной, так и отрицательной, то ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю.

Отклонения ( y yˆx ) можно рассматривать как

абсолютную ошибку аппроксимации, а

 

y yˆx

 

100%-

y

 

 

 

как относительную ошибку аппроксимации. Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации как среднюю арифметическую простую:

A 1 y yˆx 100%. n y

40