Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрическое моделирование [Электронный ресурс] (90

..pdf
Скачиваний:
7
Добавлен:
15.11.2022
Размер:
403.91 Кб
Скачать

чить такие оценки параметров, при которых сумма квадратов откло-

нений фактических значений результативного признака у от теорети-

ческих ух минимальна, т.е.

(у уˆ х )2 min ,

a= y b x,

b= cov(x, y) = yx y x .

σxσy x2 x 2

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.

Знак при коэффициенте регрессии b показывает направление связи: при b>0 — связь прямая, а при b< 0 — связь обратная.

Параметр а формально показывает значение у при х = 0. Если признак-фактор х не имеет и не может иметь нулевого значения, то трактовка свободного члена а не имеет смысла. Параметр а может не иметь экономического содержания.

Качество построенной модели определяется с помощью ряда коэффициентов.

Линейный коэффициент парной корреляции rху оценивает тес-

ноту связи изучаемых явлений. Для линейной регрессии (-1 < rху < 1):

r

= b

σx

= cov(x, y)

=

yx y x

xy

 

σ

y

σ

σ

y

 

σ σ

 

 

 

x

 

 

x y

Если значение |rухi| достаточно велико, т.е. |rухi| > 0,5-0,6, то можно говорить о наличии существенной линейной связи между переменными у и хi или о достаточно сильном влиянии хi на у. Чем больше

11

абсолютное значение rухi , тем сильнее это влияние (положительное или отрицательное, в зависимости от знака r).

Значение rухi. должно рассчитываться с учетом формы преобразования у и хi в модели. Например, если у ~1/ хi, то и коэффициент кор-

реляции определяется между уи ui = 1/х, и т.п.

Корреляция – это степень зависимости между двумя случай-

ными величинами X и Y. Для исследования подобных зависимостей пользуются конечным (выборочным) набором пар значений.

Парный коэффициент корреляции

 

 

 

T

 

 

 

 

 

(xit xi )(xjt xj )/(T 1)

rx x

 

=

t=1

 

.

 

σx σx

 

i

j

 

 

 

 

 

 

 

 

 

 

i

j

На практике взаимосвязь между факторами признается сущест-

венной, |rухi| > 0,8-0,9. В таких ситуациях один из этих факторов целе-

сообразно исключить из модели, чтобы одна и та же причина не учи-

тывалась дважды. Однако такое исключение следует проводить в тех случаях, когда факторы выражают одно и то же явление.

В нелинейной регрессии используется индекс корреляции (0 < pху < 1):

.

Для оценки качества модели используют коэффициент де-

терминации, он показывает долю дисперсии, которая обусловлена регрессией, в общей дисперсии показателя у:

12

.

Коэффициент детерминации, как и коэффициент корреляции, принимает значения от -1 до +1. Чем ближе его значение коэффици-

ента по модулю к 1, тем теснее связь результативного признака Y с

исследуемыми факторами X.

Средняя ошибка аппроксимации – среднее отклонение расчет-

ных значений от фактических:

A = 1n y y yˆ 100 %.

Допустимый предел значений А – не более8-10%.

Средний коэффициент эластичности Э показывает, на сколь-

ко процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значения:

Э = f ( x ) xy .

Задача дисперсионного анализа состоит в анализе дисперсии

зависимой переменной:

( y y)2 = ( yˆx y)2 +( y yˆx )2 ;

( y y)2 – общая сумма квадратов отклонений;

( y yˆx )2 – сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);

(yˆx y)2 – остаточная сумма квадратов отклонений.

13

F тест – оценивание качества уравнения регрессии - состоит в проверкегипотезыНо остатистическойнезначимостиуравнениярегрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F – критерия Фишера. Fфакт определяется из соотношения значений факторной и оста-

точной дисперсий, рассчитанных на одну степеньсвободы:

F

=

( yˆ y)2

 

(n m 1)

=

 

rxy2

(n 2),

m

( y yˆ)2

1rxy2

факт

 

 

 

 

где n – число единиц совокупности;

m – число параметровпри переменных х.

Fтабл. – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости

α. Уровень значимости α - вероятность отвергнуть правильную гипотезу приусловии, что онаверна. Обычно α принимаетсяровной0,05 или0,0 1 .

Если Fтабл< Fфакт, то Н0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл> Fфакт, то гипотеза Н0 не отклоняется и признаетсястатистическаянезначимость, ненадежностьуравнениярегрессии.

Для оценки статистической значимости коэффициентов рег-

рессии и корреляции рассчитываются t-критерий Стьюдента и дове-

рительные интервалы каждого из показателей. Выдвигается гипотеза H0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:

14

ta =

a

; tb =

b

; tr =

r

.

 

 

 

 

ma

mb

mr

Случайные ошибки параметров линейной регрессии и коэффи-

циента корреляции определяются по формулам:

mb =

ma =

(y yˆ x )2 /(n 2)

=

 

Sост2

=

 

Sост

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x x)2

 

 

(x x)2

σx

n

 

 

 

 

 

 

 

 

(y yˆ x )2

 

 

x2

 

 

2

x2

 

 

x2

 

 

 

 

=

Sост n2σx2

= Sост

 

;

(n 2)

n(x x)2

nσx

1r 2

mr = n xy2 .

Сравнивая фактическое и критическое (табличное) значения t- статистики - tтабл и tфакт - принимаем или отвергаем гипотезу Н0.

Если tтабл < tфакт., то Hо отклоняется, т.е. а, b и rxy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если tтабл > tфакт, то гипотеза H0 не отклоняется и признается случайная природа формирования а, b или rху.

Для расчета доверительного интервала определяем предель-

ную ошибку для каждого показателя:

а

=tтаблma ,

b =tтаблmb .

Формулы для расчета доверительных интервалов имеют

следующий вид:

 

а

а а а+

а ,

b

b b b +

b .

Если в границы доверительного интервала попадает ноль, т.е.

нижняя граница отрицательна, а верхняя положительна, то оцени15

ваемый параметр принимается нулевым, так как он не может одно-

временно принимать и положительное, и отрицательное значения.

Прогнозное значение ур определяется путем подстановки в уравнение регрессии ух = а + bх соответствующего (прогнозного) значения хр.

Вычисляется средняя стандартная ошибка прогноза myˆ p .

myˆ p =σост

1

 

(xp x)2

,

1+

 

+

 

 

n

(x x)2

 

строится доверительный интервал прогноза

y p y p y p y p + y p .

16

3. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ

Множественная регрессия - уравнение связи с несколькими независимыми переменными:

у = f(х12,…,хр),

где у – зависимая переменная (результативный признак); х12,…,хр независимые переменные (факторы).

Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчётах.

Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное воздействие их на моделируемый показатель.

Прежде всего, так же как и в парной регрессии, необходимо отобрать необходимые факторы. Они должны отвечать следующим требованиям:

1)быть количественно измеримыми (качественным факторам придают количественную определённость, например, проставляя баллы);

2)не должны быть коррелированными между собой и тем более находиться в точной функциональной связи.

Отбор факторов обычно проводится в две стадии: на первой отбираются факторы исходя из сути проблемы; на второй – на основе матрицы показателей корреляции и определения t-статистики для параметров регрессии.

17

Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны,

т.е. находятся между собой в линейной зависимости, если rxi x j 0, 7 .

Наибольшие трудности возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга.

Для построения уравнения множественной регрессии чаще используются следующие функции:

1) линейная

yt

=α0

+α1 x1t

+... +αn xnt +εt ;

2) степенная

 

 

 

 

 

 

y

t

=α

0

x α1

x

α2

... x

αnt +ε

t

;

 

 

1t

 

2t

 

nt

 

3) гиперболическая, используется при обратных связях при-

знаков:

yt =1/(α + b1 x1t +... + bn xnt +εt ) .

Можно использовать и другие функции, приводимые к линейному виду.

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных и нелинейных уравнений, приводимых к линейным, строится система нормальных уравнений, решение которых позволяет получить оценки параметров регрессии.

18

Ввиду четкой интерпретации параметров наиболее часто используются линейная и степенная функции. В линейной множественнойрегрессииух = а+ b1 • х1 + b2 • х2 + ... +bр параметры при х называются

коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне.

Свободный член уравнения множественной линейной регрессии (параметр а) вбирает в себя информацию о прочих не учитываемых в модели факторах. Его величина экономической интерпретации не имеет. Формально его значение предполагает то значение у, когда все х=0, что практически не бывает.

П р и м е р. Предположим, что зависимость расходов на продукты питания по совокупности семей характеризуется следующим уравнением:

ух = 0,5 + 0,35 х1 + 0,73 х2,

где у – расходы семьи за месяц на продукты питания, тыс. руб.; х1 месячный доход на одного члена семьи, тыс. руб.; х2 размер семьи, человек.

Анализ данного уравнения позволяет сделать выводы — с ростом дохода на одного члена семьи на 1 тыс. руб. расходы на питание возрастут в среднем на 350 руб. при том же среднем размере семьи. Иными словами, 35 % дополнительных семейных доходов тратится на питание. Увеличение размера семьи при тех же доходах предполагает дополнительный рост расходов на питание на 730 руб. Параметр а не имеет экономической интерпретации.

19

В степенной функции коэффициенты bj являются коэффициентами эластичности. Они показывают, на сколько процентов в среднем изменяется результат с изменением соответствующего фактора на 1% при неизменности действия других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных функциях, висследованиях спроса и потребления.

Предположим, что при исследовании спроса на мясо получено уравнение

yˆx = 0,82 x12,63 x12,11 ,

где у – количество спрашиваемого мяса; х1 цена; х2 доход.

Следовательно, рост цен на 1 % при том же доходе вызывал снижение спроса в среднем на 2,63 %. Увеличение дохода на 1% обусловливаетпринеизменныхценахростспросана1,11 %.

Производственная функция имеетвид

P = a F1b1 F2b2 ... Fmbm ε ,

где Р – количество продукта, изготавливаемого с помощью т производственных факторов (F1, F2…Fm),

b – параметр, являющийся эластичностью количества продукции по отношению к количеству соответствующих производственных факторов.

Экономический смысл имеют не только коэффициенты каждого фактора, но и их сумма, т. е. сумма эластичности: В=b1 + b2 +.. .

+ bт. Эта величина фиксирует обобщенную характеристику эластичности производства.

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]