Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
EMM_MAMAEVA.pdf
Скачиваний:
100
Добавлен:
27.03.2015
Размер:
1.08 Mб
Скачать

S

 

=

X

2

(

 

 

)2

– стандартная ошибка в определении переменной

X

 

,

X j

X

j

j

 

 

 

j

 

 

 

 

 

 

S

 

Y 2

(

 

)2 – стандартная ошибка в определении переменной Y,.

 

 

Y

 

Y

–коэффициент

показывает,

на

какую

часть

величины

 

среднеквадратичного отклонения изменится в среднем значение зависимой переменной при изменении факторного признака на величину его среднеквадратичного отклонения.

Дельта–коэффициент характеризует вклад каждого фактора в суммарное влияние на результирующий показатель (при условии независимости факторов).

j

RYX j

j

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4.12),

 

 

R2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

бета–коэффициент; R

 

где R2 – коэффициент детерминации,

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

YX j

 

коэффициент

парной

корреляции между

j м

фактором

X j

и

зависимой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

YX j

 

 

 

 

 

 

 

 

 

 

переменной:

R

 

 

 

Y

X j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

YX j

 

 

 

 

SY SX j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R2 rYX J

j ,

 

 

 

k

 

 

 

 

 

Доказано,

что

поэтому

 

j

1.

При

корректно

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

j 1

 

 

 

 

 

проводимом

анализе

величины

j

положительны, т.е.

все

коэффициенты

регрессии имеют тот же знак, что и соответствующие парные коэффициенты корреляции. Тем не менее, в случае сильной коррелированности объясняющих переменных некоторые дельта–коэффициенты могут быть отрицательными вследствие того, что соответствующий коэффициент регрессии имеет знак, противоположный парному коэффициенту корреляции.

4.3. Проблемы спецификации модели.

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.

Включение в уравнение множественной регрессии того или иного набора факторов связано, прежде всего, с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими показателями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.

1.Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2.Факторы не должны иметь сильную корреляционную зависимость и тем более находиться в точной функциональной связи. Включение в модель таких факторов может привести к ненадежности оценок коэффициентов

37

регрессии.

Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых показателей и их целесообразности включения в модель. Поэтому отбор факторов целесообразно разбить на два этапа:

на первом – подбираются факторы исходя из сущности проблемы, на основании допущений экономической теории.

на втором – отбор факторов осуществляется на основе методов многомерного статистического анализа.

При статистическом отборе факторных признаков можно рассмотреть два

альтернативных подхода: метод шаговой регрессии и метод

последовательного исключения факторных переменных Сущность метода шаговой регрессии заключается в последовательном

включении в уравнение отобранных на этапе содержательной постановки задачи факторных переменных с последующей проверкой качества модели и статистической значимости включенных переменных.

Оптимальный набор факторов можно было бы получить последовательным перебором всех возможных сочетаний факторных переменных, но этот путь чрезвычайно трудоемок и практически невозможен при большом числе переменных. Обычно рекомендуют следующую последовательность проведения шагового отбора переменных:

Сначала в модель включается переменная, имеющая наибольшую связь

срезультативным показателем (наибольший коэффициент парной корреляции). Строится модель регрессии. При условии надежности уравнения в целом

и статистической значимости включенной переменной добавляем следующую переменную и вновь проверяем качество модели и статистическую значимость.

Вдальнейшем эта переменная включается во все последующие уравнения.

На следующем шаге определяется наилучшая пара факторных переменных по условию максимума скорректированного коэффициента детерминации и статистической значимости включенных переменных.

Затем определяется наилучшая тройка факторов, причем в ней обязательно присутствуют переменные, включенные на предыдущих этапах и т.д.

Таим образом, при использовании шаговой регрессии обычно строится несколько альтернативных моделей.

Для выбора наилучшей из них обычно используют следующие критерии

Максимальное значение

скорректированного коэффициента

детерминации.

 

Минимальная ошибка оценки точности модели.

Нормальность распределения остатков.

Независимость остатков (проверяется, например, с помощью критерия Дарбина – Уотсона).

Подтверждение выбора модели при помощи информационных критериев Акаике или Шварца

38

Критерии Акаике и Шварца являются эвристической попыткой свести в один показатель два требования: уменьшение числа параметров модели и улучшение качество подгонки модели:

Согласно этим критериям из двух моделей следует выбрать модель с наименьшим значением AIC (информационный критерий Акаике) или SC

(критерий Шварца)

 

AIC SC ln(RSSm / n) 2m / n 1 ln(2 ) ,

(4.13),

где RSSm – остаточная сумма квадратов, полученная при оценивании

коэффициентов модели с m факторными переменными методом наименьших квадратов.

SC ln(RSSm / n) (m ln(n)) / n 1 ln(2 )

(4.14)

В обоих случаях при увеличении количества объясняющих переменных первое слагаемое в правой части уменьшается, а второе увеличивается. В критерии Шварца используется больший штраф за увеличение количества параметров модели.

Суть метода исключений состоит в следующем:

в уравнение включаются все переменные, выбранные на этапе содержательного анализа. Если значимыми оказываются не все параметры модели, то составляется новое уравнение, из которого исключается переменная, с наиболее незначимым параметром (меньшее значение t–статистики). Процедура повторяется до получения уравнения со всеми значимыми параметрами. В то же время этот вопрос об исключении той или иной переменной должен решаться с учетом содержательных аспектов проблемы и целей исследования.

4.4. Понятие мультиколлинеарности

При построении модели множественной регрессии часто приходится сталкиваться с явлением мультиколлинеарности.

Мультиколлинеарность это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. В результате высококоррелированные объясняющие переменные действуют в одном направлении и имеют недостаточно независимое колебание, чтобы иметь возможность интерпретировать изолированное влияние каждой переменной.

Мультиколлинеарность особенно часто имеет место при анализе макроэкономических данных. Получаемые при этом оценки МНК чаще всего оказываются статистически незначимыми и ненадежным, хотя значения коэффициентов R2 могут быть высокими.

Для выявления мультиколлинеарности обычно рассчитывают матрицу парных коэффициентов корреляции для всех объясняющих переменных. Если коэффициенты корреляции между отдельными объясняющими переменными достаточно велики (более 0,8–0,9), то, можно предположить, что они коллинеарны.

Более информативной является матрица частных коэффициентов корреляции, так как в ряде случаев парные коэффициенты корреляции могут

39

давать совершенно неверные представлении о характере связи между двумя переменными. Например, между двумя переменными X и Y может быть высокий коэффициент парной корреляции не потому, что одна из них стимулирует изменение другой, а потому что обе эти переменные изменяются в одном направлении под влиянием других переменных. Поэтому появляется необходимость измерять действительную тесноту связи между двумя переменными, очищенную от влияния на рассматриваемую пару других факторов.

Коэффициент корреляционной связи между двумя переменными, xi и x j , очищенной от влияния других переменных называется частным

коэффициентом корреляции. Обозначается Rij,12....k

Частные коэффициенты корреляции могут быть найдены следующим образом. Пусть R – матрица парных коэффициентов корреляции, а С– матрица обратная к R

 

c

c

...

c

 

 

 

 

 

 

 

 

11

12

 

1k

 

 

 

 

 

 

C R 1 =

c21

c22

...

c2k

. Тогда

R

=

cij

 

(4.15)

... ...

...

...

 

c c

 

 

 

ij,12....k

 

jj

 

 

 

 

 

 

 

 

 

ii

 

 

ck 2

...

 

 

 

 

 

 

 

 

 

ck1

ckk

 

 

 

 

 

 

Из общей формулы легко получить частные формулы для различного числа переменных. Так для трех переменных можно найти, что частный коэффициент корреляции между переменными x1 и x2 :

R12,3

 

R12 R13

R23

 

(4.16)

(1

R2

)(1 R2

)

 

 

 

13

 

23

 

 

Опираясь на эти формулы нетрудно заметить, что парные коэффициенты

корреляции могут существенно отличаться от частных. Поэтому для более обоснованного вывода о корреляции между парами факторных переменных

целесообразно рассчитывать частные коэффициенты корреляции.

 

Пусть

Rj

частный

коэффициент корреляции между

зависимой

переменной

Y и

переменной x j , очищенный от

влияния всех

остальных

переменных.

Тогда R2j

частный

коэффициент

детерминации,

который

определяет процент дисперсии переменной Y, объясняемой влиянием только

переменной x j . Другими словами R2j

j 1,k позволяет оценить вклад каждой

переменной в дисперсию переменной Y.

Однако, не существует единого правила, в соответствии с которым есть

некоторое пороговое значение коэффициента корреляции (общего или частного) после которого высокая корреляция может вызвать отрицательный эффект и повлиять на качество регрессии. Для выявления мультиколлинеарности имеются специальные методы8.

8 В.С.Мхитарян и др. Эконометрика,М. Проспект,2008г, стр.77.

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]