Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
EMM_MAMAEVA.pdf
Скачиваний:
100
Добавлен:
27.03.2015
Размер:
1.08 Mб
Скачать

нормально. Дело в том, что если случайный член нормально распределен, то так же будут распределены и коэффициенты регрессии. Эта предпосылка необходима для проверки статистической значимости сделанных оценок и определения для них доверительных интервалов.

Для проверки выполнения перечисленных условий имеются специальные статистические критерии.

3. Проверка качества регрессионных моделей.

Для практического использования эконометрической модели большое значение имеет их адекватность, т.е. соответствие реальному процессу и тем статистическим данным, на основе которых построена модель. Анализ качества (верификация модели) включает статистическую и содержательную составляющую. Проверка статистического качества эконометрической модели обычно состоит из следующих шагов:

Проверка статистической значимости коэффициентов уравнения регрессии.

Проверка общего качества уравнения регрессии.

Проверка точности модели.

Проверка свойств данных, выполнение которых предполагалось при оценивании уравнения, например, условий ГауссаМаркова (в данном пособии не рассматривается).

Под содержательной составляющей анализа качества понимается рассмотрение экономического смысла полученной модели и ее коэффициентов.

3.1. Проверка общего качества регрессионной модели. Коэффициент детерминации

В качестве характеристики оценки адекватности модели или степени согласованности расчетных и фактических значений Y желательно иметь показатель, отражающий, в какой мере функция регрессии определяется факторными (объясняющими) переменными X , а в какой – стохастическим возмущением .

На первый взгляд кажется, что критерием качества оценивания могла бы служить сумма квадратов отклонений фактического значения зависимой

переменной Yi от вычисленного по оцененному уравнению значения Yˆi .

Однако, эта величина зависит от единицы измерения зависимой переменной Y и от числа наблюдений в выборке, поэтому не вполне годится для оценки.

Разброс случайной величины Y в выборке можно измерить с помощью

дисперсии: D(Y ) 1

 

n

 

 

 

)2

 

n

(Y

Y

(3.1)

 

i 1

i

 

 

 

 

Проведем разложение этой величины на составляющие. Очевидно, что:

Yi Y (Y Yˆi ) (Yˆi Y ) (3.2),

где Yi Yˆi ei (графическая иллюстрация приведена на рис.4).

24

Y

 

 

 

 

 

 

 

 

 

 

Yi

 

 

 

 

 

 

 

 

 

 

 

 

ei

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

Yi

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

X

Рис.4. Разложение отклонений Yi

от выборочного среднегоY

 

ˆ

 

 

 

 

 

 

ˆ

 

 

ˆ

ˆ

Так как Yi Yi ei ,

 

то D(Y ) D(Y

e) D(Y ) D(e) 2cov(Y ,e) .

Легко

проверить,

 

что

 

 

ˆ

 

Тогда

справедливо следующее

 

cov(Y ,e) 0 .

равенство, называемое правилом разложения отклонений ( вариаций):

 

 

 

ˆ

 

 

 

 

 

 

 

 

(3.3)

D(Y ) D(Y ) D(e) ,

 

 

 

 

 

 

Отсюда можно записать соотношение:

 

 

 

n

 

 

 

n

ˆ

 

 

n

ˆ

 

 

 

 

(Yi Y )

2

 

 

 

2

 

2

.

(3.4)

 

(Yi Y )

 

(Yi Yi )

 

i 1

 

 

i 1

 

 

i 1

 

 

 

 

Разброс фактических значений Yi

около среднего Y измеряется полной

 

 

 

 

 

n

 

 

 

 

 

 

 

суммой квадратов TSS = (Y

 

)2

=

nD(Y ) – это общее (полное) отклонение

Y

 

 

 

 

i 1

i

 

 

 

 

 

((total sum of squares) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

ˆ

 

 

2

 

 

 

ˆ

определяет разброс расчетных значений

 

 

 

 

 

 

 

 

 

 

Сумма ESS .= (Yi Y )

 

= nD(Y )

ˆ

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

около среднего Y и называется факторным отклонением (explained sum of

Yi

squares). Это величина, обусловлена включенными в уравнение факторными переменными X , поэтому это отклонение называют также «объясненным». 4

 

n

 

 

 

n

 

 

 

 

 

 

ˆ

2

 

2

= nD(e) –остаточное отклонение (residual sum

RSS =

 

= e

(Y Y )

 

 

 

i

i

 

i 1

i

 

 

 

i 1

 

 

 

 

 

 

 

of squares)). Это отклонение не может быть объяснено корреляционной зависимостью между Y и X , отсюда его название: "необъясненное", или остаточное отклонение. Оно измеряет ту часть рассеяния, которая возникает из–за различных случайных факторов.

Поэтому чем ближе RSS к нулю, тем меньше фактические значения Y

отклоняются от вычисленных по уравнению модели значений ˆ .

Y

Соотношение (3.4) запишем как

TSS=ESS+RSS.

(3.5)

Поделим это соотношение на TSS

 

ESS

RSS 1

(3.6)

TSS

TSS

 

4 В некоторых учебных изданиях приняты другие обозначения для отклонений (вариаций)

25

Величина R2 TSSESS называется коэффициентом детерминации (мерой

определенности). R2 показывает, какая доля общей вариации анализируемой зависимой переменной Y обусловлена изменением факторных переменных.

Для случая парной регрессии R2 равняется квадрату коэффициента

корреляции переменных Y и X ( RYX2 ).

Соотношение (3.6) показывает, что чем меньше RSS, тем ближе R2 к единице и тем лучше модель. В общем случае числовое значение коэффициента

детерминации заключено между нулем и единицей: 0 R2 1.

Если R2 = 1, то эмпирические значения Y лежат на регрессионной прямой. Если коэффициент детерминации равен нулю, то между Y и X нет никакой корреляционной связи и линия регрессии параллельна оси 0X. Таким образом, если существует статистически значимая линейная связь величин X и Y ,то коэффициент детерминации должен быть близок к единице.

Однако не следует абсолютизировать высокое значение R2 , так как коэффициент детерминации может быть близким к единице в силу того, что обе исследуемые величины Y и X имеют выраженный временной тренд, не связанный с их причинно-следственной зависимостью. В экономике обычно такой тренд имеют объемные показатели (ВНП, ВВП, доход и пр.). Поэтому при построении и оценке модели по временным рядам объемных показателей величина R2 может быть весьма близкой к единице, что не обязательно свидетельствует о наличии значимой линейной связи между исследуемыми показателями.

Если уравнение регрессии строится по перекрестным данным, то коэффициент детерминации может быть не очень высоким даже при удовлетворительном качестве модели в силу высоких вариаций между отдельными элементами, обычно R2 не превышает 0,7. То же самое обычно имеет место и для регрессии по временным рядам, если они не имеют выраженного тренда. В макроэкономике примерами таких зависимостей являются связи относительных, удельных, темповых показателей: зависимость темпа инфляции от уровня безработицы; нормы накопления от величины процентной ставки и пр.

Какое же значение R2 можно считать удовлетворительным при оценке модели? Точную границу приемлемости R2 для всех случае сразу указать невозможно. Можно руководствоваться оценкой связи, приведенной в следующей таблице 2.

 

 

 

Шкала Чеддока

 

Таблица 2

 

 

 

 

 

 

Значения R2

0,3

(0,3-0,5]

(0,5-0,7]

(0,7-0,9]

>0,9

 

Сила связи

слабая

умеренная

заметная

высокая

весьма высокая

 

При значении равном 1 возникает функциональная связь, а при значении равном 0 – связь отсутствует. При получении значения R2 0,3 необходимо

заново провести спецификацию модели. В остальных случаях необходимо учитывать, являются ли входящие в модель переменные объемными или

26

относительными, имеют ли они временной тренд, объем выборки и пр.

Для модели множественной регрессии коэффициент детерминации является неубывающей функцией числа объясняющих переменных: добавление

новой переменной никогда не уменьшает R2 . Действительно, каждая следующая объясняющая переменная может лишь дополнить информацию, объясняющую поведение зависимой переменной. Для нейтрализации этого недостатка коэффициента детерминации вводится скорректированный коэффициент детерминации:

R

2 =1

n 1

(1 R2 )

 

(3.7).

 

 

 

kor

 

n k 1

 

 

 

 

 

 

 

 

2 R2

 

Из (3.6) очевидно, что

R

для k 1. С ростом числа переменных

 

 

 

 

 

kor

 

 

скорректированный коэффициент детерминации растет медленнее, чем обычный, т. е. он корректируется в сторону уменьшения при добавлении

объясняющих переменных. Доказано, что Rkor 2 увеличивается при добавлении

новой объясняющей переменной, только тогда, когда t – статистика больше единицы (т. е. коэффициент перед этой переменной в уравнении будет статистически значимым). Это свойство может служить критерием при добавлении в модель новых объясняющих переменных.

3.2. Понятие статистической значимости

Как уже отмечалось, построение эконометрической модели основывается на выборочных статистических данных. Параметры уравнения, коэффициенты корреляции и другие характеристики модели, определенные на основе выборочной совокупности наблюдений, будут очевидно отличаться от соответствующих величин, рассчитанных по генеральной совокупности.

Поэтому выборочные характеристики содержат ошибки, связанные с неполным охватом наблюдениями всех единиц генеральной совокупности. А это, в свою очередь, требует проверки надежности и статистической значимости параметров модели и тех характеристик, по которым оценивается ее адекватность.

Статистическая значимость результата представляет собой оцененную меру уверенности в его "истинности" (в смысле репрезентативности выборки). Для характеристики статистической значимости вводится понятие уровня статистической значимости .

- уровень представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю генеральную совокупность. Например, = 0,05 показывает, что имеется 5% вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки.

Выбор определенного уровня значимости, выше которого результаты отвергаются как ложные, является достаточно произвольным. В эконометрических исследованиях уровень =0,05 является приемлемой

27

границей статистической значимости. Результаты с уровнем 0,05

рассматриваются как высоко значимые.

Проверка статистической значимости осуществляется по схеме статистической проверки гипотез с использованием t–статистики Стьюдента.

Проверка статистических гипотез состоит из следующих этапов:

формулируется в виде основной статистической гипотезы задача исследования; выбирается альтернативная гипотеза;

выбирается статистический критерий и вычисляется фактическое значение статистического критерия;

определяется критическая область, а также критическое значение статистического критерия по соответствующей таблице теоретических распределений;

проверяется основная гипотеза на основе сравнения фактического

икритического значений критерия. В зависимости от результатов проверки основная гипотеза либо отклоняется, либо принимается.

Проверка какой-либо характеристики модели на статистическую значимость означает проверку гипотезы о том, не может ли рассматриваемая характеристика равняться нулю в генеральной совокупности.

Основная гипотеза Н0 предполагает, что исследуемая характеристика равна нулю, а альтернативная H1 - что исследуемая характеристика не равна нулю:

Н0 : U = 0

H1 : U ≠ 0

Для проверки гипотезы рассчитывается показатель tu , называемый t

статистикой: t

 

 

U 0

 

 

 

 

 

U

 

 

 

(3.8),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

 

su

 

 

 

 

 

su

 

 

 

 

 

 

 

 

 

 

Здесь su стандартная ошибка

(среднеквадратическое отклонение)

характеристики U.

Отношение (3.8) имеет t – распределение Стьюдента с (n-к-1) степенями свободы, где n число наблюдений, k число факторных переменных. Для t – распределения составлены теоретические таблицы в зависимости от выбранного уровня статистической значимости и числа степеней свободы (числа независимых параметров необходимых для определения той или иной характеристики)

Уровень статистической значимости выбирается исследователем, исходя из конкретных требований. По таблице находится теоретическое значение t

статистики с параметрами и (n-k-1)

Если расчетное значение статистики больше табличного (tU t ), то

нулевая гипотеза отклоняется и с выбранной вероятностью можно утверждать, что исследуемая характеристика является статистически значимой (т.е. в генеральной совокупности она тоже отлична от нуля с выбранной вероятностью).

Обычно при анализе качества модели проверяют значимость параметров модели и коэффициентов, по которым оценивается ее адекватность.

28

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]