Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

эконометрика с косяками

.pdf
Скачиваний:
8
Добавлен:
03.05.2015
Размер:
1.55 Mб
Скачать
S 2
Y / X x

Очевидно, что

0 R2 1

Коэффициент детерминации будет равен единице, если остаточная

дисперсия равна нулю, т.е. если точки корреляционного поля лежат на линии регрессии.

Таким образом, чем ближе коэффициент детерминации к единице, тем лучше качество подгонки модели.

Для определения статистической значимости коэффициента детерминации R2 используется F-

статистика Фишера:

F R2 (n 2) ,

1 R2

где n – количество пар переменных, используемых для анализа.

Величина имеет распределение Фишера с v1 1, v2 n 2 степенями свободы. Вычисленное значение критерия F сравнивается с критическим значением, определенным по таблицам распределения Фишера. Если F Fкр , то R2 считается незначимым, он не отличим от нуля, если F Fкр ,

то R2 считается значимым, и уравнение регрессии можно использовать для объяснения изменения переменной y под влиянием переменной x.

Типичные нелинейные регрессионные модели, которые могут быть сведены к линейным. Полиномиальные модели. Что

21

такое коэффициенты, значимо отличающиеся от нуля?

Стандартные нелинейные модели

Может оказаться так, что искать функцию регрессии в виде линейной функции будет неразумно (облачко точек на корреляционном поле плохо укладывается на прямую – например так:).

120

100

80

Y

60

40

20

0

5

10

15

X

Для таких данных естественно искать регрессионную модель в виде:

22

ya0 a1x a2 x2

Вдругих случаях можно использовать одну из моделей, которые сводятся к линейной модели подходящей заменой переменных.

.

Если нелинейный характер тренда очевиден, то может подойти одна из следующих моделей.

1. Полиномиальная:

y a0 a1x a2 x2 a3 x3 ... an xn

где значение степени полинома п в практических задачах редко превышает 3.

2. Логарифмическая.

ya0 a1 ln(x)

3.Обратная по x.

ya0 a1 1x

23

Y

0.4

0.3

0.2

0.1

0.0

0

5

10

15

X

4.Обратная по y.

y

 

1

 

 

a

a x

0

1

5. Логистическая.

y

1

 

 

1 ea0 a1x

Набор таких стандартных нелинейностей в пакете StatGraphics (особенно в новых версия) довольно велик.

При выборе регрессионной модели, кроме качества подгонки модели, обязательно следует учитывать значимость найденных коэффициентов.

24

Пусть корреляционное поле содержит n точек,

Тогда из анализа известно, что можно подобрать такой многочлен n -1 порядка, график которого будет проходить в точности через наши точки.

(Как называется такой многочлен?).

Таким образом, этот многочлен дает нам полиномиальную модель, для которой остаточная дисперсия будет равна нулю.

(а чему равен коэффициент детерминации ?)

Является ли эта модель тем идеалом, к которому мы должны стремиться? Нет, поскольку при малых изменениях данных, коэффициенты этой модели, как правило, меняются очень сильно (могут, например, сменить знак).

В статистике такие коэффициенты и называют незначимыми ( незначимо отличающимися от нуля). Как выявить незначимые коэффициенты?

Значимость коэффициентов регрессии

25

Н0 -то коэффициент

Для проверки значимости найденных коэффициентов регрессии в Statgaphics для каждого коэффициента проверяется своя пара гипотез, например :

Н0 : i 0 H1 : i 0

Если мы отвергаем bi - значим.

Эти гипотезы проверяются почти также, как в курсе статистики проверялись гипотезы о математических ожиданиях.

Однако в статистических пакетах никаких таблиц критических значений нет, поэтому в них принят другой подход:

Для того, чтобы отвергнуть гипотезу Н0 ,

следует посмотреть на величину Pval

(Pval=P(Y>Yнабл))

-эта величина обычно наз.уровень значимости),

соответствующую данному коэффициенту.

Если Pval мало ( по умолчаниюменьше 0,05), то основная гипотеза отвергается и

соответствующий коэффициент bi значим.

ЗАМЕЧАНИЕ:

26

В статистических пакетах такой подход принят при проверке любых гипотез:

вычисляется Pval=P(Y>Yнабл)

и если Pval< , то Н0-отвергается.

При использовании других пакетов вместо Pval может быть Prob или просто P.

Запустите Statgraphics.

Пример 1

Разбегание галактик. Оценка постоянной Хаббла Лаб. раб.№8, с. 62 Пусть Y–скорость разбегания,

X–расстояние, Y 0 1 X

НАЙДИТЕ оценки для коэффициентов:

b0 _____, Pval _____? b1 _____, Pval _____?

Какие коэффициенты значимы?

R2 _____?

Что можно сказать о качестве подгонки модели?

Чему равна постоянная Хаббла? Каков ее содержательный смысл?

27

Пример 2 ( файл KOBB_DUG.sf )

Классическая модель Кобба-Дугласа.

Y AK L1

Y – объем выпуска; K, L – затраты капитала и труда; А, – параметры модели.

Y A K LL

Y

 

 

 

K

 

A

 

 

L

 

 

L

log(Y / L) log( A) log(K / L)

y 0 1x

НАЙДИТЕ оценки коэффициентов :

b0 log( A) _____, Pval _____?

b1 _____, Pval _____?

R2 _____?

Какие коэффициенты значимы? Каково качество подгонки?

_________________________________________

28

Обобщенная модель Кобба-Дугласа.

Y AK L

Здесь – три неизвестных параметра:

А, ,

log(Y ) log(A) log(K) log(L)

Y 0 1 X1 2 X 2

Этоуже множественная линейная регрессионная модель.

Недостаток коэффициента детерминации при использовании множественных регрессионных моделей :

R2 всегда возрастает при добавлении независимых переменных, поэтому для выбора между несколькими регрессионными

уравнениями нельзя полагаться на R2 .

Исправленный коэффициент детерминации:

Попыткой устранить эффект, связанный с ростом R2 при увеличении числа регрессоров, является

коррекция R2 на число независимых переменных – (наложение "штрафа" за увеличение числа независимых переменных)

29

 

 

 

S 2

 

 

 

 

 

 

Y / X x

(n k )

 

R2

1

 

 

 

 

 

 

 

 

adj

 

S 2

 

 

 

.

 

 

 

 

 

 

 

Y

(n 1)

 

 

 

 

 

 

 

 

 

 

 

R2

1

n k

(1

R2 )

 

 

 

 

adj

 

n k 1

 

 

 

 

 

 

( k –число независимых переменных, n–число наблюдений ).

Такой коэффициент уже не всегда будет увеличиваться при увеличении числа независимых переменных.

НАЙДИТЕ:

b0 log( A) _____, Pval _____? b1 _____, Pval _____?

b2 _____, Pval _____?

Какие из этих коэффициентов значимы?

Radj2 _____?

Можно ли считать, что обобщенная модель лучше предыдущей?

30