Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
13-02-2015_10-29-17 / Множественная регрессия-обзорная лекция новая.ppt
Скачиваний:
45
Добавлен:
12.03.2015
Размер:
1.02 Mб
Скачать

Показатель множественной корреляции

 

 

 

 

 

 

 

 

 

y y

 

 

R 1

 

ˆ

2

33

 

 

y y 2

 

 

 

 

 

p

34

R j ryx j

 

j 1

 

Показатель частной корреляции ryx j x1x2 ...x j 1...x j 1...xp

 

 

 

rx x

j

yx x

2

...x

...x

 

 

...x

j 1

...x

j 1

...x

p

 

 

 

 

 

 

 

i

 

1

 

i 1

i 1

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

 

ryx j x1x2 ...xp 1

ryxp x1x2

...xp 1

rx j xp x1x2 ...xp 1

46

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

rx2j xp x1x2 ...xp 1

yx

j

x x

2

...x

p

 

 

 

 

 

1

ryx2

p x1x2 ...xp 1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для двухфакторной модели

ryx1 x2

 

 

 

ryx

 

ryx

2

rx x

2

 

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 ryx2 1 rx2x

 

 

 

 

 

 

 

 

2

 

 

1

 

2

 

 

ryx2 x1

 

 

ryx

 

ryx

rx x

 

 

 

 

 

1 ryx2 1 rx2x

 

 

 

 

 

 

 

2

 

1

1

 

2

 

 

 

 

 

 

 

 

 

 

1

 

 

1

2

 

 

Процедуры пошагового отбора переменных

процедура последовательного присоединения

процедура последовательного присоединения – удаления

процедура последовательного удаления

Процедура «всех возможных регрессий»:

Для заданного значения k (k=1,2,…,p-1) проводится полный перебор всех возможных комбинаций из k факторов (которые отобраны из исходного набора x1, x2,

…,xp). Определяются такие переменные

xi1 , xi2 , , xik

для которых коэффициент детерминации с результатом был бы максимальным.

Таким образом:

на первом шаге (k=1) находим один наиболее

информативный фактор (при условии, что в модель можно включать только один фактор из первоначального набора)

на втором шаге (k=2) определяется уже наиболее информативная пара факторов (из первоначального набора), имеющая наиболее тесную связь с результатом

на третьем шаге (k=3) будет отобрана наиболее информативная тройка факторов

и т.д.

Критерий останова (завершения) процедуры:

выбирается такое оптимальное число k0 факторов, на котором нижняя доверительная граница

коэффициента детерминации достигает своего максимума. Эта граница вычисляется по формуле:

 

 

 

 

 

 

 

Rmin2

 

2 k 2

2k n k 1

 

1 R2 k ,

R

n 1 n2 1

 

 

 

 

 

 

Гетероскедастичность

-тест ранговой корреляции Спирмена

r

1 6 di2

(53)

 

 

 

 

 

 

 

x,e

 

 

 

 

n n2 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H0 : rx,e 0

H1

: rx,e 0

t

rx,e

n 2

 

(54)

 

 

 

 

 

1 r2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x,e

 

 

 

 

t

 

tòàáë ; n 2

Н0 отклоняется, гетероскедас-

 

 

 

 

 

 

 

 

 

 

тичность имеет место

 

 

-тест Голдфелда-Квандта

i2 2 x2ji ,

i

 

 

 

 

1, n

 

 

k

 

 

 

 

 

 

n

s1 ei2

 

s3 ei2

 

i 1

 

 

 

 

 

 

i n k 1

F

s3

/ k p 1

 

s3

(53)

 

/ k p 1

 

íŕáë

 

s1

 

 

s1

 

 

 

 

 

 

H0 : 12

22

... n2 ,

Fнабл Fкр Fтабл ; k p 1; k p 1

-метод «взвешенных наименьших квадратов»

1.Дисперсии известны

 

yi a bxi i

(57)

yi

a

1

b

xi

 

i

(58)

i

i

 

i

 

i

 

 

y*

yi

;

x*

 

xi

;

z

 

 

1

;

v

 

i

; (59)

 

 

 

 

 

i

i

 

i

i

 

i

i

i

i

y* az

i

bx* v

(60)

 

 

 

 

 

 

i

 

i

 

i