Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Metodichka_lab_Ekonometria

.pdf
Скачиваний:
85
Добавлен:
13.04.2015
Размер:
29.38 Mб
Скачать

Раздел 3. Модель парной регрессии

3.1 Теоретические замечания

Для количественной оценки влияния факторного признака X на результативный признак Y по выборкам наблюдений (x1, x2 ,..., xn ) и

( y1, y2 ,..., yn ) данных признаков объема n определяют уравнение

регрессии [3].

Решение данной задачи осуществляется в несколько этапов:

1)

выполняется спецификация модели зависимости результативного

признака Y от факторного признака X ;

2)

формируются совокупности наблюдений (x1, x2 ,..., xn ) и

( y1, y2 ,..., yn ) для оценки параметров модели;

3)вычисляются оценки параметров модели (определяют выборочное уравнение регрессии);

4)выполняется проверка качества модели: точности и адекватности совокупности наблюдений;

5)проводится экономический анализ на основании эконометрической модели (прогноз, количественная оценка влияния факторов).

Предполагается, что зависимость результативного признака Y от факторного признака X описывается эконометрической моделью в виде уравнения с одной объясняющей переменной и аддитивной случайной составляющей ε следующего вида:

Y = f (X ) +ε .

(3.1)

Далее рассмотрим как выполняются пять этапов, перечисленные выше.

Первый этап. Для спецификации модели (3.1) необходимо определить явный вид функции f (X ) . Этот этап выполняется на

основании теоретических знаний о взаимосвязи между данными показателями или на основании статистического анализа при помощи выбора из возможных альтернативных вариантов.

Простейшей является линейная форма зависимости между двумя переменными

Y = a0 + a1X + ε ,

(3.2)

или покомпонентная

 

yi = a0 + a1xi +εi , i =

 

,

(3.3)

1,n

где a0 и a1 – параметры модели.

Возможны также другие формы зависимости результативного признака Y от факторного признака X в формуле (3.1)

29

f (X ) = a0ea1X – показательная, f (X ) = a0 X a1 – степенная,

f (X ) = a0 + aX1 – гиперболическая,

f (X ) = a0 + a1 ln X – логарифмическая.

После спецификации модели необходимо сформировать совокупность наблюдений, на основании которых оценить параметры модели. Рассмотрим как рассчитать оценки параметров линейной модели (3.2), т. е. построить уравнение линейной регрессии

 

yˆ = aˆ0 + aˆ1x ,

 

(3.3)

которое для отдельных значений признаков имеет вид

 

 

 

yˆi = aˆ0 + aˆ1xi , i =

 

,

 

 

 

(3.4)

 

1,n

 

ˆ

– оценка условного математического ожидания M {Y

 

 

=

xi }.

где yi

 

X

 

 

 

Отметим, что в случае, если выбрана нелинейная модель, ее легко преобразовать к линейной методом замены переменных или алгебраических преобразований (например, при помощи операции логарифмирования). После оценки параметров линейной модели нужно

определить параметры исходной модели.

 

 

 

 

 

 

Второй и третий

этапы. Формируя совокупности наблюдений

(x1, x2 ,..., xn ) и ( y1, y2 ,..., yn )

нужно обеспечить их однородность.

 

Оценить параметры модели (3.1) можно методом наименьших

квадратов (МНК) целевая функция которого имеет вид

 

 

 

 

 

 

n

 

 

2

 

n

 

 

2

 

 

 

ˆ ˆ

=

(yi

ˆ

=

(yi

ˆ

ˆ

min .

(3.5)

Q(a0,a1)

 

yi )

 

 

a0

a1xi )

 

 

 

 

i=1

 

 

 

 

i=1

 

 

 

 

 

 

Применение МНК требует выполнения условий Гаусса–Маркова для случайной составляющей εi . Также предполагается, что случайный член

εi имеет нормальное распределение вероятностей. Если случайный член

εi удовлетворяет данным условиям, то оценки aˆ0 и aˆ1 будут обладать

свойствами несмещенности, эффективности и состоятельности. Вычислить оценки aˆ0 и aˆ1 можно несколькими способами:

1)решить систему нормальных уравнений,

2)по явным формулам,

3)матричным способом.

30

Первый способ. Система нормальных уравнений является системой двух линейных уравнений с двумя неизвестными aˆ0 и aˆ1 и имеет

следующий вид:

 

 

n

n

 

 

naˆ0 + aˆ1xi = yi ,

 

 

 

i=1

i=1

(3.6)

 

n

n

 

n

aˆ0xi + aˆ1xi2

= xi yi.

 

 

i=1

i=1

 

i=1

 

Система (3.6) может быть решена методом подстановки.

Второй способ. Явные формулы для вычисления оценок aˆ0 и aˆ1 следующие

 

=

 

 

 

 

y x

 

Sy

,

 

aˆ

yx

= r

(3.7)

 

 

 

 

 

 

x2 (x )2

1

 

 

y x Sx

 

aˆ0 = y aˆ1x .

 

 

 

(3.8)

Третий способ. В матричном виде формулы для вычисления оценок aˆ0 и aˆ1 имеют вид

 

 

 

 

 

 

 

 

 

ˆ

 

 

1

 

 

 

 

 

 

 

 

 

 

 

A =(X

 

X )

 

 

(3.9)

 

 

 

 

 

 

 

 

 

 

 

X Y ,

 

 

 

 

 

 

y1

 

 

 

 

1 x1

 

 

 

 

 

 

 

 

y

2

 

 

 

 

1 x

 

 

 

 

 

aˆ

 

 

 

 

 

 

 

 

 

2

 

 

 

ˆ

0

 

 

...

 

 

 

 

......

 

 

 

где

 

 

 

, Y =

 

 

 

, X

=

 

xi

 

 

 

A = aˆ

 

 

yi

 

1

 

.

 

 

 

1

 

 

...

 

 

 

 

......

 

 

 

 

 

 

 

 

 

y

n

 

 

 

 

1 x

 

 

 

 

 

 

 

 

 

 

n×1

 

 

 

n

n×2

 

Четвертый этап. Оценка качества построенной модели осуществляется на основании значений коэффициента детерминации и

средней относительной ошибки аппроксимации. Также проверяется

значимость коэффициента детерминации, коэффициентов уравнения регрессии и определяются доверительные интервалы для коэффициентов

уравнения регрессии.

Расчетные формулы для коэффициента детерминации и средней относительной ошибки аппроксимации соответственно имеют вид

 

n

 

y )

2

 

n

 

 

 

(yi

 

ei

 

 

 

ˆ

 

 

2

 

 

R2 =

i=1

 

 

 

=1

i=1

.

(3.10)

n

 

 

 

n

 

(yi y )2

 

(yi y )2

 

 

 

i=1

 

 

 

 

i=1

 

 

31

 

n

 

yi

yˆi

 

 

 

n

 

ei

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Eср.отн. = 1n

 

 

 

 

100 % = 1n

 

 

 

100 % .

(3.11)

 

 

 

 

 

 

 

y

 

y

 

i=1

i

 

i=1

 

i

 

 

Значение коэффициента

детерминации

удовлетворяет

условию

0 R2 1 и

показывает

долю

дисперсии (колебания) результативного

признака Y ,

которая объясняется построенной моделью. Значение 1R2

характеризует долю дисперсии (колебания) результативного признака Y ,

которая приходится на факторы неучтенные в модели.

 

Чтобы

построенную

модель можно

было использовать для

экономического анализа и прогноза средняя относительная ошибка аппроксимации Eср.отн. должна быть меньше 7 %–10 % (в зависимости от

уровня модели: макро– или микроуровень).

Значимость (адекватность) модели проверяется с помощью F–

критерия Фишера, который проверяет нулевую гипотезу H0 : R2 = 0 о статистической незначимости уравнения регрессии. Для этого сравним

фактическое

Fфакт.

и критическое

F -значение критерия

Фишера

Fтабл.(α,ν1,ν2 )

при

степенях

 

свободы

ν1 = m ,

ν2 = n m 1

и уровне

значимости α . Fфакт. определяется по формуле

 

 

 

 

 

 

 

ˆ

2

 

 

r 2

 

 

 

 

 

 

 

y) / m

 

 

xy

 

 

 

Fфакт. =

( yi

 

 

=

 

(n 2) ,

(3.12)

( y

i

y)2

/(n m 1)

1 r 2

 

 

 

 

 

 

 

 

 

xy

 

где m – число регрессоров, в случае однофакторной модели m =1. Если Fрасч. > Fтабл. = Fα,m,nm1 , то уравнение статистически значимо

(с надежностью 1 α ).

Оценка статистической значимости коэффициентов регрессии и

корреляции осуществляется

с

помощью t

– критерия Стьюдента.

Расчетные значения статистик имеют вид

 

 

 

 

 

 

 

taˆ =

 

aˆ1

 

 

;

 

 

 

 

 

taˆ =

 

 

aˆ0

 

 

;

(3.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Saˆ

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

0

 

Saˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

Saˆ

=

 

Se

xi2

 

;

 

 

 

 

 

 

 

(3.14)

 

 

 

nσx

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Saˆ

=

 

 

 

Se

 

,

 

 

 

 

 

 

 

 

 

(3.15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

n σx

 

 

 

 

 

 

 

 

 

 

2

 

 

 

(y

yx )

2

 

 

 

 

 

 

 

 

 

Se

=

 

 

 

 

ˆ

.

 

 

 

 

 

 

(3.16)

 

 

 

 

n

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32

Если taˆ j > tтабл. =tα,nm1 , то коэффициент aˆ j статистически значим

(с надежностью 1 α ).

Для расчета доверительного интервала определяем предельную ошибку для каждого параметра

a

=tтабл. Saˆ ,

a

=tтабл. Saˆ .

(3.17)

0

0

1

1

 

Формулы для расчета доверительных интервалов имеют следующий

вид:

 

aˆ0

− ∆a

< a0

< aˆ0 + ∆a ,

 

(3.18)

 

 

0

 

0

 

 

 

aˆ1

− ∆a

< a1 < aˆ1 + ∆a .

 

(3.19)

 

 

1

 

1

 

 

Пятый

этап.

Для

нахождения

прогнозного

значения

результативного

признака

yˆ pr

необходимо

прогнозное

значение

факторного признака x pr

подставить в уравнение регрессии (3.3)

 

 

yˆ pr = aˆ0 + aˆ1xpr .

 

(3.20)

Оценим точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. Оценка ошибки прогноза (при доверительной вероятности 1 α ) рассчитывается по формуле

 

yˆ

pr

= t

S

e

 

1+ 1

+

(xpr x)2

.

(3.21)

 

 

 

 

α,табл.

 

 

n

 

 

σ2

 

 

 

 

 

 

 

 

 

 

 

n x

 

Доверительный

интервал (с

надежностью

1 α ) для

прогнозных

значений имеет вид

(yˆ pr − ∆yˆ pr , yˆ pr + ∆yˆ pr ).

 

 

 

 

(3.22)

3.2 Организация данных и расчетов на листе MS Excel

Рассмотрим пример построения и анализа модели парной регрессии по пунктам 1) – 8) задания лабораторной работы 3 (исходные данные примера в табл. 3.1).

Таблица 3.1

Выборочные данные наблюдений статистических признаков: объем реализации Y и площадь магазина X

Магазин

1

2

3

4

5

6

7

8

9

10

Показатели

 

 

 

 

 

 

 

 

 

 

Y, млн грн

4,7

4,6

4,0

4,7

5,3

3,4

3,5

3,4

4,4

3,4

 

 

 

 

 

 

 

 

 

 

 

X, тыс. м2

2,8

2,5

2,2

3,1

3,3

2,0

2,1

1,7

2,3

1,7

33

Для выполнения лабораторной работы 3 нужно создать новую рабочую книгу MS Excel, в ячейки которой ввести исходные данные задачи: значения показателей объема реализации Y и площади магазина X (ячейки B26 : C35, рис. 3.1). Организация расчетов на листе MS Excel по пунктам 1) 6) лабораторной работы 3 при помощи таблицы вспомогательных расчетов показана на рисунке 3.1. Реализация формул в соответствующих ячейках описана в таблице 3.2.

Рис. 3.1 – Расчеты лабораторной работы 3

 

 

 

 

 

 

Таблица 3.2

 

Реализация в MS Excel формул на рис. 3.1

 

 

 

 

 

 

 

 

Адреса

Формула

Реализация в MS Excel

 

ячеек

 

 

 

 

 

 

 

 

1

 

2

 

3

 

B36 : H 36

 

xi

B36 = СУММ(B26 : B35)

 

B37 : H 37

 

 

n

i

B37 = СРЗНАЧ(B26 : B35)

 

x = 1

x

 

 

 

1

n

 

 

 

 

B38 , C38

DX =

(xi x)2

B38 = ДИСПР(B26 : B35)

 

 

 

 

 

n i=1

 

 

B39

r XY =

cov(X ,Y )

 

= КОРРЕЛ(B26 : B35;C26 : C35)

 

σ(X ) σ(Y )

 

 

 

 

 

34

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Продолжение таблицы 3.2

1

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x y

 

 

 

 

 

B40

aˆ1 =

 

 

xy

 

 

 

= (D37–C37*B37)/

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(E37–C37^2)

 

 

 

x

2 (x)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B41

 

aˆ0 = y aˆ1x

 

 

 

= B37–B40*C37

 

 

 

 

1

 

 

 

n

 

 

ei

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H 37

A =

 

 

 

 

 

 

 

 

 

 

 

100%

= СРЗНАЧ(H26 : H35)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i =1 yi

 

 

 

 

 

 

 

 

 

B43

 

 

 

n

 

 

 

 

 

 

 

 

 

 

n

 

y)2

= 1– (G37/B38)

 

R2 =1e2

( y

i

 

 

 

 

 

i =1

 

 

i

 

 

 

 

 

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r2

 

 

 

 

 

 

 

= B39*((A35 – 2)/(1 –

 

E39

tфакт. =

 

 

 

 

 

 

 

 

 

 

yx

 

 

(n 2)

 

 

 

 

 

 

 

 

 

 

–B39^2))^0,5

 

 

 

 

 

 

1r2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yx

 

 

 

 

 

E40

tтабл. (α, v = n 2)

= СТЬЮДРАСПОБР(0,05;8)

 

 

2

 

 

 

 

 

(y

 

 

 

yx )

2

 

 

 

H 39

Se

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

= G36/(A35 – 2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

S 2 x

2

 

= КОРЕНЬ

 

H 40

Saˆ0

 

 

= n

 

 

 

 

 

 

e

 

 

 

i

((H39*E36)/C38)/A35

 

 

 

 

 

 

 

 

 

σ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

H 41

Saˆ

 

 

 

 

=

 

 

 

 

 

Se2

 

 

 

= КОРЕНЬ(H39/(A35*C38))

 

 

 

 

 

 

 

nσx2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

E41

taˆ0 = aˆ0

Saˆ0

 

 

 

= B41/H40

 

E42

taˆ1 = aˆ1

Saˆ1

 

 

 

= B40/H41

 

E43

 

 

 

 

 

 

 

 

 

 

 

 

 

R2

 

 

 

 

 

 

 

= (B43*(A35 – 2))/(1 – B43)

 

Fфакт. =

1R2 (n 2)

 

 

 

 

E44

Fтабл.(α, v1 = m, v2

 

= n m 1)

= FРАСПОБР(0,05;1;8)

 

G43

a0

 

= tтабл.

Saˆ

 

 

 

= E40*H40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

G44

a1 = tтабл.

Saˆ

 

 

 

= E40*H41

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

F 46

 

 

 

aˆ0 − ∆a0

 

 

 

= B41 – H43

 

H 46

 

 

 

aˆ0 + ∆a0

 

 

 

= B41 + H43

 

F 47

 

 

 

 

aˆ1 − ∆a1

 

 

 

= B40 – H44

 

H 47

 

 

 

 

aˆ1 + ∆a1

 

 

 

= B40 + H44

 

B45

 

 

xpr

 

 

=1,06x

 

 

 

= 1,06*C37

 

B46

yˆ pr

= aˆ0 + aˆ1xpr

= B41 + B40*B45

 

 

yˆ pr = tтабл. Se

 

 

 

 

 

 

1

 

(xpr x )2

= E40*КОРЕНЬ(H39*

 

B47

 

 

1+ n +

 

 

n σx2

*(1+1/A35+(B45–

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

–C37)^2/(A35*C38)))

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

35

 

 

Продолжение таблицы 3.2

1

2

3

 

A48

yˆ pr − ∆pr

= B46 – B47

 

C48

yˆ pr + ∆pr

= B46 + B47

 

Для построения корреляционного поля X и Y и прямой выборочной регрессии воспользуемся «Мастер диаграмм» в Excel. Для этого во вкладке «Стандартные» выберем пункт «Точечная», затем «Далее»;

сделаем ссылки на массивы X и Y, затем «Далее». Затем можно сделать необходимые подписи на диаграмме. После чего выбрать «Далее»; «Готово». Для того чтобы на корреляционное поле добавить линию тренда, необходимо сделать двойной щелчок на точке корреляционного поля и в открывшемся окне выбрать «Добавить линию тренда»; «Параметры»; «Показать уравнение на диаграмме»; «ОК». После этих действий получим график, такой как на рис. 3.2.

Y

6,0

 

 

 

 

 

5,5

 

 

y = 1,1562x + 1,3927

 

 

 

R2 = 0,8926

 

 

 

 

 

5,0

 

 

 

 

 

4,5

 

 

 

 

 

4,0

 

 

 

 

 

3,5

 

 

 

 

 

3,0

 

 

 

 

 

1,2

1,7

2,2

2,7

3,2

3,7

 

 

 

X

 

 

Рис. 3.2 – Результат построения корреляционного поля и прямой выборочной линейной регрессии

Анализируя корреляционное поле (рис. 3.2) можно строить как линейную модель, так и нелинейную, что будет рассмотрено ниже.

Рассмотрим выполнение пункта 1) лабораторной работы 3 третьим способом – с помощью матричных преобразований. Для этого перейдем на новый лист MS Excel (рис. 3.3) и введем значения элементов матриц X и Y , которые согласно формуле (3.9) имеют следующую структуру: в первом столбце матрицы X все элементы равны 1, во втором столбце элементы равны значениям признака X , Y – вектор–столбец, элементы которого равны значениям результативного признака Y . После выполнения расчетов по формуле (3.9) с помощью функции программы

36

MS Excel (табл. 3.2) в последовательности, как указано в таблице, в

ячейках

F18: F19 получим оценки параметров модели

матричным

способом

и соответствующее уравнение регрессии

примет вид

yˆ =1,39 +1,16x .

 

Результаты, полученные в пунктах 1) – 6) с помощью табличных преобразований и операций с матрицами (второй и третий способы) можно получить с помощью надстройки «Анализ данных» программы MS Excel.

Используя инструменты надстройки «Анализ данных» (функцию – регрессия) программы MS Excel получим отчет регрессионного анализа зависимости объема реализации Y от площади магазина X .

Рис. 3.3 – Расчет параметров модели лабораторной работы 3 в матричном виде

 

 

 

 

 

Таблица 3.2

 

Реализация в MS Excel формул на рис. 3.3

 

 

 

 

Адреса ячеек

Формула

Реализация в MS Excel

B12 : K13

X

 

= ТРАНСП(B1 : C10)

 

B15: C16

 

 

= МУМНОЖ(B12 : K13; B1 : C10)

 

 

 

X X

 

 

 

F15

: G16

 

1

= МОБР(B15:C16)

 

(X X )

 

 

B18

: B19

 

 

= МУМНОЖ(B12 : K13; F1 : F10)

 

 

 

X Y

 

 

 

F18

: F19

1

= МУМНОЖ(F15 : G16; B18 : B19)

 

(X X )

 

X Y

 

37

Для этого во вкладке «Сервис» выберем пункт «Анализ данных», в котором в свою очередь выберем функцию «Регрессия». После этого появится диалоговое окно, в котором нужно ввести ссылки на входные интервалы, выделяя их последовательно курсором, а также установить другие необходимые параметры задачи (например, «Вывод остатков») и нажать «ОК». После этого появится отчет, как представлен на рис. 3.3.

В отчете есть все необходимые результаты для пунктов 1) – 6) (табл. 3.3) за исключением средней относительной ошибки аппроксимации. Но, используя отчет «Вывод остатка», ее легко рассчитать на этой же странице

(рис. 3.4, табл. 3.4).

Рис. 3.4 – Результаты регрессионного анализа зависимости (Y ) от ( X )

38

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]