Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УМК Эконометрика.pdf
Скачиваний:
67
Добавлен:
02.04.2015
Размер:
1.69 Mб
Скачать

133

4.Блок контроля освоения дисциплины

4.1.Задание на контрольную работу и методические указания к ее

выполнению

Задание на контрольную работу

В контрольной работе студенту необходимо выполнить одну задачу, выбрав

параметры модели по последней цифре шифра.

 

 

 

 

 

 

Варианты контрольного задания.

 

 

1

a0=100;

a1=25;

σ=30

6

a0=150;

a1=26;

σ=40

2

a0=110;

a1=30;

σ=35

7

a0=160;

a1=271;

σ=45

3

a0=130;

a1=35;

σ=40

8

a0=160;

a1=28;

σ=35

4

a0=140;

a1=40;

σ=35

9

a0=170;

a1=29;

σ=40

5

a0=145;

a1=45;

σ=35

10 a0=180;

a1=30;

σ=45

В контрольном задании требуется:

1.Смоделировать исходные данные.

2.Найти коэффициенты регрессии методом наименьших квадратов.

3.Проверить гипотезу о заданном в контрольном задании значении a1 средних удельных затрат.

4.Построить доверительный интервал для значения a1 средних удельных затрат.

5.Найти коэффициент детерминации и пояснить его смысл.

6.Построить доверительный интервал для прогноза фактических затрат при объеме продаж x0 = 6,5.

Методические указания к выполнению контрольной работы

1. Общие методические указания

Для выполнения контрольной работы необходимо знать основные предположения и цели эконометрического моделирования. Прежде всего следует знать, что для эконометрического анализа необходимо выделить две группы экономических показателей: группу результирующих признаков и

134

группу объясняющих их факторов. Например, пусть y обозначает затраты на реализацию x1 единиц первой продукции и x2 единиц второй продукции. Здесь результирующим признаком можно считать затраты на реализацию, а объясняющими их факторами – объемы продаж обоих видов продукции. Следует сделать предположение о виде зависимости результирующих признаков от объясняющих их факторов. Предположим, что затраты y линейно зависят от объемов продаж x1 и x2

y=a0 +a1 x1+a2 x2 +u.

(4.1)

Соотношение (4.1) называют уравнением эконометрической

модели. В

этом уравнении случайная величина u обозначает нормально распределенную случайную величину с математическим ожиданием 0 и дисперсией σ2. Числа a0, a1 , a2 , σ называют параметрами эконометрической модели.

Задача эконометрического анализа состоит в определении приближенных значений неизвестных параметров a0, a1, a2, σ, т. е. в определении значений b0, b1, b2, s, которые можно принять в качестве оценок a0, a1, a2, σ. Это означает построение линейного уравнения регрессии:

yпр=b0 +b1 x1+b2 x2 .

(4.2)

Числа b0, b1, b2 называют коэффициентами регрессии.

Для определения уравнения (4.2) необходимо располагать некоторыми исходными данными о зависимости затрат от объемов реализуемой продукции. Пусть такие исходные данные состоят из n наблюдений и составляют табл. 4.1.

 

 

 

Таблица 4.1

 

 

 

 

Наблюдения

y

x1

x2

 

 

 

 

1

y1

x 11

x 12

 

 

 

 

2

y2

x 21

x 22

 

 

 

 

 

 

 

 

n

yn

x n1

x n2

135

Первая строка означает, что в первом наблюдении было реализовано x11 единиц первой продукции и x12 – второй, а затраты составили y1 у. е. Во второй строке стоят аналогичные данные для второго наблюдения и т. п.

Кроме построения уравнения регрессии в эконометрическом анализе проверяется качество этого уравнения. Следует заметить, что уравнение регрессии используется для прогнозирования результирующего признака. Для “плохих“ уравнений регрессии получают и “плохие“ прогнозы. Поэтому задача проверки качества уравнения регрессии является важной и наиболее сложной задачей эконометрики.

Заметим, что уравнение регрессии (4.2) называется уравнением множественной регрессии. Если объясняющий фактор один, то регрессию называют парной. В этом случае уравнение модели (4.1), связывающее затраты и объем продаж, принимает вид

y=a0 +a1 x +u,

(4.3)

иформулы для коэффициентов регрессии можно записать в явном виде.

Вследующем ниже примере рассматриваются основные этапы эконометрического моделирования.

2. Пример выполнения контрольной работы

Решим пример контрольного задания для следующих значений параметров моделирования: a0=200; a1=30; σ=50.

Моделирование исходных данных

Пусть x обозначает объем продаж некоторого продукта (в тысячах единиц), а y фактические затраты на реализацию этого объема (в у. е.). Здесь объем продаж x будем считать фактором, объясняющим фактические затраты y. Допустим, что уравнение

y=200+30x+u

(4.4)

задает зависимость фактических затрат y от объема продаж x. Случайная величина u распределена нормально с математическим ожиданием 0 и

136

стандартным отклонением σ= 50. Из (4.4) следует, что фактические затраты y складываются из средних затрат

yср=200+30x

(4.5)

и отклонений u фактических затрат от средних затрат. Таким образом, из (4.4) следует, что для фактических затрат y имеет место равенство

y=yср+u.

(4.6)

Для получения исходных данных будем моделировать

уравнение (4.6)

последовательно для объема продаж x = 1,2..,10. При заданном объеме продаж x средние затраты вычисляем по формуле (4.5), а значения u отклонений фактических затрат от средних будем моделировать с помощью таблицы случайных чисел, распределенных нормально с математическим ожиданием 0 и дисперсией 1, следующим образом. Из таблицы А приложения выбираем любые десять значений (например, первые десять значений второго столбца). Обозначим их zi и поместим в первый столбец табл. 4.1. По выбранным значениям zi вычислим отклонения от средних затрат ui по формуле

ui=σ zi..

В нашем примере σ =50. Эти значения составят второй столбец табл. 4.2. В третий и четвертый столбцы таблицы поместим объемы продаж xi и средние затраты yiпр, вычисленные по формуле (4.5). Тогда фактические затраты получаются, согласно формуле (4.6), сложением средних затрат из столбца четыре с отклонениями от них из второго столбца. Фактические затраты помещены в пятый столбец табл. 4.2. Для примера получим фактические затраты при объеме продаж x=1. Из (4.6) следует, что фактические затраты в первом наблюдении равны

y1 =yср+u1=230+27,3=257,3.

Заметим, что значение 27,3 означает, что фактические затраты превысили средние затраты на 27,3 у. е. Аналогично вычисляются фактические затраты y2. Во втором наблюдении при x=2

y2= yср+u2=260+(-54,15)=205,85.

137

В этом случае фактические затраты оказались меньше средних на 54,15 у.е.

Продолжая моделирование аналогичным образом для x=3,4 ,10, построим исходные данные для десяти наблюдений.

Метод наименьших квадратов

Рассчитаем теперь коэффициенты регрессии по формулам

 

 

 

 

n

 

n

n

 

 

nxi yi xi yi

b =

 

 

1

 

1

 

i

,

 

 

 

 

 

 

 

 

1

 

 

 

n

 

 

 

n

 

2

 

 

 

 

 

 

 

 

 

 

nx2

x

 

 

 

 

 

1

i

 

1

i

 

 

 

1

n

 

 

1

n

 

 

b

=

 

 

y

b

 

 

x .

 

n

 

 

0

 

 

1

i

1 n

1

i

Для этого необходимо предварительно вычислить xiyi, xi2, yi2, заполнить шестой, седьмой и восьмой столбцы таблицы, а затем найти сумму и среднее арифметическое этих столбцов. Тогда коэффициенты регрессии будут равны

b = 225583,5 55 ×3631,75

= 25837,25 =31,318, b0=363,175-31,318×5.5=190,927.

1

3850

552

825

 

Таким образом, уравнение регрессии имеет вид

yпр=190,927+31,318x. (4.7)

Таблица 4.2

zi

ui=50×zi

xi

yiср=200+30xi

yi=yср+ui

xiyi

xi2

yi2

yiпр

ei

 

 

 

 

 

 

 

 

 

 

0,546

27,30

1

230

257,30

257,30

1

66203,29

222,24

35,06

 

 

 

 

 

 

 

 

 

 

-1,083

-54,15

2

260

205,85

411,70

4

42374,22

253,56

-47,71

 

 

 

 

 

 

 

 

 

 

-0,633

-31,65

3

290

258,35

775,05

9

66744,72

284,88

-26,53

 

 

 

 

 

 

 

 

 

 

-0,799

-39,95

4

320

280,05

1120,20

16

78428,0

316,20

-36,15

 

 

 

 

 

 

 

 

 

 

0,464

23,20

5

350

373,20

1866,00

25

139278,24

347,52

25,68

 

 

 

 

 

 

 

 

 

 

2,431

121,55

6

380

501,55

3009,30

36

251552,40

378,83

122,72

 

 

 

 

 

 

 

 

 

 

-0,511

-25,55

7

410

384,45

2691,15

49

147801,80

410,15

-25,70

 

 

 

 

 

 

 

 

 

 

-0,637

-31,85

8

440

408,15

3265,20

64

166586,42

441,47

-33,32

 

 

 

 

 

 

 

 

 

 

-0,079

-3,95

9

470

466,05

4194,45

81

217202,60

472,79

-6,74

 

 

 

 

 

 

 

 

 

 

-0,064

-3,20

10

500

496,80

4968,00

100

246810,24

504,11

-7,31

 

 

 

 

 

 

 

 

 

 

Сумма

 

55

 

3631,75

22558,35

385

1422981,95

 

 

 

 

 

 

 

 

 

 

 

Среднее

5,5

 

363,18

2255,84

38,50

142298,19

 

 

 

 

 

 

 

 

 

 

 

 

138

Уравнение регрессии (4.7) позволяет вычислить прогноз средних затрат yср(x) при любом объеме продаж x. При x=1 средние затраты составят

y(1)= 230 у.е.,

а их прогноз

yпр(1)=190,927+31,318×1=222,24 у. е.

(При этом по исходным данным фактические затраты составляли 257,3 у.е.) Расхождение между фактическими и прогнозируемыми затратами называют остатками ei. При x=1 остаток составит величину

e1=y1-yпр(1)=257,3-222,24= 35,06.

Все значения yiпр и остатки ei помещены в двух последних столбцах табл. 4.2. Ниже построен график линии регрессии и точками отмечены исходные данные.

600,00

 

 

 

y = 31,318x + 190,93

 

 

 

 

500,00

 

 

 

 

 

 

400,00

 

 

 

 

 

 

300,00

 

 

 

 

 

 

200,00

 

 

 

 

 

 

100,00

 

 

 

 

 

 

0,00

 

 

 

 

 

 

0

2

4

6

8

10

12

Для дисперсии σ2 найдем ее оценку s2 по формуле

 

s2 =

1

 

e2

=

1

{(35,06)2 +(47,71)2 +L+(7,31)2

}=2888,04.

 

 

 

n 2

i

8

 

 

 

 

 

 

Тогда стандартная ошибка s =

2888,04 =53,74.

 

Теперь можно

сравнить

параметры уравнения

модели (4.4) с

коэффициентами уравнения регрессии (4.7) и стандартное отклонение σ со стандартной ошибкой s:

параметр a0=200, а его оценка b0=190,927, параметр a1=30, а его оценка b1=31,318,

параметр σ=50, а его оценка s=53,74.

139

В нашем примере сравнение показывает относительную близость параметров и их оценок. Используя предположение о нормальном распределении отклонений u фактических затрат от средних, можно оценить степень отклонения оценок от параметров.

Проверка гипотез о значении средних удельных затрат

Из процесса моделирования фактических затрат следует, что они содержат случайные величины. Следовательно, коэффициенты регрессии, рассчитанные по фактическим затратам, являются также случайными величинами. Можно доказать, что коэффициент регрессии b1 имеет математическое ожидание a1 и стандартное отклонение

σ

 

 

,

 

 

 

(4.8)

 

n D(x)

 

 

 

где D(x) обозначает дисперсию величины x

 

 

 

 

D(x)=

1

n

 

1

n

2

 

xi2

 

xi .

n

 

 

 

1

 

n

1

 

Заменяя в формуле (4.8) величину σ на ее оценку s, получаем формулу для

стандартной ошибки коэффициента b1 =31,318

 

 

 

s(b )=

s

 

=

 

53,74

 

=

53,74

= 5,917 .

nD(x)

10 (38,5 5,52 )

 

1

 

82,5

 

 

 

 

Экономически коэффициент

a1=30

означает

средние

удельные затраты

(средние затраты на реализацию одной единицы продукции), а коэффициент регрессии b1=31,318 – приближенное значение средних удельных затрат.

Проверим статистическую гипотезу о том, что отклонение коэффициента регрессии b1=31,318 от значения a1=30 незначительно. Сформулируем две взаимоисключающих гипотезы:

нулевая гипотеза H0: a1=30;

альтернативная гипотеза H1: a130.

140

Нулевая гипотеза H0 означает, что расхождение между оценкой средних удельных затрат b1=31,318 и точным значением средних удельных затрат a1=30 незначительно.

Возьмем уровень значимости α=0,05, т. е. при принятии гипотез допускаем 5 % ошибочных решений. По табл. В приложения квантилей t-распределения при числе степеней свободы n-2=8 найдем критическое значение t 0кр,05 (8)=2.306.

Это значение определяет границу критической области, в которой нулевая гипотеза H0 отвергается. Построим критическую область.

 

 

 

 

 

 

–2.306

 

 

 

2.306

 

 

 

 

 

 

 

 

Для сравнения

 

значений

b1

и a1

найдем

 

фактическое

значение

t-распределения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

=

b1 a1

=

31,318 30

= 0,2227 .

 

 

 

 

 

 

 

 

 

 

5,917

 

 

 

 

 

 

 

 

 

 

факт

 

s(b )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

Сформулируем правило принятия гипотезы H0: если фактическое значение

t-распределения удовлетворяет неравенству

 

tфат

 

> tкритα

,

то

принимается

 

 

альтернативная гипотеза H1, если же выполняется противоположное

неравенство

 

tфат

 

< tкритα

, то

коэффициент регрессии

b1

не противоречит

 

 

гипотезе H0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как выполняется неравенство |tфакт|=0,2227< tα

(8)

=2.306, то гипотеза

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

крит

 

 

 

H0 принимается.

Это

означает,

что

коэффициент

регрессии b1=31,318

незначительно отличается от a1=30 .

Проверим гипотезу о том, что среднее значение удельных затрат a1=31. Сформулируем две взаимоисключающих гипотезы :

нулевая гипотеза H0: a1=31

альтернативная гипотеза H1: a131 .

 

 

 

 

 

 

141

 

 

Для

сравнения

значений

b1 и

a1=31 найдем фактическое

значение

 

 

 

 

 

 

 

 

t-распределения

 

 

 

 

 

 

 

 

t

 

=

b1 a1

=

31,318 31

= 0,054.

 

факт

s(b )

5,917

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

Так как выполняется неравенство |tфакт|=0,05<tкритα (8)=2,306, то гипотеза H0

принимается. Это означает, что коэффициент регрессии b1=31,318 не противоречит гипотезе, что средние удельные затраты a1=31.

Таким образом, коэффициент регрессии b1=31,318 не противоречит как гипотезе a1=30, так и гипотезе a1=31.

Построение доверительного интервала для средних удельных затрат

Найдем теперь все гипотезы о средних удельных затратах a1, которые не противоречат найденному коэффициенту регрессии b1=31,318. Сформулируем две гипотезы:

нулевая гипотеза H0: a1,

альтернативная гипотеза H1: a1а.

Из правила принятия гипотез следует, что коэффициент регрессии b1=31,318 не противоречит гипотезе H0 , если выполняется неравенство

t

 

=

 

b1

a

 

< tα

или

 

b

a

 

< tα

s(b ).

(4.9)

 

 

 

 

 

 

 

 

 

факт

 

 

s(b )

 

крит

 

 

1

 

 

крит

1

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

Множество всех значений а, удовлетворяющих неравенству (4.9), образует доверительный интервал

(b1 -δ, b1 +δ).

Величина

δ =tкрα s(b1)

называется предельной ошибкой. Для рассматриваемой задачи предельная ошибка будет равна

142

δ=2,306×5,917=13,645.

Тогда доверительный интервал имеет нижнюю границу, равную 31,318-13,645=17,673,

и

верхнюю границу, равную 31,318+13,645=44,963,

Таким образом, с надежностью 95 % можно утверждать, что средние удельные затраты составят не менее 17,673 у.е. и не более 44,963 у.е.

Проверка общего качества уравнения регрессии

Мерой общего качества уравнения регрессии (соответствия уравнения регрессии статистическим данным) является коэффициент детерминации R 2 . При парной линейной регрессии коэффициент равен квадрату парного линейного коэффициента корреляции

R2 = rxy2 .

Коэффициент детерминации характеризует долю общего разброса значений зависимой переменной y , объясненного уравнением регрессии.

Считается, что чем больше эта доля, тем лучше уравнение регрессии описывает исследуемую зависимость. В общем случае 0 R2 1.

Существует несколько видов формулы линейного коэффициента корреляции, приведем основные из них:

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

1

n

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

y

 

 

x

 

 

 

y

 

 

 

 

 

D(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

xy

=

 

x y x y

=

n

1

i

 

i

n

1

i n

1

 

i

 

= b

 

,

 

D(x) D(y)

 

 

 

 

 

D(x) D(y)

 

 

 

 

 

 

D(y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где общая дисперсия результативного признака D(y)=

1

n

 

 

1

n

 

2

 

 

yi2

 

yi .

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

1

 

 

Для расчета коэффициента детерминации определим значение линейного парного коэффициента корреляции через коэффициент регрессии:

 

 

143

 

 

rxy

= 31,318

38,5 5,5

2

= 0,882.

 

 

 

 

 

 

142298,19 363,182

Тогда коэффициент детерминации

будет равен: R2 = rxy2 = 0,778.

Следовательно, 77,8 % вариации затрат на реализацию объясняется изменчивостью объема продаж, т. е. уравнением линейной регрессии.

Прогнозирование

Уравнение регрессии

yпр(x)= 190,927+31,318x

можно использовать для прогноза фактических затрат y. Найдем прогноз затрат при объеме продаж x0 = 6,5. Подставляя значение x0 в уравнение регрессии, получим

yпр(6,5)= 190,927+31,318×6,5=394,493 у.е.,

т. е. можно утверждать, что затраты на реализацию 6,5 ед. продукции составят 394,493 у.е. Используя это значение, построим доверительный интервал, в котором будут содержаться фактические затраты на реализацию объема продаж x0=6,5. Для этого зададим доверительную вероятность γ=0,95 (α=1-γ) и найдем предельную ошибку доверительного интервала m по формуле

 

 

 

 

1

 

(x

 

)2

=

 

 

 

 

 

 

m=tкритα (n 2)×s ×

1+

+

x

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

nD(x)

 

 

 

 

= 2 ,306 × 53 ,74

1 +

0 ,1 +

( 6 ,5 5 ,5 ) 2

=

130,689.

10

8 , 25

 

 

 

 

 

 

 

 

 

 

Здесь

 

обозначает среднее

 

 

значений xi.. Тогда

х

 

арифметическое

доверительный интервал имеет:

нижнюю границу, равную yпр(x0)-m=394,493-130,689=263,304, верхнюю границу, равную yпр(x0)+m= 394,493+130,689=525,182.

144

Доверительный интервал означает: с надежностью 95 % можно утверждать, что при объеме продаж x0=6,5 ед. фактические затраты будут в интервале (263,304, 525,182), т. е. затраты составят не менее 263,304 у.е и не более 525,182 у.е.

Реализация задачи в Excel

В ячейки электронной таблицы B2:B12 и C2:C12 ввести исходные данные (согласно табл. 4.3). Выполнить следующие действия:

Сервис - Анализ данных - Регрессия - ОК;

Заполнить окно “Регрессия” (как указано на рис. 4.1), затем ОК. Реализация рассмотренного выше примера в Excel приведена в табл. 4.3.

Поясним полученный результат решения. В ячейке B17 помещено значение стандартной ошибки s, в ячейках B26 и B27 содержатся коэффициенты регрессии b0 и b1 соответственно, в ячейке С27 – значение стандартной ошибки коэффициента регрессии b1 .

Рис. 4.1

145

Таблица 4.3