Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

теория

.pdf
Скачиваний:
47
Добавлен:
27.05.2015
Размер:
792.01 Кб
Скачать

Вычисление параметров линейного уравнения парной регрессии проводится с помощью инструмента анализа данных Регрессия. Порядок действий следующий: в главном меню последовательно выберите пункты Сервис/Анализ данных/Регрессия, после чего щелкните по кнопке Ок.

Заполните диалоговое окно ввода данных и параметров вывода.

Результаты множественного регрессионного анализа представлены ниже:

Согласно расчетам, полученным в Excel, зависимость доходов по акции С от доходов по акциям А и В имеет вид:

~

0.24x1

+ 0.77x 2 ,

y = 5.62

что означает, что при увеличении доходов по акции А на 1% доходы по акции С уменьшатся на 0,24%, а при увеличении доходов по акции B на 1% доходы по акции С увеличатся на 0,77%.

Оценка тесноты связи дает следующие результаты:

R 0.98 , R 2 0.96 ,

т.е. связь между доходами по акции С и доходами по акциям А и В сильная и 96% изменения доходов по акции С объясняется изменением доходов по акциям А и В.

Уравнение значимо на 5% уровне, т.к. значение «значимость F» меньше 0,05. Кроме того, на 6% уровне значимы оба коэффициента, ошибка первого коэффициента чуть больше 5%, а у второго – меньше 1%. Доверительный

интервал для коэффициента a 2 можно проинтерпретировать так: при увеличении доходов по акции В на 1% доходы по акции с увеличатся на величину от 0,41% до 1,14%.

Таким образом, нами продемонстрирован один из многочисленных инструментов анализа данных, имеющихся в ППП MS Excel. Ознакомиться с другими инструментами можно самостоятельно.

Практика построения множественных регрессионных моделей взаимосвязи показывает, что реально существующие взаимосвязи между социально-экономическими явлениями можно описать следующими типами моделей:

1.Линейная: y = a 0 +a1 x1 +...+a n x n .

2.Степенная: y = a 0 x1a1 x a22 ...x ann .

3.Показательная: y = ea0 +a1x1 +...+a n xn .

4.Параболическая: y = a 0 + a1x12 +... + a n x 2n .

y = a 0

+

a1

+... +

a n

 

x1

x n .

5. Гиперболическая:

 

 

Примером множественной нелинейной степенной регрессии является производственная функция Кобба-Дугласа:

Y = AKa Lb ,

показывающая зависимость реального объема выпуска Y от капитальных затрат K и затрат труда L . Для нахождения коэффициентов функции КоббаДугласа a и b прологарифмируем обе части равенства:

ln Y = ln(AKa Lb ),

ln Y = ln A + a ln K + b ln L .

Заменим:

ln Y = y ,

ln K = k , ln L =l , ln A = c .

Получим множественную линейную регрессию y = c + ak + bl . Коэффициенты a,b,c этой регрессии можно найти, решив систему трех линейных уравнений с тремя неизвестными, как было написано выше.

Экономическая интерпретация коэффициентов а и b функции Кобба-

Дугласа Y = AKa Lb : при увеличении капиталовложений на 1% от своего среднего значения реальный объем выпуска увеличится на a% от своего среднего значения, а при увеличении затрат труда на 1% от своего среднего значения реальный объем выпуска увеличится на b% от своего среднего значения.

2.2.Решение типовых задач

Задача 1. По группе стран мира имеются данные о средней ожидаемой продолжительности жизни населения, величине ВВП на начало 2003 года, суточной калорийности питания на душу населения, а также о коэффициенте младенческой смертности и численности населения. Данные представлены в приложении 1. Требуется:

1.На основании матрицы парных коэффициентов корреляции выделить два наиболее существенных фактора, от которых зависит средняя ожидаемая продолжительность жизни.

2.Написать уравнение множественной регрессии и вычислить его параметры.

3.Проинтерпретировать полученные коэффициенты уравнения.

4.Оценить значимость полученного уравнения и его коэффициентов.

5.Сделать выводы о возможности прогнозирования по данной модели.

Rx3 y
≈ −0.74

Решение:

1. Матрица парных коэффициентов корреляции имеет вид:

 

y

x1

x2

x3

x4

Y

1

 

 

 

 

x1

0,1154

1

 

 

 

x2

0,3109

0,1641

1

 

 

x3

-0,7400

-0,0870

-0,1107

1

 

x4

-0,2055

0,8591

-0,0526

0,2928

1

Коэффициент корреляции R x1y 0.1154. Это говорит о том, что связь между средней ожидаемой продолжительностью жизни и величиной ВВП отсутствует (0,1154<0.3), а значит, величина ВВП не влияет на среднюю продолжительность жизни.

Коэффициент корреляции Rx 2 y 0.3109 . Это значит, что связь между средней ожидаемой продолжительностью жизни и суточной калорийностью питания прямая, но очень слабая (0,3<0.3109<0.5), следовательно, суточная калорийность питания влияет на среднюю ожидаемую продолжительность жизни очень незначительно, но в целом при увеличении (уменьшении) суточной калорийности питания средняя продолжительность жизни увеличивается (уменьшается).

Коэффициент корреляции показывает, что между средней продолжительностью жизни и коэффициентом младенческой смертности существует сильная обратная связь (0.7< |-0.74| ). Это говорит о том, что, в целом, при увеличении (уменьшении) коэффициента младенческой смертности средняя ожидаемая продолжительность жизни уменьшается (увеличивается).

Коэффициент корреляции Rx 4 y ≈ −0.2055 не значителен. А значит, связи между средней продолжительностью жизни и численностью населения нет (|-0.2055| < 0.3). Следовательно, изменение численности населения не отражается на средней продолжительности жизни.

На основании матрицы корреляции видно что, факторами, влияющими на среднюю продолжительность жизни, являются суточная калорийность питания и коэффициент младенческой смертности, а значит, для построения модели нужно использовать именно эти признаки. Но для правильного построения модели нужно проверить ее на мультиколлинеарность.

Коэффициент

корреляции R x2 y3 ≈ −0.1107 показывает,

что признаки x2

(суточная калорийность питания)

и x3

(коэффициент

младенческой

смертности)

не коррелируют

между

собой,

а

следовательно

мультиколлинеарность в модели отсутствует.

Уравнение регрессии с учетом выбранных признаков имеет вид:

y = a 0 +a1x 2 +a 2 x3

Для нахождения коэффициентов a0, a1 и a2 необходимо решить следующую систему:

 

 

a 0 a1

 

 

a 2

 

 

= 0

 

 

y

x 2

x3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yx2

a 0 x 2 a1 x 22 a 2 x 2 x3

= 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a 2 x32

 

 

a 0 x3 a1 x 2 x3

 

= 0

yx3

 

Решив систему получаем результат: a0=68.102, a1=0.0033,

a2=-0.262.

Коэффициент a0 не поддаётся интерпретации, поскольку сам по себе в данной модели он не имеет смысла (так как он показывает, что при нулевой суточной калорийности питания и нулевым коэффициентом младенческой смертности средняя ожидаемая продолжительность жизни была бы равна 68,102 года, а это невозможно).

Коэффициент а1 показывает что при увеличении (уменьшении) суточной калорийности питания на 1 кал. средняя ожидаемая продолжительность жизни в участвующих в исследовании странах увеличивается (уменьшается)

на 0,0033 года.

Коэффициент а2 показывает что при уменьшении (увеличении) коэффициента младенческой смертности на 1 единицу средняя продолжительность жизни в странах участвующих в исследовании увеличится (уменьшится) на 0,262 года.

Для оценки значимости уравнения регрессии необходимо оценить F- критерий Фишера:

Fрас=20,31,

Fтабл.=3,35,

Fрас> Fтабл, следовательно уравнение регрессии статистически значимо.

Для оценки статистической значимости коэффициентов a1 и a2 воспользуемся t – критерием Стьюдента:

ta1рас =1,89 ,

ta2рас = 5,84,

tтабл=2.05.

Проверка на значимость коэффициентов а1, а2 показала коэффициент а2 статистически значим (5,84>2.05), а коэффициент а1 статистически не значим(1,89<2.05). Такой результат, возможно, получился от того, что связь между суточной калорийностью питания и средней ожидаемой продолжительностью жизни слабая. В целом же уравнение статистически значимо.

Пример 2. Построить производственную функцию Кобба-Дугласа для оценки национального дохода США по следующим данным: Y – национальный доход США, млрд. долл., K – капиталовложения, млрд. долл., L – общее число занятых в экономике, тыс. чел.

Год

Y

K

L

 

lnY

lnK

lnL

1992

6337,75

5512,75

 

120596

8,754279

8,614819

11,70002

1993

6657,4

5773,35

 

122038

8,803484

8,661008

11,71209

1994

7072,23

6122,25

 

122762

8,863931

8,719685

11,71800

1995

7397,65

6453,93

 

124862

8,908918

8,772445

11,73496

1996

7816,83

6840,1

 

126501

8,964034

8,830558

11,74801

1997

8304,33

7292,18

 

129353

9,024532

8,894558

11,77031

1998

8746,98

7752,8

 

131282

9,076464

8,955809

11,78510

1999

9268,43

8236,65

 

133317

9,134369

9,016349

11,80049

2000

9816,98

8795,23

 

136788

9,191869

9,081965

11,82619

2001

10100,78

8981,23

 

137124

9,220368

9,102892

11,82864

2002

10480,83

9290,85

 

122874

9,257303

9,136785

11,71891

2003

10985,45

9600,47

 

137586

9,304327

9,169567

11,83200

Источник данных: www.bls.gov, www.economagic.com.

Произведем все необходимые вычисления в Excel, используя Сервис/ Анализ данных/Регрессия. В диалоговом окне ввода данных и параметров вывода входной интервал Y – колонка «lnY», а входной интервал X –

колонки «lnK» и «lnL».

Результаты множественной линейной регрессии ln Y = ln A + a ln K + b ln L представлены ниже:

ВЫВОД ИТОГОВ

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

Множественный R

0,999015329

 

 

 

 

 

R-квадрат

0,998031628

 

 

 

 

 

Нормированный R-квадрат

0,997539535

 

 

 

 

 

Стандартная ошибка

0,00836426

 

 

 

 

 

Наблюдения

11

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

 

Df

SS

MS

F

Значимость F

 

Регрессия

2

0,283780318

0,14189016

2028,137

1,50117E-11

 

Остаток

8

0,000559687

6,9961E-05

 

 

 

Итого

10

0,284340004

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

Станд. ошиб.

t-стат.

Р-Знач.

Нижн95%

 

Y-пересечение lnA

0,861660847

0,773500891

1,11397525

0,297636

-0,922036559

 

a

0,956183447

0,017305256

55,2539316

1,28E-11

0,916277428

 

b

0,129032798

0,07129211

0,40723718

0,004513

0,053432804

 

Возвращаясь к исходным коэффициентам функции Кобба-Дугласа

Y = AKa Lb , получим:

lnA=0,862, A= 2,367.

Таким образом, производственная функция имеет вид: Y = 2,367 K0,956L0,129 . Это означает, что увеличении капиталовложений на 1% от своего среднего значения национальный доход США увеличивается на 0,956% от своего среднего значения, а при увеличении численности занятых в экономике на 1% от своего среднего значения национальный доход увеличится на 0,129 от своего среднего значения.

2.3. Задачи для самостоятельного решения

Задача 1. По статистической выборке данных с сайта www.vladhome.ru введите фиктивные переменные в исследование, опишите их. Вычислите матрицу парных корреляций, проанализируйте ее. На основании матрицы парных коэффициентов корреляции выделите два наиболее существенных фактора, от которых зависит цена квартиры. Напишите уравнение множественной регрессии. Вычислите его параметры. Проинтерпретируйте коэффициенты регрессии. Вычислите коэффициент множественной корреляции. Оцените с помощью коэффициента множественной детерминации качество построенной модели. Оцените значимость полученного уравнения регрессии. Оцените значимость коэффициентов регрессии. Сделайте вывод о возможности прогнозирования по данной модели. Проделайте расчеты в ППП MS Excel.

Задача 2. В результате исследования факторов, определяющих экономический рост, по 73 странам получено следующее уравнение регрессии:

~

0.52 P + 0.17S +11.16 I 0.38 D 4.75 In, R

2

= 0.60

y =1.4

 

 

(5.9)

(4.34)

(3.91)

(0.79)

(2.7)

 

 

где ~y - темпы экономического роста (темпы роста среднедушевого ВВП в % к базисному периоду); P – реальный среднедушевой ВВП, %; S – бюджетный дефицит, % к ВВП; I – объем инвестиций, % к ВВП; D – внешний долг, % к ВВП; In – уровень инфляции, %. Проверьте гипотезу о достоверности полученной модели в целом. До получения результатов этого исследования ваш однокурсник заключил с вами пари, что эмпирические результаты по данной модели покажут наличие обратной связи между темпами экономического роста и объемом внешнего долга страны (% к ВВП). Выиграл ли это пари ваш однокурсник?

Задача 3. По 20 предприятиям легкой промышленности получена следующая информация, характеризующая зависимость объема выпуска продукции y (млн. руб.) от количества отработанных за год человеко-часов x1 (тыс.чел.час.) и среднегодовой стоимости производственного оборудования x2 (млн. руб.):

Уравнение регрессии

~

+ 0.06x1

+ 2.5x 2

y = 35

Множественный коэффициент корреляции

0,9

 

 

Сумма квадратов отклонений расчетных

3000

 

 

значений результата от фактических

 

 

 

Определите коэффициент детерминации в этой модели. Составьте таблицу результатов дисперсионного анализа. Проанализируйте полученные результаты регрессивного анализа.

Задача 4. По 50 семьям изучалось потребление мяса – y (кг на душу населения) от дохода – x1 (руб. на одного члена семьи) и от потребления рыбы – x2 (кг на душу населения). Результаты оказались следующими:

Уравнение регрессии

~

+ 0.2x1

0.4x 2

y = −180

Стандартные ошибки параметров

20 0,01 0,25

Множественный коэффициент корреляции

 

0,85

 

Используя t-критерий Стьюдента, оцените значимость параметров уравнения. Рассчитайте F-критерий Фишера. Оцените по частным F-критериям Фишера целесообразность включения в модель а) фактора x1 после фактора x2; б) фактора x2 после фактора x1.

Задача 5. Имеются следующие данные о ценах и дивидендах по обыкновенным акциям, а также данные о доходности компании. Построить линейное уравнение множественной регрессии и пояснить экономический смысл его параметров

цена акции,

доходность

уровень

 

долл. США

капитала, %

дивидендов, %

1

25

15,2

2,6

2

20

13,9

2,1

3

15

15,8

1,5

4

34

12,8

3,1

5

20

6,9

2,5

6

33

14,6

3,1

7

28

15,4

2,9

8

30

17,3

2,8

9

23

13,7

2,4

10

24

12,7

2,4

11

25

15,3

2,6

12

26

15,2

2,8

13

26

12,0

2,7

14

20

15,3

1,9

15

20

13,7

1,9

16

13

13,3

1,6

17

21

15,1

2,4

18

31

15,0

3,0

19

26

11,2

3,1

20

11

12,1

2,0

Задача 6. Бюджетное обследование пяти случайно выбранных семей дало следующие результаты (в ден. ед.)

Семья

Накопления, y

Доход, x1

Имущество, x2

1

3

40

60

2

6

55

36

3

5

45

36

4

3.5

30

15

5

1.5

30

90

Оцените регрессию накоплений на доход и имущество. Спрогнозируйте накопления семьи, имеющей доход 40 ден. ед. и имущество стоимостью 25 ден. ед. Предположим, что доход семьи возрос на 10 ден. ед., в то время как стоимость имущества не изменилась. Оцените, как изменятся ее накопления. Оцените, как возрастут накопления семьи, если ее доход вырос на 5 ден. ед., а стоимость имущества увеличилась на 15 ден. ед.

Глава 3. Использование фиктивных переменных в эконометрическом моделировании

3.1.Теоретические основы

Независимые переменные в регрессионных моделях, рассмотренные нами ранее, имеют непрерывные области изменения (национальный доход, уровень безработицы, размер заработной платы, стоимость товара и т.п.). Однако некоторые переменные могут принимать всего два значения или, в общей ситуации, дискретное множество значений. Необходимость рассматривать такие переменные возникает довольно часто в тех случаях, когда требуется принимать во внимание какойлибо качественный признак.

Фиктивной называется переменная, которая является качественной по своей природе и, следовательно, не изменяется в числовой шкале.

Примеры использования фиктивных переменных:

¾ Исследуется зависимость между доходом и потреблением в Приморском крае и выборка включает русские и корейские семьи. Ставится задача: имеет ли существенное значение это этническое происхождение.

¾ Исследуются факторы, определяющие инфляцию, и в некоторые годы правительство проводило политику регулирования доходов. Нужно проверить, оказало ли это влияние на зависимость.

¾При исследовании зависимости заработной платы от различных факторов может возникнуть вопрос, влияет ли на ее размер, и если да, то в какой степени, наличие у работника высшего образования. Также можно поставить вопрос, существует ли дискриминация в оплате труда между мужчинами и женщинами.

¾Исследуется зависимость между военными расходами и уровнем ВВП в разрезе стран мира (см. приложение 2). В выборку включены крупные и малочисленные страны. Требуется определить, будет ли одинаковой изучаемая зависимость для двух групп стран.

Преимущества использования фиктивных переменных:

1.возможность моделирования сезонных явлений;

2.введение в исследование фиктивных переменных для коэффициента наклона.

3.простой способ проверки, является ли воздействие качественного фактора значимым; Эконометрическая модель с фиктивной переменной имеет вид:

y =α + βx +δD +u ,