Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МУ

.pdf
Скачиваний:
19
Добавлен:
16.03.2015
Размер:
2.04 Mб
Скачать

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

Таблица 4.

 

Коэффици-

Стандартная

t-

P-

Нижние

Верхние

 

енты

ошибка

статистика

Значение

95%

95%

Y-пересечение

a=1709,052

464,6013

3,678534

0,000302

792,906

2625,197

Средства

 

 

 

 

 

 

предприятий и

 

 

 

 

 

 

организаций, млн

 

 

 

 

 

 

руб

b=2,364838

0,092686

25,51444

8,3E-65

2,182071

2,547606

В табл. 2 указано, что множественный коэффициент корреляции

R=0,875. Таким образом изменение признака Y на 87,5% объясняется изменением признака X. Дисперсионный анализ (табл.3) показывает, что значимость критерия Фишера составляет 8,3∙10-65, что существенно ниже,

чем 1-α=1-0,95=0,05. Это говорит о тесной линейной связи и адекватности уравнения регрессии.

По табл. 4 можно написать уравнение регрессии: y a b x 1709.052 2.364838 x 1709 2.36 x

p-значение коэффициентов уравнения регрессии во много раз меньше 5%, следовательно все они значимы.

Построим теперь прогноз признака Y при значении фактора Х,

равном 105% от его среднего значения.

По данным табл. 1 x 2246.972 , следовательно 105% от него равны x 2359.32

По уравнению регрессии найдем значение Y: y 1709 2.36 2359.32 7277.0

Ошибку прогноза найдем по формуле

S y 1 1 (x 2x)2 n Sx

Здесь Sy – среднее квадратическое отклонение признака Y; Sx

среднее квадратическое отклонение фактора Х; n – объем выборки; х

© С.В. Юдин, 2013

11

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

значение признака, для которого необходимо вычислить прогноз; x -

среднее значение фактора Х.

Все эти значения представлены в табл. 1:

 

 

1

 

 

(2359.32 2246.97)2

 

10463.66

1

 

 

 

 

 

10493

201

17301192

 

 

 

 

 

Большую величину ошибки можно объяснить очень большими эксцессами и асимметриями. Подавляющее большинство точек сгруппированы около начала координат.

© С.В. Юдин, 2013

12

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

ЗАДАЧА 2. Множественная регрессия и корреляция

По данным об экономических результатах деятельности российских

банков(www.finansmag.ru) выполните следующие задания.

1.Постройте линейное уравнение множественной регрессии и поясните экономический смысл его параметров.

2.Определите стандартизованные коэффициенты регрессии.

3.Определите парные и частные коэффициенты корреляции, а также множественный коэффициент корреляции.

4.Дайте оценку полученного уравнения на основе коэффициента детерминации и общего F-критерия Фишера.

Используйте признаки: работающие активы (зависимая переменная

Y), млн руб.; собственный капитал (фактор Х1), %; средства предприятий и организаций (фактор Х2), %.

Расчеты будем проводить в Excel при помощи мастера анализа данных.

Первый шаг: определение коэффициентов парной корреляции.

Последовательность действий: лента «Данные» → пункт «Анализ данных»

→ «Корреляция» (рис. 9)

Рис. 9. Выбор функции

 

© С.В. Юдин, 2013

13

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

На рис. 10 представлено заполнение панели «Корреляция».

Рис. 10. Заполнение панели «Корреляция»

Результаты расчета коэффициентов парной корреляции сведены в табл. 5.

Таблица 5.

Коэффициенты парной корреляции

 

Y

X1

X2

Y

1

 

 

 

-

 

 

X1

0,09602

1

 

 

-

-

 

X2

0,04522

0,27936

1

Можно заметить, что они очень малы. Зависимость признака от факторов практически отсутствует.

Теперь определим коэффициенты уравнения регрессии и его адекватность. На рис. 11 представлено заполнение панели «Регрессия».

© С.В. Юдин, 2013

14

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

Рис. 11. Заполнение панели регрессия

В табл. 6…8 представлены результаты расчетов.

Таблица 6

Регрессионная статистика

Множественный R

0,121857

R-квадрат

0,014849

Нормированный R-

 

квадрат

0,005143

Стандартная ошибка

139567,4

Наблюдения

 

Таблица 7

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

2

5,96E+10

2,98E+10

1,529907

0,219042

Остаток

203

3,95E+12

1,95E+10

 

 

Итого

205

4,01E+12

 

 

 

© С.В. Юдин, 2013

15

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

Таблица 8

 

 

Стандарт-

 

 

 

 

 

 

Коэффици-

ная

t-статис-

P-

Нижние

Верхние

Нижние

 

енты

ошибка

тика

Значение

95%

95%

95,0%

Y-пересе-

 

 

 

 

 

 

 

чение

79840,7

31726,33

2,516544

0,012625

17285,29

142396,1

17285,29

X1

-1703,99

1049,042

-1,62433

0,105857

-3772,4

364,4259

-3772,4

X2

-676,133

627,7575

-1,07706

0,282731

-1913,89

561,628

-1913,89

Множественный коэффициент, а особенно его квадрат, говорит о том, что коэффициент детерминации очень мал. Значимость F-критерия составляет 0.21, что больше величины 0.05. Уравнение регрессии не объясняет признак через факторы задачи, следовательно, неадекватно.

© С.В. Юдин, 2013

16

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

ЗАДАЧА 3. Анализ гетероскедастичности

Используя данные файла Рынокжилья.doc, постройте модели цен квартир разного типа, протестируйте качество моделей, наличие эффектов автокорреляции и гетероскедастичности. Дайте интерпретацию результатов.

РЫНОК ЖИЛЬЯ

Формирование цен на рынке первичного жилья

(на примере данных Санкт-Петербурга по состоянию на декабрь

2004 г.)

Для изучения формирования цен на рынке первичного жилья в Санкт-Петербурге создан файл Рынокжилья.xls (данные из него частично скопированы в лист «Задача 3» книги МУ.xlsx

Y - PriceUE

 

цена в у.е.

 

 

 

 

X1

- Rooms

 

количество комнат

 

 

 

X2

- Floor

 

этаж (фиктивная переменная):

 

 

 

 

 

 

0, если первый или последний;

 

 

 

 

 

 

1, иначе

 

 

 

 

X3

- Space

 

общая площадь (м2)

 

 

 

X4

- Type:

 

тип дома (фиктивная переменная):

 

X5 - Brick

 

 

кирпич

 

 

 

 

X6 - Brick-M

 

 

кирпич-монолит

 

 

 

X7 - Monolith

 

 

монолит

 

 

 

 

X8 - Panel

 

 

панель

 

 

 

 

X9

- Time

 

срок сдачи (мес.)

 

 

 

X10 -Transp

 

удаленность

от

метро

(фиктивная

 

 

 

 

 

переменная):

 

 

 

 

 

 

 

 

0, если не нужен транспорт;

 

 

 

 

 

 

1, иначе;

 

 

 

 

X11 - DistrictN

 

район (фиктивная переменная)

 

 

X12-

 

 

Адмиралтейский

 

 

 

Admiralteisky

 

 

 

 

 

 

 

X13

-

 

Василеостровский

 

 

 

Vasileostrovsky

 

 

 

 

 

 

 

 

 

 

© С.В. Юдин, 2013

 

 

17

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

X14-Viborgsky

 

Выборгский

X15-

 

Калининский

Kalininsky

 

 

X16-Kirovsky

 

Кировский

X17-Krasno-

 

Красногвардейский

gvardeisky

 

 

X18

 

Красносельский

Krasnoselsky

 

 

X19-

 

Московский

Moskovsky

 

 

X20Nevsky

 

Невский

X21-

 

Петроградский

Petrogradsky

 

 

X22-Primorsky

 

Приморский

X23-

 

Фрунзенский

Frunzensky

 

 

X24-Сentralny

 

Центральный

1.Проведите предварительный анализ переменных.

2.Сформулируйте гипотезы о влиянии независимых переменных на результирующую переменную (цена жилья).

3.Постройте модель вида линейную модель множественной корреляции.

4.Протестируйте модель (выполните проверку гипотез о значимости коэффициентов).

5.Обсудите значимость модели в целом (F-тест).

6.Обсудите качество модели (R2).

7.Дайте интерпретацию полученных результатов.

8.Проверьте прогнозные свойства полученных моделей для квартир

сразным количеством комнат, обсудите полученные результаты. Что можно сделать для улучшения прогнозных свойств моделей?

9.Проверьте остатки на наличие автокорреляции (тест DW).

10.Проверьте исследование на наличие гетероскедастичности.

© С.В. Юдин, 2013

18

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

11. Обсудите возможные причины появления автокорреляции,

гетероскедастичности и способы избавления от них.

Первый шаг – построение матрицы коэффициентов парной

корреляции (лист «Задача 3»).

В полученной матрице множество ячеек с отметкой о делении на ноль. Это произошло вследствии того, что для примера была отобрана лишь незначительная часть исходных данных и некоторые переменные имеют постоянное значение. Удалим такие переменные из рассмотрения:

Х7, Х8, Х14-Х24. Перенесем исходные данные на лист «Задача 3_1» и там

произведем удаление.

Снова построим матрицу коэффициентов парной корреляции.

Проанализируем ее на наличие мультиколлинеарности (наличие

тесных связей между факторами). Обычно считают, что

мультиколлинеарность имеет место, если коэффициент парной корреляции между факторами превышает значений r=0.7. Это наблюдается между факторами Х3 и Х1, Х5 и Х4, Х6 и Х4, Х6 и Х5, Х12 и Х11, Х13 и Х11,

Х13 и Х12.

Т.к. фактор Х3 сильнее связан с признаком (r(X3,Y)=0.772,

r(X1,Y)=0.660), то оставляем в модели его.

Из тройки (Х4, Х5, Х6) оставляем Х6 (модули коэффицентов парной

корреляции с признаком одинаковы, поэтому разницы нет).

Из тройки (Х11, Х12, Х13) оставляем Х13.

Снова переносим таблицу на новый лист «Задача 3_2», удаляем

столбец Х1 и проводим заново расчеты коэффициентов парной корреляции, а затем строим линейное уравнение регрессии.

Уравнение регрессии адекватно, т.к. значимость F-критерия Фишера

чрезвычайно мала, нормированный квадрат

множественного

© С.В. Юдин, 2013

19

С.В. Юдин. Лабораторные работы по эконометрике. Методические указания

коэффициента корреляции равен 0.72, т.е. 72% изменения признака объясняются изменением факторов.

Анализ коэффициентов уравнения регрессии показывает, что p-

значение (уровень значимости) коэффициентов при Х6 и Х10 превышает значение 0.05. Следовательно, их необходимо удалить из модели.

Перенесем таблицу на лист «Задача 3_3», удалим эти переменные и упорядочим строки по возрастанию наиболее значимого фактора Х3 при помощи пункта «Сортировка и фильтр» ленты «Данные». При этом во всплывающем предупреждении указать необходимость автоматического расширения диапазона (рис. 12).

Рис. 12. Сортировка данных

После осуществления этих действий снова проводим регрессионный анализ, причем в панели «Регрессия» отмечаем пункт «Остатки». Остатки определяются как разность между наблюдаемыми значениями признака и вычисленными по уравнению регрессии:

i

yi

 

k

 

a bj

x ji

 

 

 

j 1

 

Здесь i

номер наблюдения, j – номер фактора, k – количество

факторов.

© С.В. Юдин, 2013

20