- •Лабораторная работа № 1
- •Пример выполнения лабораторной работы в пакете Statistica
- •Лабораторная работа № 2
- •Пример выполнения лабораторной работы в пакете Statistica
- •Лабораторная работа № 3
- •1) Тема работы, задание.
- •Пример выполнения лабораторной работы в пакете Statistica
- •Лабораторная работа № 4
- •1) Тема работы, задание.
- •2) Распечатка таблиц и графиков.
- •Пример выполнения лабораторной работы в пакете Statistica
- •Лабораторная работа № 5
- •1) Тема работы, задание.
- •2) Распечатка таблиц и графиков.
- •Пример выполнения лабораторной работы в пакете Statistica
- •Самостоятельная работа
- •1) Тема работы, задание.
- •2) Распечатка таблиц и графиков.
- •3) Объяснение полученных таблиц и графиков с точки зрения эконометрики. Пример выполнения самостоятельной работы в пакете Statistica
Лабораторная работа № 5
Тема: Проверка факторов на мультиколлинеарность. Выбор модели регрессии.
Цель лабораторной работы
Должны быть приобретены следующие умения:
1) Нахождение линейной и нелинейной моделей для многофакторной регрессии.
2) Проверка факторов на коллинеарность и мультиколлинеарность.
3) Нахождение эластичности по каждому фактору.
Должны быть усвоены следующие понятия: коллинеарность и мультиколлинеарность, их следствия; частная эластичность, ее экономический смысл.
Работа рассчитана на 4 часа.
Задание к лабораторной работе.
1) Проверить факторы x1 и x2 на мультиколлинеарность.
2) Построить две модели:
линейную
и степенную модель Кобба-Дугласа
,
проверить их на адекватность.
3) По минимуму суммы квадратов остатков выбрать оптимальную модель.
4) Найти эластичность модели по переменным x1 и x2 и объяснить ее экономический смысл.
Отчет по лабораторной работе должен включать:
1) Тема работы, задание.
2) Распечатка таблиц и графиков.
3) Объяснение полученных значений коэффициентов с точки зрения эконометрики.
4) Объяснение выбора модели и смысла эластичности.
Пример выполнения лабораторной работы в пакете Statistica
Реальный объем выпуска продукции (Y, млн. тонн) и уровни факторов ее формирующих - капитальных затрат (X1, млн. грн) и удельного веса простоев оборудования (X2, %) по металлургическим предприятиям страны за прошедший год заданы в таблице.
№ п/п |
X1 |
X2 |
Y |
1 |
1,033 |
1,45 |
1,83 |
2 |
0,012 |
4,295 |
0,58 |
3 |
0,045 |
3,553 |
1,34 |
4 |
0,243 |
1,568 |
1,34 |
5 |
0,266 |
1,52 |
1,64 |
6 |
0,302 |
0,512 |
1,65 |
7 |
0,451 |
0,457 |
1,91 |
8 |
1,041 |
1,822 |
1,96 |
9 |
1,423 |
0,442 |
2,08 |
10 |
1,914 |
0,498 |
2,18 |
Выполнение задания
Работаем в модуле Multiple Regression. В качестве зависимой переменной (dependent) выбираем Y, независимые факторы (independent) - x1, x2.
Исходная таблица
+----+--------------------------------+
| STA|From: lab5.sta (3v * 10c) |
| MUL| |
| REG|Variables: 1-3, Cases: 1-10 |
+----+----------+----------+----------+
| | | | |
| | X1 | X2 | Y |
+----+----------+----------+----------+
| 1 | 1,033 | 1,450 | 1,830 |
| 2 | ,012 | 4,295 | ,580 |
| 3 | ,045 | 3,553 | 1,340 |
| 4 | ,243 | 1,568 | 1,340 |
| 5 | ,266 | 1,520 | 1,640 |
| 6 | ,302 | ,512 | 1,650 |
| 7 | ,451 | ,457 | 1,910 |
| 8 | 1,041 | 1,822 | 1,960 |
| 9 | 1,423 | ,442 | 2,080 |
| 10 | 1,914 | ,498 | 2,180 |
+----+----------+----------+----------+
1 Проверка факторов на мультиколлинеарность.
Так как факторов всего два,
то их следует проверять на коллинеарность
по значению парного коэффициента
корреляции
.
Для этого создаем корреляционную
таблицу: Analysis - Quick
Basic Stats -
Correlation matrices
-Variables for
analysis X1,X2
(анализ - быстрые статистики - корреляционные
матрицы - переменные для анализа Х1, Х2).
+----------+---------------------------------------------------+
| STAT. |Correlations, Casewise MD deletion, N=10 (lab5.sta)|
| MULTIPLE | |
| REGRESS. | |
+----------+----------------------+----------------------+-----+
| | | |
| Variable | X1 | X2 |
+----------+----------------------+----------------------+
| X1 | 1,000000 | -,580003 |
| X2 | -,580003 | 1,000000 |
+----------+----------------------+----------------------+
Парный коэффициент корреляции =-0,58.
Определим, является ли это значение коэффициента статистически значимым с помощью критерия Стьюдента.
.
Критическое значение определяется при уровне значимости и числом степеней свободы n-2=8. Определим с помощью вероятностного калькулятора: t(8)=2,306004 p=0,95.
Так как
то коэффициент корреляции статистически
не значим, следовательно, факторы x1
и x2
не коллинеарны.
2 Построить две модели: линейную и степенную модель Кобба-Дугласа , проверить их на адекватность.
Для нахождения коэффициентов линейной регрессии b0, b1 и b2 нажать кнопку Regression Summary (Итоги регрессионного анализа). В столбце B появившейся таблицы считать параметры b0, b1и b2.
+----------+-----------------------------------------------------------------+
| STAT. |Regression Summary for Dependent Variable: Y (lab5.sta) |
| MULTIPLE |R= ,91924017 RІ= ,84500249 Adjusted RІ= ,80071749 |
| REGRESS. |F(2,7)=19,081 p<,00147 Std.Error of estimate: ,21039 |
+----------+----------+----------+----------+----------+----------+----------+
| | | St. Err. | | St. Err. | | |
| N=10 | BETA | of BETA | B | of B | t(7) | p-level |
+----------+----------+----------+----------+----------+----------+----------+
| Intercpt | | | 1,768423 | ,184378 | 9,59128 | ,000028 |
| X1 | ,440721 | ,182668 | ,322369 | ,133614 | 2,41269 | ,046589 |
| X2 | -,590613 | ,182668 | -,207469 | ,064167 | -3,23327 | ,014387 |
+----------+----------+----------+----------+----------+----------+----------+
Линейная регрессия:
.
Проверка на адекватность так же как в лабораторной работе № 3:
коэффициент корреляции
,
коэффициент детерминации
,
наблюдаемое значение критерия Фишера
,
число степеней свободы критерия Фишера
и
.
находим при уровне значимости , используя вероятностный калькулятор: F(2;7)=4,737416 p=,95.
Чтобы найти уравнение степенной модели нужно:
a) произвести линеаризацию
выборки по формулам
,
,
;
b) найдем уравнение линейной регрессии для переменных V, U1, U2;
c) вернемся к исходным переменным Y, X1, X2.
a) Линеаризация выборки
Добавляем новые переменные и вычисляем по приведенным формулам. В Statistica натуральный логарифм ln(x) записывается log(x).
+----+-----------------------------------------------------------------+
| STA|From: lab5.sta (10v * 10c) |
| MUL| |
| REG|Variables: 1-6, Cases: 1-10 |
+----+----------+----------+----------+----------+----------+----------+
| | | | | | | |
| | X1 | X2 | Y | U1 | U2 | V |
+----+----------+----------+----------+----------+----------+----------+
| 1 | 1,033 | 1,450 | 1,830 | ,032 | ,372 | ,604 |
| 2 | ,012 | 4,295 | ,580 | -4,423 | 1,457 | -,545 |
| 3 | ,045 | 3,553 | 1,340 | -3,101 | 1,268 | ,293 |
| 4 | ,243 | 1,568 | 1,340 | -1,415 | ,450 | ,293 |
| 5 | ,266 | 1,520 | 1,640 | -1,324 | ,419 | ,495 |
| 6 | ,302 | ,120 | 1,650 | -1,197 | -2,120 | ,501 |
| 7 | ,451 | ,457 | 1,910 | -,796 | -,783 | ,647 |
| 8 | 1,041 | 1,822 | 1,960 | ,040 | ,600 | ,673 |
| 9 | 1,423 | ,442 | 2,080 | ,353 | -,816 | ,732 |
| 10 | 1,914 | ,498 | 2,180 | ,649 | -,697 | ,779 |
+----+----------+----------+----------+----------+----------+----------+
b) Нахождение
уравнения линейной
регрессии для
переменных V, U1,
U2 производится так
же, как для
переменных y, x1,
x2: Analysis
- Resume Analysis - Variables - (V, U1,U2) - OK - OK - нажать
кнопку Regression Summary. В
столбце B
появившейся таблицы считать параметры
b0,
b1и
b2.
Уравнение
регрессии
.
+----------+-----------------------------------------------------------------+
| STAT. |Regression Summary for Dependent Variable: V (lab5.sta) |
| MULTIPLE |R= ,92478716 RІ= ,85523130 Adjusted RІ= ,81386881 |
| REGRESS. |F(2,7)=20,676 p<,00115 Std.Error of estimate: ,16672 |
+----------+----------+----------+----------+----------+----------+----------+
| | | St. Err. | | St. Err. | | |
| N=10 | BETA | of BETA | B | of B | t(7) | p-level |
+----------+----------+----------+----------+----------+----------+----------+
| Intercpt | | | ,682418 | ,070343 | 9,701244 | ,000026 |
| U1 | ,869217 | ,174331 | ,209911 | ,042100 | 4,986031 | ,001590 |
| U2 | -,092707 | ,174331 | -,032605 | ,061311 | -,531791 | ,611323 |
+----------+----------+----------+----------+----------+----------+----------+
Проверяем линеаризованную модель на адекватность:
Коэффициент корреляции
,
коэффициент детерминации
,
наблюдаемое значение критерия Фишера
,
число степеней свободы критерия Фишера
и
.
находим при уровне значимости , используя вероятностный калькулятор: F(2;7)=4,737416 p=,95.
c) Возврат к исходным переменным:
.
3 Выбор оптимальной модели по минимуму суммы квадратов остатков.
Сумму квадратов остатков линейной модели находим как в лабораторной работе 2: Analysis of Variance (Анализ остатков) и в появившейся таблице в строке Residual (Остаток) считать сумму квадратов остатков 0,31:
+----------+------------------------------------------------------+
| STAT. |Analysis of Variance; DV: Y (lab5.sta) |
| MULTIPLE | |
| REGRESS. | |
+----------+----------+----------+----------+----------+----------+
| | Sums of | | Mean | | |
| Effect | Squares | df | Squares | F | p-level |
+----------+----------+----------+----------+----------+----------+
| Regress. | 1,689236 | 2 | ,844618 | 19,08101 | ,001466 |
| Residual | ,309854 | 7 | ,044265 | | |
| Total | 1,999090 | | | | |
+----------+----------+----------+----------+----------+----------+
Для расчета квадратов остатков для степенной модели дополняем таблицу двумя столбцами: Y_NELIN=1,97*Х1^0,21*X2^(-0,03) и KV_OST=( Y_NELIN-Y)^2
+----+---------------------------+
| STA|From: lab5.sta (8v * 10c) |
| MUL| |
| REG|Variables: 7-8, Cases: 1-10|
+----+----------+----------+-----+
| | | |
| | Y_NELIN | KV |
+----+----------+----------+
| 1 | 1,961 | ,017 |
| 2 | ,745 | ,027 |
| 3 | ,989 | ,123 |
| 4 | 1,444 | ,011 |
| 5 | 1,473 | ,028 |
| 6 | 1,633 | ,000 |
| 7 | 1,706 | ,042 |
| 8 | 1,951 | ,000 |
| 9 | 2,174 | ,009 |
| 10 | 2,305 | ,016 |
+----+----------+----------+
Указание. Для того, чтобы перенести в отчет только некоторые столбцы, нужно их выделить и нажать клавишу F11.
Сумму квадратов остатков вычисляем как в лабораторной работе 2: войти в модуль Basic Statistics and tables - Analysis - Descriptive Statistics - More Statistics - Sum (базовые статистики и таблицы - анализ - описательные статистики - все статистики - сумма) - OK - Выделить переменную KV - OK - OK.
+----------+---------------------------------+
| STAT. |Descriptive Statistics (lab5.sta)|
| BASIC | |
| STATS | |
+----------+--------------------------+------+
| | |
| Variable | Sum |
+----------+--------------------------+
| KV | ,272961 |
+----------+--------------------------+
Выбор модели по сумме квадратов остатков. Для степенной модели сумма квадратов остатков меньше, чем для линейной: 0,27 < 0,33. Следовательно, выбираем степенную модель .
3) Определение эластичности модели.
Эластичность модели Y по переменным рассчитывается по формулам
,
.
Находим выражение для эластичности и вписываем расчетные формулы в поле Long Name.
+----+----------------------------+
| STA|From: lab5.sta (10v * 10c) |
| MUL| |
| REG|Variables: 9-10, Cases: 1-10|
+----+----------+----------+------+
| | | |
| | EX1 | EX2 |
+----+----------+----------+
| 1 | ,21 | -,03 |
| 2 | ,21 | -,03 |
| 3 | ,21 | -,03 |
| 4 | ,21 | -,03 |
| 5 | ,21 | -,03 |
| 6 | ,21 | -,03 |
| 7 | ,21 | -,03 |
| 8 | ,21 | -,03 |
| 9 | ,21 | -,03 |
| 10 | ,21 | -,03 |
+----+----------+----------+
