- •Руководство для выполнения контрольной работы по эконометрике
- •Тема 1. Парная регрессия
- •1.1. Линейная парная регрессия
- •1.2. Нелинейная парная регрессия
- •1.2.4 Остаточная сумма квадратов отклонений:
- •1.2.6 Средняя относительная ошибка аппроксимации:
- •1.2.7 Средний коэффициент эластичности:
- •Тема 2. Множественная регрессия
- •Тема 3. Временные ряды
- •Распределение Дарбина-Уотсона
- •Литература
1.2. Нелинейная парная регрессия
Расчетные формулы
Нелинейная регрессия, линейная по параметрам.
1.2.1 Линеаризация модели выполняется путем введения новых переменных, относительно которых модель будет линейной. Например, если модель имеет вид:
,
то введение новой
переменной
позволяет получить линейную относительно
этой переменной модель:
.
1.2.2 МНК - оценки
коэффициентов
модели:
,
,
,
,
,
,
.
В итоге получается
нелинейная парная регрессия
.
1.2.3 Выборочная дисперсия и среднее квадратическое отклонение (СКО):
.
1.2.4 Остаточная сумма квадратов отклонений:
.
1.2.4 Индекс корреляции:
.
1.2.5 Индекс детерминации:
.
1.2.6 Средняя относительная ошибка аппроксимации:
.
1.2.7 Средний коэффициент эластичности:
.
1.2.8
критерий
Фишера:
,
где
число
параметров модели.
Нелинейная регрессия, нелинейная по параметрам.
1.2.9 Для линеаризации модели её предварительно логарифмируют и вводят в рассмотрение новые переменные, относительно которых модель будет уже линейной. Рассмотрим, например, степенную модель
.
После логарифмирования она примет вид:
.
Введя новые переменные:
,
получаем линейную модель:
.
1.2.10 МНК - оценки
коэффициентов
этой модели:
,
,
,
,
,
,
.
1.2.11 Оценка
коэффициента
:
.
В результате
получается степенная регрессия
.
1.2.12 Факторная сумма квадратов:
![]()
1.2.12 Индекс корреляции:
.
1.2.13 Индекс детерминации:
.
Средняя относительная
ошибка аппроксимации, средний коэффициент
эластичности и
критерий
Фишера вычисляются по формулам 1.2.6,
1.2.7, и 1.2.8 соответственно.
Решение типовой задачи.
Для данных, представленных в таблице 1.1 требуется:
1.
Построить гиперболическую регрессионную
модель зависимости заработной платы
от возраста рабочего, вычислить индекс
корреляции и детерминации, а также
статистическую значимость уравнения
регрессии на уровне
.
2.
Построить степенную регрессионную
модель зависимости заработной платы
от возраста рабочего, оценить её точность
по индексу детерминации и средней
относительной ошибки аппроксимации и
значимость (на уровне
).
3. Сравнить модели парной регрессии (включая линейную) по индексу детерминации и средней относительной ошибки аппроксимации и выбрать наилучшую.
Решение выполним в среде MS Excel.
1. Оценим
гиперболическую
модель
.
Она линейна по параметрам
.
Введем новую
переменную
.
Линеаризованная модель примет вид:
.
Сформируем расчетную таблицу следующей структуры:
|
№ п/п |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
|
|
|
|
Сумма |
|
|
|
|
|
|
|
|
|
|
|
Среднее |
|
|
|
|
|
|
|
|
|
|
Введем исходные
данные
,
в таблицу по столбцам и рассчитаем
колонки
,
,
,
.
Вычисляем суммы и средние значения
столбцов с помощью функций СУММ(…)
и
СРЗНАЧ(…).
Выполним расчет параметров уравнения регрессии по формулам 1.2.2:
,
.
В итоге получена
гиперболическая модель:
.
Вычислим предсказанные моделью значения з/п по формуле
![]()
и тем самым заполним
колонку
расчетной таблицы. Далее вычисляются
остатки
и их квадраты
.
В итоге в строке "Сумма" колонки
таблицы определится остаточная сумма
квадратов
.
Построим график функции на поле корреляции с помощью Мастера диаграмм и убедимся, что МНК дал хорошие результаты аппроксимации.

Найдем значения
выборочной дисперсии и СКО для
по формулам 1.2.3:
,
.
Найдем индекс корреляции по формуле 1.2.4:
.
Индекс корреляции близок к единице и это указывает на тесную гиперболическую связь между изучаемыми признаками.
Рассчитаем индекс детерминации по формуле 1.2.5:
.
Значение индекса
детерминации
близко к единице и по нему следует, что
з/п по этой модели на 78% обусловлена
таким фактором, как возраст рабочего.
Проверим качество
модели по средней относительной ошибке
аппроксимации, вычислив
по формуле 1.2.6. Для этого в первой строке
колонки
набираем с использованием функции
ABS(…)
формулу: =ABS(
)*100.
После протяжки по всему столбцу вычисляем
среднее значение данного столбца:
=
.
По
видно, что в среднем расчетные значения
отклоняются от фактических на 8,7%, что
говорит о хорошем качестве модели по
этому критерию.
Вычислим средний коэффициент эластичности по формуле 1.2.7:
Найдем производную
.
Отсюда
.
Он показывает, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,74%.
Рассчитаем
критерий
Фишера по формуле 1.2.8 (в нашем случае
):
.
Табличное значение
=
определяем с помощью встроенной
статистической функции FРАСПОБР
по уровню значимости
и числам свободы
и
.
Поскольку
,
то можно сделать вывод о хорошей
аппроксимации статистических данных
построенной моделью.
2. Построим
степенную
модель
.
Эта модель является нелинейной по
параметру
.
Выполним
преобразования по формулам 1.2.9.
Линеаризованная модель примет вид:
.
Здесь
,
.
Сформируем расчетную таблицу следующей структуры:
|
№ п/п |
|
|
|
|
|
|
|
|
|
|
( |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Сумма |
|
|
|
|
|
|
|
|
|
|
|
|
|
Среднее |
|
|
|
|
|
|
|
|
|
|
|
|
Введем исходные
данные
,
в таблицу по столбцам и рассчитаем
колонки
,
,
,
.
Вычисляем суммы и средние значения
столбцов с помощью функций СУММ(…)
и
СРЗНАЧ(…).
Выполним расчет параметров уравнения регрессии по формулам 1.2.10:
,
.
Найдем оценку
коэффициента
с использованием функции EXP(…):
.
В результате
построена степенная модель
.
Вычислим на основе модели значения з/п по формуле:
![]()
с использованием
встроенной функции СТЕПЕНЬ(
;
).
В итоге будет заполнена колонка
таблицы.
Далее вычисляются
остатки
,
их квадраты
,
разности
,
а также их квадраты
.
В итоге в строке "Сумма" колонки
таблицы определится факторная сумма
квадратов
.
Построим график функции на поле корреляции с помощью Мастера диаграмм и убедимся, что кривая неплохо представляет искомую зависимость.

Найдем индекс
корреляции по формуле 1.2.12 (значение
определено ранее):
.
Близость индекса корреляции к единице указывает на тесную степенную связь между изучаемыми признаками.
Рассчитаем индекс детерминации по формуле 1.2.13:
.
Из значения индекса
детерминации
следует, что з/п по этой модели на 84%
обусловлена возрастом рабочего.
Оценим качество
модели по средней относительной ошибке
аппроксимации, вычислив
по формуле 2.6:
=
.
По
видно, что в среднем расчетные значения
отклоняются от фактических на 9,9%, что
говорит о неплохом качестве модели по
этому критерию.
Вычислим средний коэффициент эластичности по формуле 1.2.7:
Найдем производную:
.
Отсюда
.
Из этого следует, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,86%.
Рассчитаем
критерий
Фишера по формуле 1.2.8:
.
Табличное значение
=
уже ранее определено. Так как выполняется
неравенство
,
то можно сделать вывод о надежности и
статистической значимости степенной
модели.
3. Для сравнения двух нелинейных моделей составим итоговую таблицу со значениями средней относительной ошибки аппроксимации и индекса детерминации:
-
Модель


Гиперболическая
8,73
0,778
Степенная
9,90
0,844
Линейная
10,16
0,72
Из таблицы видно, что по средней ошибке аппроксимации лучшей является гиперболическая модель, а по индексу детерминации – степенная. Но по этим показателям они обе лучше линейной модели. Для практического использования можно рекомендовать степенную модель.
Задания для самостоятельной работы.
Задача 1. В таблице 1.2 приводятся данные по различным регионам России о среднедушевом прожиточном минимуме в день одного трудоспособного x (руб) и среднедневной заработной плате y (руб).
Табл. 1.2
|
Номер варианта |
Параметры |
Номер региона |
|||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
|
1 |
x |
81 |
85 |
89 |
76 |
92 |
104 |
72 |
88 |
76 |
84 |
|
y |
135 |
149 |
137 |
152 |
164 |
198 |
143 |
155 |
161 |
167 |
|
|
2 |
x |
92 |
87 |
83 |
95 |
77 |
99 |
80 |
93 |
79 |
92 |
|
y |
128 |
131 |
147 |
164 |
173 |
207 |
155 |
164 |
148 |
192 |
|
|
3 |
x |
77 |
83 |
89 |
81 |
97 |
113 |
82 |
93 |
79 |
94 |
|
y |
133 |
150 |
145 |
161 |
178 |
189 |
167 |
174 |
122 |
154 |
|
|
4 |
x |
89 |
76 |
91 |
79 |
99 |
86 |
112 |
107 |
87 |
96 |
|
y |
132 |
127 |
131 |
120 |
154 |
143 |
153 |
149 |
125 |
146 |
|
|
5 |
x |
95 |
98 |
78 |
87 |
91 |
101 |
79 |
88 |
69 |
107 |
|
y |
144 |
156 |
132 |
145 |
158 |
172 |
126 |
139 |
115 |
159 |
|
|
6 |
x |
77 |
89 |
84 |
69 |
93 |
87 |
76 |
90 |
104 |
111 |
|
y |
161 |
149 |
159 |
122 |
137 |
143 |
135 |
190 |
202 |
221 |
|
|
7 |
x |
85 |
89 |
90 |
109 |
112 |
96 |
92 |
78 |
94 |
108 |
|
y |
133 |
143 |
147 |
198 |
210 |
207 |
189 |
178 |
188 |
214 |
|
|
8 |
x |
85 |
87 |
93 |
97 |
104 |
87 |
91 |
113 |
106 |
86 |
|
y |
157 |
169 |
198 |
225 |
214 |
203 |
198 |
246 |
217 |
159 |
|
|
9 |
x |
79 |
86 |
80 |
95 |
98 |
106 |
117 |
108 |
92 |
87 |
|
y |
176 |
179 |
176 |
181 |
215 |
232 |
241 |
208 |
205 |
180 |
|
|
10 |
x |
113 |
89 |
95 |
93 |
102 |
123 |
154 |
137 |
98 |
96 |
|
y |
224 |
199 |
257 |
248 |
232 |
256 |
302 |
264 |
213 |
245 |
|
Требуется:
1. Построить поле корреляции и сформулировать гипотезу о форме связи y и x .
2. Построить уравнение линейной парной регрессии; определить для него коэффициент детерминации и среднюю относительную ошибку аппроксимации.
3. На поле корреляции построить график полученной кривой.
4. Дать с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результирующим признаком.
5. Оценить статистическую значимость параметров регрессии и модели в целом, а также построить интервальную оценку коэффициентов линейной регрессии с надежностью 0,95.
6. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющего 107% от среднего уровня, и оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
7. Построить
гиперболическую регрессионную модель
зависимости среднедневной заработной
платы от среднедушевого прожиточного
минимума, вычислить индекс корреляции
и детерминации, а также статистическую
значимость уравнения регрессии по
критерию
на уровне
.
8. Построить
степенную регрессионную модель, оценить
её точность по индексу детерминации и
средней относительной ошибки аппроксимации
и установить значимость уравнения
регрессии по
критерию
(на уровне
).
9. На поле корреляции построить графики полученных нелинейных кривых.
10. Сравнить модели парной регрессии (включая линейную) по индексу детерминации и средней относительной ошибки аппроксимации и выбрать наилучшую.
