
эконометрика / эконометрика / 2.0 Нелинейная регрессия
.pdf
Лабораторная работа № 2.
ПОСТРОЕНИЕ НЕЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ
Постановка задачи: известны статистические данные наблюдений за некоторым количеством однородных экономических объектов.
Требуется:
1.Подобрать наилучшую форму связи между результативным и независимым фактором при помощи построения диаграммы рассеяния.
2.Построить нелинейные регрессионные модели при помощи команды Анализ данных – Регрессия. Выбрать наилучшую из них.
3.Найти прогнозное значение результата по наилучшему из построенных уравнений.
Порядок выполнения работы.
Пример 2. Изучается зависимость объема производства (тыс. ед.) от инвестиций (тыс. д.е.). По данным 12 предприятий (рис. 1.1) рассчитать характеристики регрессионных моделей с различными формами связи. Выбрать модель с наилучшими характеристиками и на ее основе рассчитать прогноз объема производства, если объем инвестиций должен составить 19,5 тыс. д.е.
0. Подготовительная работа.
Занесем статистические данные в электронную таблицу по столбцам.
Рис. 2.1. Исходные данные
1. Подобрать наилучшую форму связи между результативным и независимым фактором при помощи построения диаграммы рассеяния.
Выделим исходные данные и вызовем команду Вставка – Диаграмма – Точечная. Появится диаграмма с автоматически выбранными компьютером настройками. В нашем случае столбец y распознается, как независимая переменная. При выделенной диаграмме необходимо найти команду Конструктор – Выбрать данные (рис. 2.2). Выделим название ряда и используем кнопку Изменить (рис. 2.3). Установим правильные настройки для графика (рис. 2.1, 2.3, 2.4).
Рис. 2.2. Выбор источника данных |
Рис. 2.3. Выбор диапазона исходных данных |
1

Рис. 2.4. Диаграмма рассеяния |
Рис. 2.5. Выбор линии регрессии |
Построим на графике линию тренда. Выделим поле диаграммы и найдем команду Конструктор
– Добавить элемент диаграммы – Линия тренда – Дополнительные параметры линии тренда (рис.
2.5). Выберем тип линии тренда в открывшемся меню и установим флажки: «Показывать уравнение на диаграмме», «Поместить на диаграмму величину достоверности аппроксимации».
Запишем полученные результаты и выберем другой вид линии тренда. Если меню «Формат области диаграммы» закрыто, то его легко открыть, щелкнув правой клавишей по линии тренда и выбрав в контекстном меню команду «Формат линии тренда». Замечание: среди предлагаемых функций нет гиперболы!
2. Построить нелинейные регрессионные модели при помощи команды Анализ данных – Регрессия. Выбрать наилучшую из них.
Построим рабочую таблицу (рис. 2.6) для расчета параметров различных нелинейных моделей.
Рис. 2.6. Рабочая таблица для построения нелинейных регрессионных моделей
Команда Регрессия использует алгоритм для нахождения параметров только линейного уравнения, поэтому перед ее использованием выбранный вид нелинейного уравнения регрессии следует привести к линейному виду. Воспользуемся данными таблицы 2.1.
2
Таблица 2.1.
№ |
|
|
|
|
|
|
Вид уравнения |
|
|
|
|
|
|
|
|
|
|
Входной |
Входной |
||||||
п.п. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
интервал y |
интервал x |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
1. |
Логарифмическое y b0 b1 ln x |
yˆ ... |
|
... ln x, R |
2 |
... |
|
|
|
|
|
y |
ln x |
||||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
(...) |
(...) |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
tcm |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. |
Полиномиальное 2 степени y b0 b1x b2 x |
2 |
yˆ ... ... x ... x |
2 |
, R |
2 |
... |
y |
x, x2 |
||||||||||||||||
|
|||||||||||||||||||||||||
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
tcm |
(...) (...) |
(...) |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
3. |
Степенное y b0 x |
b1 |
ln yˆ |
... |
... ln x, R |
2 |
... |
|
|
|
|
|
|
|
|
|
ln y |
ln x |
|||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
tcm |
|
|
(...) |
(...) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4. |
Экспоненциальное |
y b0e |
b1x |
ln yˆ ... ... x, R |
2 |
... |
|
|
|
|
|
|
ln y |
x |
|||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
tcm |
(...) |
|
(...) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5. |
Гиперболическое y b0 b1 |
|
1 |
yˆ |
... ... |
1 |
, R2 |
... |
|
|
|
|
|
|
y |
1 / x |
|||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
x |
tcm |
(...) |
|
(...) |
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
Рассчитаем параметры уравнения с формой связи в виде параболы, т.к. для этого уравнения R2 оказался наибольшим. В случае построения параболы Входной интервал X должен содержать два столбца значений, в нашем случае С36:D48 (табл. 2.1 и рис. 2.6).
Мы получили следующее уравнение: yˆ 328,98 33,58 x 1,02 x2 , R2 0,7882 tcm (2,45) ( 2,18) (2,31) F 18,39
Для уровня значимости 0,05 и 9 степеней свободы tкр = 2,26, следовательно, мы не можем отклонить гипотезу о статистической незначимости коэффициента b1 = – 33,58. Значит, модель в виде параболы не может наилучшим образом описывать зависимость между факторами x и y.
Следующий по величине R2 имеет экспоненциальное уравнение. В меню Анализ данных – Регрессия изменим Входной интервал Х: C36:C48, Входной интервал Y: F36:F48 (рис. 2.6) и Выходной интервал.
Используя данные протокола регрессионного анализа, запишем полученное уравнение: ln yˆ 3,34 0,04 x, R2 0,6633
tcm (23,2) (4,44) F 19,7
Статистические характеристики в данном случае оказались удовлетворительными. Можно предположить, что это уравнение наилучшим образом описывает взаимосвязь факторов. Чтобы подтвердить наше предположение, найдем уравнение с гиперболической формой связи. Входной интервал Y: B36:B48; Входной интервал X: E36:E48. Результаты расчетов для гиперболической и других форм связи представлены в таблице 2.2. Заметим, что наилучшие характеристики имеет экспоненциальное уравнение.
|
|
|
|
|
|
Таблица 2.2 |
№ п.п. |
|
|
Уравнение регрессии |
|
Примечания |
|
1. |
Логарифмическое |
|
|
Уравнение удовлетворительного качества, однако |
||
|
yˆ 47,12 35,42 ln x, R2 0,6477 |
|
хуже экспоненциального. |
|||
|
tcm |
( 2) |
(4,29) |
F 18,39 |
|
|
2. |
Полиномиальное 2 степени |
|
Наибольший R2, однако коэффициент при x |
|||
|
yˆ 328,98 33,58 x 1,02 x2 , R2 0,7882 |
|
статистически незначим. |
|||
|
tcm |
(2,45) |
( 2,18) |
(2,31) F 18,39 |
|
|
3. |
Степенное |
|
|
|
Уравнение удовлетворительного качества, однако |
|
|
ln yˆ 2,15 0,64 ln x, R2 0,6494 |
|
хуже экспоненциального. |
|||
|
tcm |
(5,07) (4,3) |
F 18,52 |
|
|
|
4. |
Экспоненциальное |
|
|
Второй по величине R2, коэффициент при x |
||
|
ln yˆ 3,34 0,04 x, R2 0,6633 |
|
статистически значим. Наилучшее из всех |
|||
|
tcm |
(23,2) (4,44) F 19,7 |
|
уравнений. |
||
|
|
|
||||
|
|
|
|
|
3 |
|
№ п.п. |
Уравнение регрессии |
Примечания |
||
5. |
Гиперболическое |
|
|
Уравнение удовлетворительного качества, однако |
|
yˆ 89,14 609,56 |
1 |
, R2 0,6327 |
хуже экспоненциального. |
|
|
|||
|
x |
|
||
|
|
|
|
|
|
tcm (10,37) ( 4,15) |
|
F 17,23 |
|
|
|
|
|
|
3. Поиск точечного прогноза.
Итак, мы выбрали экспоненциальное уравнение (см. табл. 2.2). Выразим y через x в явном виде: yˆ 28,23e . Рассчитаем прогноз: ynp 28,23e0,04 19,5 61,58 тыс. ед. Значит, если инвестиции будут равны 19,5 тыс. д.е., то объем производства должен составить 61 тыс. 580 ед.
4. Оформление отчета.
План отчета.
1.Укажите фамилию, имя, название группы, номер варианта.
2.Запишите все уравнения парной нелинейной регрессии, которые упоминаются в условии Вашего варианта, по форме, представленной в таблице 2.1. При необходимости выразите y через x в явном виде.
3.Выберите лучшую модель, поясните свой выбор.
4.Дайте экономическую интерпретацию полученной взаимосвязи.
5.Оцените качество модели и статистическую значимость ее параметров.
6.Рассчитайте точечный прогноз результативного фактора.
7.Проверьте прогнозные свойства модели с помощью средней ошибки аппроксимации.
4