Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
62
Добавлен:
20.05.2014
Размер:
1.67 Mб
Скачать

Виды нелинейной регрессии. Линеаризация нелинейной регрессии

Во многих случаях при проведении регрессионного анализа применение линейной модели к изучаемым данным может оказаться неэффективным. В этом случае для исследования зависимости между результативной и факторными переменными применяют нелинейные модели. Для оценивания неизвестных параметров таких регрессий их сначала сводят к линейным, а затем оценивают параметры методом МНК (методом наименьших квадратов).

Степенную форму связи можно привести к линейной форме, если вместо независимых переменных рассмотреть их логарифмы по какому-нибудь (но одному и тому же!) основанию (например, натуральные или десятичные логарифмы).

Например, пусть зависимость Y от Х выражается в виде степенной функции Y = аХb, тогда, ререходя к натуральным логарифмам, получаем уравнение: ln Y = ln a + b ln X, которое уже оценивается методом наименьших квадратов.

Действительно, переходя к логарифмам уровней (по любому основанию) в примере 3, получаем соотношение, используя десятичные логарифмы:

,тогда

где С – это дефлированное потребление, DPI – дефлированный доход.

Или, обозначая

Линейной модели связи в логарифмах соответствует линейная модель наблюденийкоторую мы уже умеем оценивать.

К линейной форме связи можно привести и некоторые другие виды зависимости, характерные для экономических моделей. Так, если — объем плановых инвестиций, анорма процента, то между ними существует связь, которая иногда может быть выражена в форме

и имеет графическое представление

Заменой переменной приводим указанную связь к линейной форме А эту модель уже оцениваем с помощью МНК.

Построение линейной регрессионной модели в Excel

Задача 1.

–совокупные личные доходы;

–текущие расходы на одежду среднестатистической американской семьи с 1976 по 1982 г.

1351,7

1369,3

1479,1

1682,5

1799,0

1924,5

2046,0

117,9

122,5

125,5

129,2

134,3

138,4

141,0


Необходимо оценить линейную регрессию на (т.е. найти оценки коэффициентов в уравнении ), найти коэффициент корреляции, стандартные ошибки коэффициентов регрессии, дать интерпретацию уравнению регрессии и коэффициентам корреляции.

Решение:

Оценим регрессию .Для этого оценим коэффициенты и

Введем данные в таблицу Excel по столбцам. В первую строчку вводятся заголовки данных. В столбец А вводятся значения Y, в столбец В вводятся значения Х.

Оценим коэффициенты регрессии с помощью программы Excel. Для этого сначала необходимо установить компонент «Пакет анализа». При создании новой или открытии существующей книги появится окно активного рабочего стола. Для того, чтобы отыскать команду вызова надстройки «Пакет анализа», необходимо воспользоваться меню «Сервис».

Здесь возможны две ситуации, в которых нужно действовать следующим образом:

1. В меню «Сервис» присутствует команда «Анализ данных». Достаточно щелкнуть указателем мыши по данной команде, чтобы попасть в окно надстройки.

2. В меню «Сервис»отсутствует команда «Анализ данных». В этом случае необходимо в том же меню выполнить команду «Надстройки». Раскроется одноименное окно со списком доступных надстроек. В этом списке нужно найти элемент «Пакет анализа», поставить рядом с ним "галочку" и щелкнуть по кнопке «ОК». После этого в меню «Сервис» появиться команда «Анализ данных».

Выбираем в меню «Сервис» пункт «Анализ данных», появиться окно с одноименным названием. В области «Инструменты анализа» представлен список реализованных в Microsoft Excel методов статистической обработки данных.

Выбираем пункт «Регрессия». Следует поставить галочку напротив метки и нажать ОК. Флажок Метки устанавливается в активное состояние, если первая строка (столбец) во входном диапазоне содержит заголовки.

На указанное место будет выдана таблица итогов:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,985571

R-квадрат

0,971351

Нормированный R-квадрат

0,965621

Стандартная ошибка

1,575835

Наблюдения

7

 

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

420,978

420,978

169,5266

4,77E-05

Остаток

5

12,41628

2,483257

Итого

6

433,3943

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

-пересечение

78,96723

3,951476

19,98424

5,8E-06

68,80965

89,12481

0,030555

0,002347

13,02024

4,77E-05

0,024523

0,036587

Проверим правильность расчетов.

Оценки коэффициентов, рассчитанные по формулам:

=78,967

= 0,031

=78,967+0,031

Дисперсии a и b (в столбце Стандартная ошибка) равны соответственно: 3,95 и 0,0023. Значимость коэффициентов (столбец P-Значение) <0,05, следовательно, они на 5-ти % уровне значимы, т.е. с вероятностью 95% они действительно влияют на Y.

Оценим качество регрессии:

R2 = 0,971351 , близко к 1. Значит, Y на 97% объясняется через Х в этом виде. Общая дисперсия регрессии: 433,3943 (TSS), дисперсия, объясненная регрессионным уравнением (RSS): 420,978, дисперсия, не объясненная регрессией (ESS): 12,41628 . Эти значения указаны в таблице итогов, в колонке SS.

Найдем коэффициент корреляции:

Corr[Х,У] = 0,986 (этот коэффициент выдается в таблице итогов, в самой верхней строке, как множественный R)

Так как коэффициент корреляции > 0, то при увеличении X увеличивается Y.

Возможна следующая экономическая интерпретация полученных результатов: с каждого дополнительного доллара американская семья в период 1976-1982 г. тратила 3,1 центов (0,031 $) на текущие расходы на одежду.

Задача 2

Пусть - температура воздуха, а – сумма денег, потраченных на лекарство пенсионерами. Из всей совокупности была сделана выборка объема 40 элементов, то есть были зафиксированы значения сумм 40 покупателей и соответствующая температура воздуха .

По этой выборке известно, что Σ=-7; Σ=90; Σ=200; Σ=2000; Σ=100; T = 40;

Найти:

  1. Найти связь между и в виде: , т.е. найти:

-? -? TSS-? ESS-? RSS-? R2=?

  1. Дисперсии и

Соседние файлы в папке Методичка Эконометрика