Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УМК-эконометрика-магистры.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
5.73 Mб
Скачать

4.3. Экспоненциальная и степенная регрессии.

Экспоненциальная регрессия имеет вид

ŷ = е + b (или ŷ= baх); (24)

степенная регрессия имеет вид

ŷ = а; (25)

Для нахождения коэффициентов а и b предварительно проводят процедуру линеаризации выражений (24) и (25):

lnŷ= lnb+xlnа, (26)

lnŷ= lnblnx, (27)

а затем уже строят линейную регрессию между lnŷ и х для экспоненциальной регрессии, и между lnŷ и lnх для степенной регрессии.

Наибольшее распространение степенной функции в эконометрике связано с тем, что параметр а имеет четкое экономическое истолкование, – он является коэффициентом эластичности. Это значит, что коэффициент b показывает, на сколько % в среднем изменится результат, если фактор изменится на 1%.

Для вычисления параметров экспоненциальной регрессии (24) на компьютере используется встроенная статистическая функция ЛГРФПРИБЛ. Порядок вычисления аналогичен применению функции ЛИНЕЙН.

Для вычисления параметров степенной регрессии после преобразования исходных данных в соответствие с (27), можно воспользоваться функцией ЛИНЕЙН.

Для получения графиков однофакторных регрессий можно применить Мастер диаграмм, строя предварительно точечный график исходных данных (диаграмму рассеяния), а затем использовать режим Добавить линию тренда (для этого установите курсор на любую точку точечной диаграммы и щелкните правой кнопкой мышки), причем в этом режиме Excel предоставляет возможность выбора шести функций – линейной, логарифмической, полиномиальной, степенной, экспоненциальной и скользящей средней. После выбора функции в режиме Параметры задайте флажок Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации(R^2).

5. Оценка качества эконометрических регрессионных моделей и прогнозирование на их основе.

5.1. Доверительные интервалы для коэффициентов: реальные статистические данные

Практическому построению доверительных интервалов для коэффициентов j нормальной модели линейной множественной регрессии

у=0+1х1 +2х2 +…+mхm+.

где  нормально распределенная случайная величина с параметрами , препятствует вхождение в выражения для дисперсий

неизвестного значения .

Единственный выход из этого положения – заменить неизвестное значение какой-нибудь подходящей его оценкой (estimate), которую можно было бы вычислить на основании имеющихся статистических данных. Такого рода оценки принято называть статистиками (statistics).

В данной ситуации такой подходящей оценкой для неизвестного значения является статистика

(см. (9)).

Поскольку сумма является квадратичной функцией от случайных величин =( ), то она является случайной величиной, а следовательно, случайной величиной является и статистика S2.

Математическое ожидание этой случайной величины равно :

т. е. несмещенная оценка для .

Замечание. В частном случае (при отсутствии факторов) модель наблюдений принимает вид

(случайная выборка из распределения N (0,2)). Несмещенной оценкой для служит

Оценкой наименьших квадратов для параметра 0 является , так что

Таким образом, выборочная дисперсия переменной , получаемая делением именно на (а не на ), является несмещенной оценкой для в модели случайной выборки из нормального распределения, имеющего дисперсию . Этим и объясняется сделанный нами выбор нормировки при определении выборочных дисперсий и ковариаций.

При выполнении стандартных предположений отношение

имеет стандартное распределение, называемое распределением хи-квадрат с (n-m-1) степенями свободы. Такое же распределение имеет сумма квадратов случайных величин, независимых в совокупности и имеющих одинаковое стандартное нормальное распределение. При график функции плотности этого распределения имеет вид

Для обозначения распределения хи-квадрат с степенями свободы используют символ 2.

Итак, мы не знаем истинного значения и поэтому в попытке построить доверительный интервал для j вынуждены заменить неизвестное нам значение на его несмещенную оценку

Соответственно, вместо отношения

приходится использовать отношение

Однако последнее отношение как случайная величина уже не имеет стандартного нормального распределения, поскольку в знаменателе теперь стоит не постоянная, а случайная величина.

Тем не менее, распределение последнего отношения также относят к стандартным, и оно известно под названием t-распределения Стьюдента с (n-m-1) степенями свободы.

Для распределения Стьюдента с степенями свободы принято обозначение t (). Квантиль уровня р такого распределения будем обозначать символом tp (K). График функции плотности распределения Стьюдента симметричен относительно нуля и похож на график функции плотности нормального распределения.

Например, при  он имеет следующий вид (левый график).

Для сравнения, справа приведен график функции стандартного нормального распределения. Отличие графиков столь невелико, что визуально они почти неразличимы. Квантили этих двух распределений различаются более ощутимо:

Распределение Стьюдента имеет более тяжелые хвосты. Из приведенных значений квантилей следует, например, что случайная величина, имеющая стандартное нормальное распределение, может превысить значение 1.645 лишь с вероятностью 0.05. В то же самое время, с такой же вероятностью 0.05 случайная величина, имеющая распределение Стьюдента с 10 степенями свободы, принимает значения, большие, чем 1.812.

Впрочем, для значений квантили распределения Стьюдента практически совпадают с соответствующими квантилями cтандартного нормального распределения .

Итак,

.

Поэтому для этой случайной величины выполняется соотношение

так что с вероятностью, равной , выполняется двойное неравенство

т. е.

Иными словами, с вероятностью, равной , случайный интервал

накрывает истинное значение коэффициента αj, т. е. является %- доверительным интервалом для αj в случае, когда не известно истинное значение 2 дисперсии случайных ошибок . В среднем, длина такого интервала больше, чем длина доверительного интервала с тем же уровнем доверия, построенного при известном значении .

Замечание. Выбор конкретного значения определяет компромисс между желанием получить более короткий доверительный интервал и желанием обеспечить более высокий уровень доверия.

Попытка повысить уровень доверия , выраженная в выборе меньшего значения , приводит к квантили с более высоким значением , т. е. к большему значению . Но длина доверительного интервала пропорциональна . Следовательно, увеличение уровня доверия сопровождается увеличением ширины доверительного интервала (при тех же статистических данных).

Так, для можно приближенно считать, что

,

где – квантиль уровня стандартного нормального распределения.

Соответственно, выбирая уровень доверия равным или , мы получаем для значения, приблизительно равные . Это означает, что переход от уровня доверия к уровню доверия сопровождается увеличением длины доверительного интервала приблизительно в раза, а дополнительное повышение уровня доверия до увеличивает длину доверительного интервала еще примерно в раза.

Теперь мы в состоянии перейти к построению интервальных оценок параметров моделей линейной регрессии для различного рода социально-экономических факторов на основании соответствующих статистических данных.

Пример. Пусть при построении модели зависимости уровня безработицы среди белого населения США от уровня безработицы среди цветного населения в виде

получены следующие значения:

Š=0.161231; .

Получаем: = . Для построения доверительного интервала для остается найти квантиль уровня распределения Стьюдента с степенями свободы. Используя, например, приложение 1, находим: . Соответственно, получаем -доверительный интервал для в виде

т. е.

Для имеем , ; -доверительный интервал для имеет вид

т. е.

В связи с этим примером, отметим два обстоятельства.

(а) Доверительный интервал для коэффициента допускает как положительные, так и отрицательные значения этого коэффициента.

(б) Каждый из двух построенных интервалов имеет уровень доверия ; однако это не означает, что с той же вероятностью сразу оба интервала накрывают истинные значения параметров , .

Справиться с первым затруднением в данном примере можно, понизив уровень доверия до . В этом случае в выражении для доверительного интервала квантиль заменяется на квантиль , так что левая граница доверительного интервала для становится положительной и равной . Однако это достигается ценой того, что новый доверительный интервал будет накрывать истинное значение параметра в среднем только в 90 случаев из 100, а не в 95 из 100 случаев.

Что касается второго затруднения, то наиболее простой путь взятия под контроль вероятности одновременного накрытия доверительными интервалами для , истинных значений этих параметров связан с тем, что

оба интервала накрывают и , соответственно =

хотя бы один из них не накрывает соответствующее =

доверительный интервал для не накрывает +

доверительный интервал для не накрывает 

оба интервала не накрывают свои =

оба интервала не накрывают свои 

Следовательно, если построить доверительный интервал для и доверительный интервал для с уровнями доверия каждого, равными , то тогда правая часть полученной цепочки соотношений будет равна

Это означает, что в нашем примере мы можем гарантировать, что вероятность одновременного накрытия истинных значений , соответствующими доверительными интервалами будет не менее , если возьмем . Но тогда при построении этих интервалов придется использовать вместо значения

значение

,

так что каждый из исходных интервалов увеличится в раза. Это, конечно, приводит к еще более неопределенным выводам относительно истинных значений параметров , .