- •Оглавление:
- •Модели с дискретными зависимыми переменными Модели бинарного выбора.
- •Logit-модель.
- •Probit-модель
- •Gompit-модель.
- •Сравнение моделей.
- •Модели множественного выбора
- •Модель Пуассона
- •Модели с дискретно-непрерывными переменными Модель с цензурированными выборками
- •Модель с урезанными выборками
- •Другие спецификации моделей.
- •Модель Хекмана.
Модель с урезанными выборками
Если выборка производится не из всей
возможной совокупности, а лишь из тех,
что удовлетворяют каким-то априорным
ограничениям, то такую выборку называют
урезанной. Как правило, урезание приводит
к смещению МНК-оценок, поэтому для
урезанных выборок используют метод
максимального правдоподобия. В этом
разделе мы рассмотрим случай, когда
урезание осуществляется пороговым
значением для зависимой переменной,
т.е исключаются все те наблюдения, у
которых значение зависимой переменной
меньше некоторой заданной величины. То
есть из нормальной регрессионной модели
,
где
,
выбираются только те наблюдения, для
которых yt
> 2000. То есть , в данном случае урезаются
расходы на страховку, которые меньше
2000 $. Тогда имеем следующие выражения
для математического ожидания и дисперсии:
Где
.
Если записать регрессионное уравнение
для урезанной выборки, то получим
следующее:
,
и в силу выражений, описанных выше,
ошибка ut
имеет среднее значение σλ(сt)
и дисперсию
.
Это означает, что применяя к модели
метод наименьших квадратов, мы будем
получать смещенные и несостоятельные
оценки параметров β.
Как и в предыдущих главах, для построения состоятельных оценок можно воспользоваться методом максимального правдоподобия, который реализован во многих статистических пакетах, в том числе и в eviews.
Результаты вычислений приведены в следующей таблице:
Таблица 18 Результаты построения регрессии. Урезанная выборка
Модель и коэффициенты –значимы.
Далее найдем предельный эффект объясняющих факторов и сравним с предельным эффектом, полученным при цезурировании выборки.
Рисунок 17 Графики предельных эффектов при цензурированной и урезанной выборках.
Как видно на рисунке 17, Одинаковое поведение кривых, однако на разных уровнях. Далее сравним предсказанные значение двух моделей.
Рисунок 18 График сравнения прогнозных значений при цензурированной и урезанной выборках.
Как видно из графика, модель с цензурированной выборкой предсказывает более высокие значения расходов на страхование с увеличением стоимости автомобиля, чем модель с урезанной выборкой.
Сравним две модели с помощью информационных критериев.
Таблица 19 Информационные критерии. Урезанная выборка.
Модель с цензурированной выборкой является более предпочтительной, т.к значения информационных критериев меньше.
Другие спецификации моделей.
Однако кроме тобит оценивания, существуют и другие способы. Расчеты представим ниже.
Таблица 20 Результат построения регрессий.
Выберем наилучшею из дополнительно рассчитанных.
Таблица 21 Сравнение информационных критериев 4 моделей.
Как видно из таблицы, представленной выше, оптимальной моделью является модель 1.2, так для нее значения информационных тритиев являются наименьшими.
Модель Хекмана.
Все исследование сконцентрировано на анализе стоимости полиса автострахования КАСКО. Соответственно, если углубляться в данную тему, то можно столкнуться с таким явлением, как предоставление скидок на основе аварийности предыдущего сезона и другими особенностями. Логично, что под такие «выгодные условия» попадают совершенно разные люди, а не по тем признакам, по которым производилось деление ранее. В этой главе мы будем использовать модели, которые ослабляют это ограничение. Данная модель известна в эконометрической теории как модель с выборной селективностью, или тобит-модель II, модель для описания проблем, связанных с ограничениями на процесс формирования выборки. В рамках данного разделе мною было построено две модели. Принципиальное их различие – это наличие дополнительной переменной во второй модели. Данной переменной выступил пол. Было бы интересно посмотреть существенны ли различия в зависимости от пола.
Таким образом, мы впервые в регрессионном
анализе сталкиваемся с лямбдой Хекмана,
которая характеризует собой смещение
из-за селективности выборки в МНК-оценке.
Лямбда Хекмана представляет собой
условное математическое ожидание
нормально распределенной переменной
с нулевым средним, деленное на стандартное
отклонение:
Критическим моментом всей этой модели является коэффициент корреляции между остатками двумя уравнений, который делает модель с выборочной селективностью отличной от просто модели регрессии и пробит-модели:
Оцениваем модель бинарного выбора. Исследуем влияние цены авто на принятие решения о покупке второго автомобиля.
Коэффициенты регрессии и модель значима. При этом информационный критерий Акаике =0,64; Шварца = 0,65, а Нананна-Куина = 0,645.
Далее считаем лямбду Хекмана и строим МНК-регрессию по усеченной выборке (влияние стоимости автомобиля на размер затрат на покупку КАСКО).
Модель значима, как и коэффициенты. Доля объясненной дисперсии высока – 74,6%, однако значения информационных критериев (Акаике, Шварца и Хана-Куина) равны 16,24-16,26.
Построим график наблюдаемых и прогнозных
значений
Теперь построим вторую модель. Пусть теперь еще включается гендерный фактор. В данном случае используется дамми- переменная. Единичное значение соответствует наблюдениям домохозяйств, в которых решение о покупке страховки принимает женщина.
Модель значима, однако коэффициент при переменной «пол» - незначим, соответственно интерпретировать нельзя. Значит рассмотрим отдельно оценки для наблюдений с разным значением фиктивной переменной(отдельно модели для мужчин и женщин).
Объясняющая способность модели женщин выше чем у мужчин, и лучше чем у исходной. Из этого можно сказать, что рассматривать по полу отдельно адекватнее. При этом коэффициент регрессии при Х в модели отдельно для мужчин и отдельно для женщин отличают на самую малость.
