
- •№1 И 2 вместе
- •4.1. Оценивание параметров моделей бинарного выбора
- •Интерпретация параметров моделей с распределенным лагом и моделей авторегрессии
- •Изучение структуры лага и выбор вида модели с распределенным лагом
- •Лаги Алмон
- •Модель распределенных лагов
- •Структурная и приведенная формы модели
- •Проблема идентификации
- •№19Оценивание параметров структурной модели
- •№20.Освенный метод наименьших квадратов
- •Автокорреляция в остатках. Критерий Дарбина-Уотсона
4.1. Оценивание параметров моделей бинарного выбора
Для пробит-модели F() является функцией стандартного нормального распределения. Следовательно, логарифм функции правдоподобия примет вид:
Для пробит-модели уравнение правдоподобия имеет вид:
, (4.12)
где = Ф’; qi = 2yi – 1.
Обозначив в формуле (4.12) выражение в скобках как , получим окончательный вид уравнения правдоподобия:
. (4.13)
Для логит-модели оно существенно упрощается. Действительно, так как
,
то
.
Для обеих моделей метод Ньютона – прямой способ вычисления оценки параметров. Вторые производные для логит-модели вычисляются по формуле:
.
Заметим, что гессиан H – отрицательно определен, так что ln L является вогнутой по функцией, и, следовательно, решение уравнения (4.11) дает оценку параметров .
Для пробит-модели вычисления являются более сложными.
Процедуры оценивания пробит- и логит-моделей реализованы в большинстве современных эконометрических прикладных программах, например, «Econometric Views 3.1», «STATA», «STATISTICA».
Для оценки качества модели используются два аналога R2 для линейной регрессии: pseudo R2 и McFadden R2.
Пусть
l
(Log
likelihood)
– логарифмическая функция правдоподобия
для нашей модели, а
(Restr.
log
likelihood)
– ограниченная логарифмическая функция
правдоподобия, т.е. логарифмическая
функция правдоподобия для модели, в
которой все параметры, за исключением
свободного члена, равны нулю. Очевидно,
что l
.
Чем больше различаются их значения, тем
лучше наша модель.
Оценив параметры модели, перейдем к проверке гипотез о значимости одного или группы коэффициентов моделей бинарного выбора. Самый простой метод для единственного ограничения основан на использовании t-статистики. Для большего количества ограничений проверка гипотез о значимости может проводиться при помощи тестов Вальда, отношения правдоподобия, множителей Лагранжа и др.
№3
Модели множественного выбора
Модели множественного выбора позволяют моделировать зависимость между переменной, определяющей более двух возможных состояний характеризуемого объекта, и одной или более независимыми (объясняющими) переменными. Известны два основных типа зависимых переменных:
– номинальные (качественные). Это может быть, например, выбор способа перемещения (автобус, трамвай, троллейбус);
– порядковые. Например, оценка обязательства, испытания вкуса продуктов, блюд (от отвращения до превосходного вкуса).
Множественный выбор может быть представлен как последовательность бинарных выборов. Предположим, что изучается выбор одной из трех медицинских профессий: стоматолог, терапевт и хирург. Можно ввести три бинарные переменные, соответствующие каждой профессии: yi = 1 для стоматолога, yi = 0 для всех остальных; ys = 1 для терапевта, ys = 0 для всех остальных; yt = 1 для хирурга, yt = 0 для всех остальных. Тогда выбор одной из трех альтернатив описывается в виде «дерева» последовательных решений, в узлах которого происходит бинарный выбор. В каждом узле, применяя технику оценивания для бинарных моделей, проводится оценка условной вероятности выбора соответствующей альтернативы. Безусловная вероятность вычисляется по формуле умножения вероятностей:
/
Для данных моделей обычно принимается несколько решений, каждое представляет собой выбор между двумя альтернативами. Если же решение единственно среди нескольких альтернатив, то этот класс моделей используют в основном для описания вероятности выбора каждой из возможных альтернатив как функции от индивидуальных характеристик.
Модели множественного выбора можно разделить на две группы:
– модели с неупорядоченными альтернативами (unordered models);
– модели с упорядоченными альтернативами (ordered models).
Для исследования этих двух типов моделей используют различные подходы.
№4
Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.
В соответствии с третьей предпосылкой метода наименьших квадратов требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xj остатки i имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность.
Гомоскедастичность остатков означает, что дисперсия остатков I одинакова для каждого значения x. Используя трехмерное изображение можно получить графики, иллюстрирующие гомо- и гетероскедастичность.
Наличие гетероскедастичности в отдельных случаях может привести к смещенности оценок коэффициентов регрессии, хотя несмещенность оценок коэффициентов регрессии в основном зависит от соблюдения второй предпосылки МНК, т.е. независимости остатков и величин факторов. Гетероскедастичность будет сказываться на уменьшении эффективности оценок bi. В частности, становится затруднительным использование формулы стандартной ошибки коэффициента регрессии mbi, предполагающей единую дисперсию остатков для любых значений фактора. Практически при нарушении гетероскедастичности мы имеем неравенства:
, j
i (3.69)
и можно записать:
. (3.70)
При этом величина Ki может меняться при переходе от одного значения фактора xi к другому. Это означает, что сумма квадратов отклонений для зависимости
(3.71)
при наличии гетероскедастичности должна иметь вид:
. (3.72)
При минимизации этой суммы квадратов отдельные ее слагаемые взвешиваются: наблюдениям с наибольшей дисперсией придается пропорционально меньший вес. Иными словами, вклад каждого сочетания xi с yi в сумму квадратов остатков должен быть дисконтирован, чтобы учесть систематическое влияние неоднородных элементов Ki.
Задача состоит в том, чтобы определить величину Ki и внести поправку в исходные переменные. С этой целью рекомендуется использовать обобщенный метод наименьших квадратов, который эквивалентен обыкновенному МНК, примененному к преобразованным данным. Для того чтобы убедиться в необходимости использования обобщенного МНК, обычно не ограничиваются визуальной проверкой гетероскедастичности, а приводят ее эмпирическое подтверждение.
При малом объеме выборки, что наиболее характерно для эконометрических исследований, для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта, разработанный в 1965 r. Гольдфельд и Квандт рассмотрели однофакторную линейную модель, для которой дисперсия остатков возрастает пропорционально квадрату фактора. Для того чтобы оценить нарушение гомоскедастичности, они предложили параметрический тест, который включает в себя следующие шаги.
Шаг 1. Упорядочение n наблюдений по мере возрастания переменной х.
Шаг 2. Исключение из рассмотрения k центральных наблюдений; при этом (n – k) / 2 > р, где р – число оцениваемых параметров.
Шаг 3. Разделение совокупности из (n – k) наблюдений на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии.
Шаг 4. Определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение их отношения: D = S1 / S2, где S1 > S2.
При выполнение нулевой гипотезы о гомоскедастичности отношение G будет удовлетворять критерию с (n – k – 2p) / 2 степенями свободы для каждой остаточной суммы квадратов. Чем больше величина G превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.
№6 и 7
6 Термин «динамический» в данном случае характеризует каждый момент времени t в отдельности, а не весь период, для которого строится модель. Эконометрическая модель является динамической, если в данный момент времени t она учитывает значения входящих в нее переменных, относящиеся как к текущему, так и к предыдущим моментам времени, т. е. если эта модель отражает динамику исследуемых переменных в каждый момент времени.
Можно выделить два основных типа динамических эконометрических моделей. К моделям первого типа относятся модели авторегрессии и модели с распределенным лагом, в которых значения переменной за прошлые периоды времени (лаговые переменные) непосредственно включены в модель. Модели второго типа учитывают динамическую информацию в неявном виде. В эти модели включены переменные, характеризующие ожидаемый или желаемый уровень результата, или один из факторов в момент времени t. Этот уровень считается неизвестным и определяется экономическими единицами с учетом информации, которой они располагают в момент t – 1.
В зависимости от способа определения ожидаемых значений показателей различают модели неполной корректировки, адаптивных ожиданий и рациональных ожиданий. Оценка параметров этих моделей сводится к оценке параметров моделей авторегрессии.
При исследовании экономических процессов нередко приходится моделировать ситуации, когда значение результативного признака в текущий момент времени t формируется под воздействием ряда факторов, действовавших в прошлые моменты времени t – 1, t – 2, ..., t – l. Например, на выручку от реализации или прибыль компании текущего периода могут оказывать влияние расходы на рекламу или проведение маркетинговых исследований, сделанные компанией в предшествующие моменты времени. Величину l, характеризующую запаздывание в воздействии фактора на результат, в эконометрике называют лагом, а временные ряды самих факторных переменных, сдвинутые на один или более моментов времени, – лаговыми переменными.
7. Модель вида.
yt = a + b0 xt + b1 xt–1 + b2 xt–2 + t (11.1)
является примером модели с распределенным лагом.
Наряду с лаговыми значениями независимых, или факторных, переменных на величину зависимой переменной текущего периода могут оказывать влияние ее значения в прошлые моменты или периоды времени. Например, потребление в момент времени t формируется под воздействием дохода текущего и предыдущего периодов, а также объема потребления прошлых периодов, например потребления в период t – 1. Эти процессы обычно описывают с помощью моделей регрессии, содержащих в качестве факторов лаговые значения зависимой переменной, которые называются моделями авторегрессии. Модель вида
yt = a + b0 xt + c1 yt–1 + t (11.2)
относится к моделям авторегрессии.
Построение моделей с распределенным лагом и моделей авторегрессии имеет свою специфику. Во-первых, оценка параметров моделей авторегрессии, а в большинстве случаев и моделей с распределенным лагом не может быть проведена с помощью обычного МНК ввиду нарушения его предпосылок и требует специальных статистических методов. Во-вторых, исследователям приходится решать проблемы выбора оптимальной величины лага и определения его структуры. Наконец, в-третьих, между моделями с распределенным лагом и моделями авторегрессии имеется определенная взаимосвязь, и в некоторых случаях необходимо осуществлять переход от одного типа моделей к другому
№8