Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконом моделирование1.doc
Скачиваний:
34
Добавлен:
20.04.2019
Размер:
504.83 Кб
Скачать

4.1. Оценивание параметров моделей бинарного выбора

Для пробит-модели F() является функцией стандартного нормального распределения. Следовательно, логарифм функции правдоподобия примет вид:

Для пробит-модели уравнение правдоподобия имеет вид:

, (4.12)

где = Ф’; qi = 2yi – 1.

Обозначив в формуле (4.12) выражение в скобках как , получим окончательный вид уравнения правдоподобия:

. (4.13)

Для логит-модели оно существенно упрощается. Действительно, так как

,

то

.

Для обеих моделей метод Ньютона – прямой способ вычисления оценки параметров. Вторые производные для логит-модели вычисляются по формуле:

.

Заметим, что гессиан H – отрицательно определен, так что ln L является вогнутой по функцией, и, следовательно, решение уравнения (4.11) дает оценку параметров .

Для пробит-модели вычисления являются более сложными.

Процедуры оценивания пробит- и логит-моделей реализованы в большинстве современных эконометрических прикладных программах, например, «Econometric Views 3.1», «STATA», «STATISTICA».

Для оценки качества модели используются два аналога R2 для линейной регрессии: pseudo R2 и McFadden R2.

Пусть l (Log likelihood) – логарифмическая функция правдоподобия для нашей модели, а (Restr. log likelihood) – ограниченная логарифмическая функция правдоподобия, т.е. логарифмическая функция правдоподобия для модели, в которой все параметры, за исключением свободного члена, равны нулю. Очевидно, что l . Чем больше различаются их значения, тем лучше наша модель.

Оценив параметры модели, перейдем к проверке гипотез о значимости одного или группы коэффициентов моделей бинарного выбора. Самый простой метод для единственного ограничения основан на использовании t-статистики. Для большего количества ограничений проверка гипотез о значимости может проводиться при помощи тестов Вальда, отношения правдоподобия, множителей Лагранжа и др.

№3

Модели множественного выбора

Модели множественного выбора позволяют моделировать зависимость между переменной, определяющей более двух возможных состояний характеризуемого объекта, и одной или более независимыми (объясняющими) переменными. Известны два основных типа зависимых переменных:

– номинальные (качественные). Это может быть, например, выбор способа перемещения (автобус, трамвай, троллейбус);

– порядковые. Например, оценка обязательства, испытания вкуса продуктов, блюд (от отвращения до превосходного вкуса).

Множественный выбор может быть представлен как последовательность бинарных выборов. Предположим, что изучается выбор одной из трех медицинских профессий: стоматолог, терапевт и хирург. Можно ввести три бинарные переменные, соответствующие каждой профессии: yi = 1 для стоматолога, yi = 0 для всех остальных; ys = 1 для терапевта, ys = 0 для всех остальных; yt = 1 для хирурга, yt = 0 для всех остальных. Тогда выбор одной из трех альтернатив описывается в виде «дерева» последовательных решений, в узлах которого происходит бинарный выбор. В каждом узле, применяя технику оценивания для бинарных моделей, проводится оценка условной вероятности выбора соответствующей альтернативы. Безусловная вероятность вычисляется по формуле умножения вероятностей:

/

Для данных моделей обычно принимается несколько решений, каждое представляет собой выбор между двумя альтернативами. Если же решение единственно среди нескольких альтернатив, то этот класс моделей используют в основном для описания вероятности выбора каждой из возможных альтернатив как функции от индивидуальных характеристик.

Модели множественного выбора можно разделить на две группы:

– модели с неупорядоченными альтернативами (unordered models);

– модели с упорядоченными альтернативами (ordered models).

Для исследования этих двух типов моделей используют различные подходы.

№4

Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.

В соответствии с третьей предпосылкой метода наименьших квадратов требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xj остатки i имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность.

Гомоскедастичность остатков означает, что дисперсия остатков I одинакова для каждого значения x. Используя трехмерное изображение можно получить графики, иллюстрирующие гомо- и гетероскедастичность.

Наличие гетероскедастичности в отдельных случаях может привести к смещенности оценок коэффициентов регрессии, хотя несмещенность оценок коэффициентов регрессии в основном зависит от соблюдения второй предпосылки МНК, т.е. независимости остатков и величин факторов. Гетероскедастичность будет сказываться на уменьшении эффективности оценок bi. В частности, становится затруднительным использование формулы стандартной ошибки коэффициента регрессии mbi, предполагающей единую дисперсию остатков для любых значений фактора. Практически при нарушении гетероскедастичности мы имеем неравенства:

, ji (3.69)

и можно записать:

. (3.70)

При этом величина Ki может меняться при переходе от одного значения фактора xi к другому. Это означает, что сумма квадратов отклонений для зависимости

(3.71)

при наличии гетероскедастичности должна иметь вид:

. (3.72)

При минимизации этой суммы квадратов отдельные ее слагаемые взвешиваются: наблюдениям с наибольшей дисперсией придается пропорционально меньший вес. Иными словами, вклад каждого сочетания xi с yi в сумму квадратов остатков должен быть дисконтирован, чтобы учесть систематическое влияние неоднородных элементов Ki.

Задача состоит в том, чтобы определить величину Ki и внести поправку в исходные переменные. С этой целью рекомендуется использовать обобщенный метод наименьших квадратов, который эквивалентен обыкновенному МНК, примененному к преобразованным данным. Для того чтобы убедиться в необходимости использования обобщенного МНК, обычно не ограничиваются визуальной проверкой гетероскедастичности, а приводят ее эмпирическое подтверждение.

При малом объеме выборки, что наиболее характерно для эконометрических исследований, для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта, разработанный в 1965 r. Гольдфельд и Квандт рассмотрели однофакторную линейную модель, для которой дисперсия остатков возрастает пропорционально квадрату фактора. Для того чтобы оценить нарушение гомоскедастичности, они предложили параметрический тест, который включает в себя следующие шаги.

Шаг 1. Упорядочение n наблюдений по мере возрастания переменной х.

Шаг 2. Исключение из рассмотрения k центральных наблюдений; при этом (nk) / 2 > р, где р – число оцениваемых параметров.

Шаг 3. Разделение совокупности из (nk) наблюдений на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии.

Шаг 4. Определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение их отношения: D = S1 / S2, где S1 > S2.

При выполнение нулевой гипотезы о гомоскедастичности отношение G будет удовлетворять критерию с (nk – 2p) / 2 степенями свободы для каждой остаточной суммы квадратов. Чем больше величина G превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

№6 и 7

6 Термин «динамический» в данном случае характеризует каждый момент времени t в отдельности, а не весь период, для которого строится модель. Эконометрическая модель является динамической, если в данный момент времени t она учитывает значения входящих в нее переменных, относящиеся как к текущему, так и к предыдущим моментам времени, т. е. если эта модель отражает динамику исследуемых переменных в каждый момент времени.

Можно выделить два основных типа динамических эконометрических моделей. К моделям первого типа относятся модели авторегрессии и модели с распределенным лагом, в которых значения переменной за прошлые периоды времени (лаговые переменные) непосредственно включены в модель. Модели второго типа учитывают динамическую информацию в неявном виде. В эти модели включены переменные, характеризующие ожидаемый или желаемый уровень результата, или один из факторов в момент времени t. Этот уровень считается неизвестным и определяется экономическими единицами с учетом информации, которой они располагают в момент t – 1.

В зависимости от способа определения ожидаемых значений показателей различают модели неполной корректировки, адаптивных ожиданий и рациональных ожиданий. Оценка параметров этих моделей сводится к оценке параметров моделей авторегрессии.

При исследовании экономических процессов нередко приходится моделировать ситуации, когда значение результативного признака в текущий момент времени t формируется под воздействием ряда факторов, действовавших в прошлые моменты времени t – 1, t – 2, ..., t – l. Например, на выручку от реализации или прибыль компании текущего периода могут оказывать влияние расходы на рекламу или проведение маркетинговых исследований, сделанные компанией в предшествующие моменты времени. Величину l, характеризующую запаздывание в воздействии фактора на результат, в эконометрике называют лагом, а временные ряды самих факторных переменных, сдвинутые на один или более моментов времени, – лаговыми переменными.

7. Модель вида.

yt = a + b0xt + b1xt–1 + b2xt–2 + t (11.1)

является примером модели с распределенным лагом.

Наряду с лаговыми значениями независимых, или факторных, переменных на величину зависимой переменной текущего периода могут оказывать влияние ее значения в прошлые моменты или периоды времени. Например, потребление в момент времени t формируется под воздействием дохода текущего и предыдущего периодов, а также объема потребления прошлых периодов, например потребления в период t – 1. Эти процессы обычно описывают с помощью моделей регрессии, содержащих в качестве факторов лаговые значения зависимой переменной, которые называются моделями авторегрессии. Модель вида

yt = a + b0xt + c1yt–1 + t (11.2)

относится к моделям авторегрессии.

Построение моделей с распределенным лагом и моделей авторегрессии имеет свою специфику. Во-первых, оценка параметров моделей авторегрессии, а в большинстве случаев и моделей с распределенным лагом не может быть проведена с помощью обычного МНК ввиду нарушения его предпосылок и требует специальных статистических методов. Во-вторых, исследователям приходится решать проблемы выбора оптимальной величины лага и определения его структуры. Наконец, в-третьих, между моделями с распределенным лагом и моделями авторегрессии имеется определенная взаимосвязь, и в некоторых случаях необходимо осуществлять переход от одного типа моделей к другому

№8