
- •№1 И 2 вместе
- •4.1. Оценивание параметров моделей бинарного выбора
- •Интерпретация параметров моделей с распределенным лагом и моделей авторегрессии
- •Изучение структуры лага и выбор вида модели с распределенным лагом
- •Лаги Алмон
- •Модель распределенных лагов
- •Структурная и приведенная формы модели
- •Проблема идентификации
- •№19Оценивание параметров структурной модели
- •№20.Освенный метод наименьших квадратов
- •Автокорреляция в остатках. Критерий Дарбина-Уотсона
№1 И 2 вместе
В классе моделей бинарного выбора зависимая переменная может принимать только два значения, т.е. она является качественной переменной, определяющей одно из двух возможных состояний.
.
Следовательно, вектор Y = (y1, y2, …, yn) исходных статистических данных будет содержать только дихотомические (бинарные) признаки. Для исследования зависимости Y = (y1, y2, …, yn) от ряда объясняющих переменных x = (x1, x2,..., хk)' может быть использована модель линейной регрессии:
, i
= 1,…, n (4.1)
где i – номер наблюдения; = (l, 2,..., k)' – набор неизвестных параметров; i – случайная ошибка.
Таким образом, модель (4.1) может быть записана в виде
, (4.2)
поэтому ее называют линейной моделью вероятности. Линейная модель вероятности имеет множество недостатков, наличие которых не позволяет использовать ее для оценивания коэффициентов и прогнозирования y.
Рассмотрим простейшую линейную вероятностную модель:
где у – использование прогрессивной технологии, х – возраст оборудования (в годах).
Необходимо отметить, что в ряде случаев в модели у = а + b х + , где у – фиктивная переменная, применение обычного МНК может привести к неинтерпретируемым результатам: при подстановке в регрессию индивидуальных значений х отдельные значения у могут оказаться либо < 0, либо > 1, что противоречит самой постановке задачи.
Таким образом, для моделирования значений P(yi = 1) подбирают функции, область значений которых определяется отрезком[0; 1], а xi играет роль аргумента этой функции, т.е.
, (4.3)
Функция F() должна быть непрерывной, неубывающей функцией. Известны разные интерпретации модели (4.2). Один из подходов основан на введении некоторой ненаблюдаемой, или латентной переменной у*, изменяющейся от – до + и порождающей наблюдаемую зависимую переменную у. Предположим, что латентная переменная у* линейно зависит от вектора объясняющих переменных:
. (4.4)
Латентная переменная у* связана с бинарной переменной у следующей системой:
,
где с – некоторое пороговое значение.
Выбор функции F() определяет тип бинарной модели. Наиболее часто в качестве функции F() используют:
– функцию стандартного нормального распределения
(4.5)
и соответствующую модель называют пробит-моделью (probit-model);
– функцию логистического распределения
(4.6)
и соответствующую модель называют логит-моделью (logit-model).
Логистическое распределение имеет тенденцию давать большие, чем нормальное распределение, вероятности P(yi = 0) для очень малых xi и меньшие вероятности P(yi = 0) для очень больших значений xi. Для выборок с небольшим разбросом объясняющих переменных качественные выводы, полученные при использовании пробит- и логитмоделей, совпадают.
Независимо от того, какое распределение используется для оценки параметров модели, важно обратить внимание на то, что модель является нелинейной по параметрам и их интерпретация отличается от привычной интерпретации коэффициентов линейных регрессионных моделей. Коэффициенты бинарной модели не могут интерпретироваться как предельный эффект влияния объясняющих переменных на зависимую переменную. Предельный эффект каждого объясняющего фактора xj, j = 1,…, k, является переменным, зависит от значения всех остальных факторов и вычисляется как
, (4.7)
где f(x’) – плотность распределения, которая соответствует функции распределения F(x’).
Для нормального распределения – это
,
где (x) – плотность стандартного нормального распределения.
Для логистического распределения
.
Тогда в логит-модели предельный эффект объясняющих переменных вычисляется как
.
Необходимо также обратить внимание на то, что поскольку плотность распределения неотрицательна, направление изменения эффекта зависит только от знака коэффициента. Положительные значения показывают, что вероятность прогноза зависимой переменной увеличится, а отрицательные – что вероятность прогноза понизится.