
Эконометрика / Доп. материалы / TOBITмодели
.pdfTOBIT-модель. (модель с цензурированными и "урезанными" данными)
Модель была предложена Джеймосом Тобином (1958 г.) по результатам изучения расходов домохозяйств на товары длительного пользования.
Зависимая переменная часто бывает количественная и непрерывная, но ограничена на интервале своих значений (только положительные значения, заработная плата, продолжительность рабочего дня, расходы на определенные виды товаров, инвестиции и т.п.), т.е. есть ненаблюдаемые значения
Цензурированные наблюдения - известны значения независимых переменных
Урезанные наблюдения - известен лишь уровень "урезания", а
значения независимых переменных для исключенных из рассмотрения объектов неизвестны, т.е. выборка производится не из всех возможной совокупности наблюдений, а лишь из тех, что удовлетворяют каким-то ограничениям, как правило "урезание" происходит по "пороговому" значению зависимой переменной
Формальное представление tobit-модели
ПРИМЕР 1
y - зависимая переменная (расходы на транспорт), имеющая ограничения
z - другие потребительские расходы x - общие расходы
Индивид максимизирует уровень потребления, при соблюдении ограничения
maxU y, z
y,z
y z x
y 0, z 0
1

Задав функцию полезности можно найти решение задачи.
Транспортные расходы при оделенном стечении обстоятельств могут быть нулевыми (ограниченными).
При отсутствии ограничений на зависимую переменную расходы на транспорт составят (или желаемый уровень расходов на транспорт)
- y 0 1x
Наблюдаемы уровень равен 0, если желаемый отрицателен (в линейной модели)., т.е. потребители не будут пользоваться транспортом при отсутствии средств
y y при |
y 0 |
y 0 при |
y 0 |
TOBIT-модель с ЦЕНЗУРИРОВАННЫМИ данными
y XiT i , |
i |
N 0, 2 |
|
y y при |
y 0 |
|
|
y 0 при |
y 0 |
|
ОТЛИЧИЯ TOBIT-моделей от бинарных моделей:
разные способы установления связи между латентными и наблюдаемыми переменными
в тобит модели учитывается масштаб значение зависимых
переменных
в тобит модели в отличие от бинарных моделей отсутствует
необходимость в ограничениях по нормализации
в тобит модели рассматривается распределение зависимой
переменной только в положительной области
2

Модели с цензурированными данными представляют собой вариант регрессионных моделей. в которых все отрицательные значения
зависимых переменных установлены равными 0.
Пример графика плотности усеченного нормального распределения
3

МНК дает смещенные и несостоятельные оценки.
НЕОБХОДИМЫЕ СВЕДЕНИЯ
Z - случайная величина
F z - функция распределения Z
p z - плотность распределения случайной величины
a - любое число
|
|
|
|
|
|
|
|
|
|
Z a |
|
|
|
p z |
z a |
|
|||||||
p z |
|
|
|
|
|||
|
|
1 F a |
|||||
|
|
|
|
|
|
|
Условное математическое ожидание Z при условии
Z a
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
|
|
zp |
|
|
|
|
a dz |
|
|
||||||
E |
|
Z |
Z |
|
|
|
z |
Z |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Если |
Z |
N |
m, 2 |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
E Z |
|
Z a m c |
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|||||||||||||||||
Var |
|
Z |
|
Z a |
|
2 1 |
|
c |
|
|
|
|
|||||||||||
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
c a m / |
|
|
|
|
|
|
|
|
с |
с |
|||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
1 F c |
с с с с
с - плотность стандартного нормального распределения
F с - функция стандартного нормального распределения
4

Есть регрессионная модель |
y X T |
i |
|
i |
N 0, 2 |
|
|
i |
i |
|
|
|
Выбираем только те наблюдения, для которых yi a
E y |
|
y a X T с |
|
||||||||
|
|
||||||||||
|
i |
|
|
i |
|
i |
|
||||
Var y |
|
|
y a 2 1 c |
||||||||
|
|||||||||||
|
|
|
|
|
|
i |
|
|
i |
|
|
|
|
c a X T / |
|
||||||||
где |
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
ПРЕДЕЛЬНЫЙ ЭФФЕКТ |
|
|
E y |
|
y a |
c |
1 c |
||||||
|
|||||||||||
|
|||||||||||
|
|
|
|
|
|
|
|||||
|
|
|
|
x |
|
c x |
|
||||
т.к. |
0 c 1, то предельный эффект фактора |
меньше соответствующего коэффициента
Среднее ошибок - с
дисперсия ошибок - 2 1 c
т.е. используя МНК |
получают смещенные и |
несостоятельные оценки |
|
5

Для оценки используется ММП.
y X T |
, |
|
i |
N 0, 2 |
|
|
i |
i |
|
|
|
|
|
y y при |
y 0 |
|
|
|||
y 0 при |
y 0 |
|
|
ФУНКЦИЯ ПРАВДОПОДОБИЯ
|
|
T |
|
|
|
|
|
|
|
|
|
1 |
|
|
|
T |
2 |
|
|
|
Xi |
|
1 |
|
|
|
|
|
|
|
|
yi Xi |
|
|
|||
|
|
|
|
|
||||||||||||||
L 1 |
F |
|
|
|
|
|
e |
|
2 |
2 |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
2 |
|
|
|
|
|
|
|
|
||||||||||
yi 0 |
|
yi 0 |
|
|
|
|
|
|
|
|
|
|
|
|||||
для цензурированных наблюдений для остальные наблюдений |
|
|||||||||||||||||
|
|
|
E y |
|
|
|
|
|
T |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
F |
Xi |
|
|
|
|
|
|
||||
ПРЕДЕЛНЫЙ ЭФФЕКТ |
|
|
|
|
|
|
|
|
||||||||||
x |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
т.е. предельный эффект переменный (как в любой нелинейной модели)
6
РАСЧЕТЫ ПО TOBIT МОДЕЛИ
Все цензурированные наблюдения сохраняются в выборке, но вероятность того, что y 0 при заданных значениях объясняющих переменных в модели устанавливается :
|
|
|
|
T |
|
|
|
P yi |
0 P y i 0 P xiT i |
0 P i |
xiT 1 F |
xi |
|
||
|
|||||||
|
|
|
|
|
Прогнозирование:
E[ y ] xT |
F ( |
xT |
|
) ( |
|
xT |
|
|
|
|||||
i |
|
|
|
|
i |
|
) |
|||||||
|
|
|
|
|
|
|
||||||||
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
( |
|
xT |
|
|
|
||
|
|
|
|
|
|
|
|
i |
|
|
) |
|||
|
|
|
T |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||
E[ yi | xi , yi 0] xi |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
xT |
|
|
|
|
|||||||
|
|
|
|
|
|
|
F ( |
i |
|
|
) |
|||
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Влияние факторов. Расчет предельного эффекта
1) предельный эффект от изменения фактора на вероятность
не покупать/не делать, т.е. y 0 |
|
|
|
|
|
||||
|
P y 0 |
|
x, , |
|
T |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
xi |
|
||
|
|
|
|
|
|
|
|||
|
x |
|
|
||||||
|
|
|
2) предельный эффект изменения фактора на среднее
значение зависимой переменной
7
E y |
|
x, , |
xi |
||
|
|||||
|
|
|
|||
|
|
|
|
T |
|
|
|
|
F |
|
|
|
|
|
|
||
|
x |
|
|||
|
|
|
8

Модели с усеченными / урезанными выборками
(truncated regression model)
наблюдения полностью отсутствуют
значения зависимой переменной без ограничений попадают в отрицательную область или равны нулю:
yi 0 , то невозможно зафиксировать значения всех объясняющих переменных (зависимость заработной платы от стажа, если человек не работает, у него отсутствует заработная плата)
ФОРМАЛЬНАЯ ЗАПИСЬ МОДЕЛИ
y X T |
, i 1, 2,...N |
|
||
i |
|
i |
|
|
y y при |
|
y 0 |
|
|
если y , x |
|
|
неналюдаемы |
y 0 |
i i |
|
|
|
|
N 0, 2
9

Варианты интерпретации коэффициентов тобит моделей в зависимости от формулировки задачи:
1. Если описание нулевых исходов представлено как вероятность того, что зависимая переменная равна 0:
|
xT |
|||
P yi |
0 1 F |
i |
|
|
|
||||
|
|
|
тогда предельное изменение вероятности при изменении xik на небольшую величину (частная производная по xik )
P yi 0 |
|
XiT |
k |
||
|
|
|
|
|
|
xik |
|
|
|||
|
|
k
- м.интерпретировать как предельный эффект изменений
xik в зависимости от вероятности наблюдения нулевых исходов
2. Усеченные данные
E yi yi 0 условное мат.ожидание зависимой переменной, при условии, что мат.ожидание положительно.
Цензурированный предельный эффект объясняющей переменной в зависимости от изменения объясняющей переменной xik зависит от ik
E yi |
|
XiT |
||
|
k F |
|
|
|
xik |
|
|||
|
|
10