
- •Глава X. Эконометрические модели со специфическими переменными
- •10.1. Эконометрические модели с ошибками в переменных
- •10.2. Модели с фиктивными независимыми переменными
- •10.3. Модели с дискретными зависимыми переменными
- •10.3.1. Модели бинарного выбора
- •10.3.2. Модели множественного выбора
- •10.3.3. Модели счетных данных
- •10.4. Модели с ограниченными зависимыми переменными
- •10.4.1. Модели усеченных выборок
- •10.4.2. Модели цензурированных выборок
- •10.4.3. Модели случайно усеченных выборок (selection-model)
- •10.5. Методы оценки параметров моделей с дискретными и ограниченными зависимыми переменными
- •10.5.1. Метод максимального правдоподобия
- •10.5.2. Метод максимального счета (mscore)
- •Вопросы к главе X
- •Упражнения к главе х Задание 10.1
- •Задание 10.2
- •Задание 10.3
- •Задание 10.4
- •Задание 10.5
- •Задание 10.6[1]
- •Глава XI. Методы оценки параметров нелинейных эконометрических моделей
- •11.1. Особенности оценки параметров нелинейных моделей
- •11.2. Метод прямого поиска
- •11.3. Методы оценки параметров, основанные на линейной аппроксимации модели
- •11.4. Методы, предполагающие линеаризацию целевой функции
- •11.5. Качественные характеристики оценок параметров нелинейных эконометрических моделей
- •Вопросы к главе XI
- •Глава XII. Использование эконометрических моделей в прогнозировании социально-экономических процессов
- •12.1. Особенности эконометрического прогнозирования
- •12.2. Методы оценки дисперсии прогноза при детерминированном прогнозном фоне
- •12.3. Методы оценки дисперсии прогноза при случайном прогнозном фоне
- •12.4. Прогнозирование на основе моделей временных рядов
- •Вопросы к главе XII
- •Упражнения к главе XII Задание 12.1
- •Задание 12.2
- •Краткий словарь терминов
- •Приложение 1. Функция стандартного нормального распределения
- •Приложение 2. Двусторонние квантили распределения Стьюдента
- •Приложение 5. Квантили распределения 2()
- •Список литературы
10.4. Модели с ограниченными зависимыми переменными
В практике социально-экономических исследований на микро-уровне достаточно часто возникают ситуации, когда зависимая переменная является количественной и непрерывной, т. е. удовлетворяет предпосылкам классической модели, но выборка подвергается усечению или цензурированию.
Усечение имеет место, когда данные выбираются из некоторого большего по объему подмножества данных (наблюдений), например, в исследовании доходов рассматриваются семьи с доходами ниже или выше определенного уровня (скажем, черты бедности).
Вместо усечения выборок может применяться также их цензурирование. В частности, в исследованиях доходов рассматривается вся выборка, но принимается, что у семей с доходами выше или ниже определенного уровня доходы находятся на этом же уровне. Следствием цензурирования и усечения выборок является искажение значений выборочных параметров распределений, в частности, их математических ожиданий и дисперсий. Соответственно выводы, полученные на основании усеченных и цензурированных выборок, следует очень осторожно распространять на генеральную совокупность.
10.4.1. Модели усеченных выборок
Предположим, усеченное распределение является частью неусеченного распределения, которая находится выше или ниже определенного порогового значения.
Плотность непрерывной случайной переменной z, усеченной выше уровня b, определяется согласно следующему выражению:
Выражение (10.136) вытекает, из формулы условной вероятности. В самом деле, условная вероятность того, что случайная величина z примет некоторое значение при условии, что z b, определяется следующим образом:
/
Продифференцировав левую и правую части выражения (10.137) по z, получим (10.136).
Во многих практических исследованиях предполагается, что случайная величина z распределена по нормальному закону. В этом случае вероятность того, чтоzb определяется согласно следующему выражению:
|
|
|
|
где и – соответственно математическое ожидание и стандартное отклонение случайной величины z; =(b–)/; Ф(.) – значение стандартной нормальной интегральной функции распределения в соответствующей точке.
Тогда согласно выражению (10.136), функция плотности усеченного нормального распределения определяется как:
где (.) – стандартная нормальная функция распределения.
На рис. 10.6 представлены графики функций плотностей усеченного стандартного нормального распределения с =0 и =1 для b=–0,5; 0; 0,5. Из графиков, представленных на этом рисунке следует, что усечение как бы “поднимает” функцию плотности на оставшемся после усечения участке над графиком этой функции “неусеченного” распределения.
В дальнейшем случайную переменную с усеченным распределением будем называть усеченной случайной переменной.
Заметим, что математическое ожидание и дисперсия усеченной случайной переменной определяются согласно следующим выражениям:
M[z|zb]=
D[z|zb]=
Проведя интегрирование в выражениях (10.140)–(10.141) с учетом того, что функция плотности f(z, zb) определена выражением (10.139), получим, что математическое ожидание и дисперсия усеченной случайной переменной z соответственно равны:
M[z|при усечении]=+(). (10.142)
D[z|при усечении]= 2[1–()]. (10.143)
где =(b–)/;
()=()/[1–()], если zb; (10.144)
()=–()/(), если zb; (10.145)
()=()[()–]. (10.146)
|
|
Рис. 10.6. Зависимости плотностей усеченного нормального распределения от степени усечения
Функцию () называют обратным отношением Миллса или функцией отказов (hazard-function), b – степенью усечения.
Заметим, что ()1 при любом значении .
Из выражения (10.142) следует, что математическое ожидание усеченной стандартной нормальной переменной является функцией от степени усечения (см. рис. 10.7).
Рассмотрим некоторые результаты, приведенные на рис. 10.7. В частности, математическое ожидание стандартной нормальной величины при усечении z0 равно 0,79, а при усечении zb равно –0,79.
Несложно также убедиться, что вероятность того, что х меньше b, является возрастающей функцией от b. С возрастанием этой вероятности увеличивается количество нерассматриваемых элементов совокупности, а, следовательно, возрастает и математическое ожидание усеченной случайной переменной.
|
|
|
|
|
|
Рис. 10.7. Графики зависимости математических ожиданий стандартной нормальной величины от степени усечения
На рис. 10.8 приведена функция, отражающая взаимосвязь между математическим ожиданием M[z|zb] и вероятностью Р[zb] для стандартного нормального распределения.
|
|
|
Рис.10.8. Условное среднее как функция степени усечения.
Предположим, что зависимость некоторой случайной переменной yt, от значений влияющих на нее факторов, можно представить следующим образом:
yt =xt +t, (10.148)
где xt – вектор независимых переменных, влияющих на переменную yt; – вектор параметров; t – ошибка модели, в отношении которой предполагается, что она распределена по стандартному нормальному закону с нулевым математическим ожиданием и постоянной дисперсией, t N[0, 2].
Переменная yt, описанная выражением (10.148), распределена по нормальному закону с математическим ожиданием t=xt и дисперсией 2.
Рассмотрим распределение зависимой переменной yt при условии, что наблюдаемые значения yt превышают некоторый порог b. Согласно выражению (10.142) получим, что условное математическое ожидание yt для модели (10.148) является нелинейной функцией от хt и , и определяется как
M[yt | yt b]=xt +
Перепишем выражение (10.149) с использованием функции отказов (t) (см. выражение (10.144)):
M[yt | yt b]=xt +(t), (10.150)
где t =(b –xt)/.
С учетом вида выражения (10.150) оценим величину маржинального эффекта факторов xt для случая усеченной выборки:
|
|
|
|
Поскольку для каждого набора факторов xt выполняется соотношение 0(t)1, то из выражения (10.151) вытекает, что для любого xit (i=1,2,..., n; t=1,2,...,T) маржинальный эффект меньше соответствующего коэффициента i.
Заметим, что в силу специфики выражения (10.150) ошибка t модели (10.146), построенной для усеченной выборки, имеет математическое ожидание (t). Дисперсия ошибки t в этом случае определяется следующим образом:
D[t | yt b]= 2[1–(t)]. (10.152)
где 2 – дисперсия ошибки модели (10.148), построенной на неусеченной выборке; ( t)=( t)[( t)– t]; ( t)=( t)/[1–( t)]; t =(b –xt)/.
Таким образом, из выражений (10.150) и (10.152) вытекает, что оценки параметров модели (10.148), определенные на основании усеченной выборки зависимой переменной (ytb или ytb), являются смещенными и несостоятельными по сравнению с оценками, которые могли бы быть получены по полной выборке.