Вариант 2. В файле Эконометрика Практика 8-1.xls собраны данные о 100 кандидатах на вакансию экономиста в коммерческом банке. Зависимая переменная y: Decision – решение банка (качественный признак: 1 – «принят на работу», 0 – «не принят»). Независимые переменные xi: Experience – опыт работы (количественный признак, лет), Height – рост кандидата (количественный признак, см), Master – образование (качественный признак: 1 – «магистратура и выше», 0 – «бакалавриат»).
В файле Эконометрика Практика 8-2.xls собраны данные о 200 городах. Зависимая переменная y: Quality – качество жизни (качественный признак: 1 – «низкое», 2 – «среднее», 3 – «высокое»). Независимые переменные xi: Wage – медианная заработная плата (количественный признак, тыс. руб.), Ecology – состояние окружающей среды (качественный признак: 1 – хорошее состояние окружающей среды, 0 – загрязненная окружающая среда).
В файле Эконометрика Практика 8-3.xls собраны данные о 300 владельцах автомобилей. Зависимая переменная y: Car – марка автомобиля (качественный признак: 1 – «Лада», 2 – «Ford», 3 – «BMW»). Независимая переменная x: Wage – ежемесячная заработная плата (количественный признак, тыс. руб.).
1. В файле Эконометрика Практика 8 пример (для выполнения) бинарный выбор.xls собраны данные о 100 инвестиционных проектах.
Зависимая переменная y:
Decision – решение фонда о финансировании. Качественный признак, принимает значения 1 – «проект профинансирован», 0 – «проект получил отказ».
Независимые переменные xi:
IRR – внутренняя норма доходности. Количественный признак.
Pages – количество страниц инвестиционного меморандума. Количественный признак.
Success – успешное сотрудничество с инициатором проекта в прошлом. Качественный признак, принимает значения 1 – «имело место успешное сотрудничество», 0 – «фонд не сотрудничал с инициатором проекта в прошлом».
В файле Эконометрика Практика 8 пример (для выполнения) упорядоченный выбор.xls собраны данные о 200 инвестиционных проектах.
Зависимая переменная y:
Rate – рейтинг проекта, присваиваемый инвестиционным фондом. Качественный признак, принимает значения 1 – «низкий», 2 – «средний», 3 – «высокий».
Независимые переменные xi:
IRR – внутренняя норма доходности. Количественный признак.
Success – успешное сотрудничество с инициатором проекта в прошлом. Качественный признак, принимает значения 1 – «имело место успешное сотрудничество», 0 – «фонд не сотрудничал с инициатором проекта в прошлом».
В файле Эконометрика Практика 8 пример (для выполнения) неупорядоченный выбор.xls собраны данные о 300 избирателях.
Зависимая переменная y:
Politic – политические взгляды. Качественный признак, принимает значения 1 – «социалистические», 2 – «умеренные», 3 – «консервативные».
Независимая переменная x:
Income – ежемесячный доход избирателя.
2. Модели бинарного выбора (логит-модель).
2.1. Оцениваем параметры логит-модели. Для этого: Модель – Limited dependent variable – Логит - Binary
Указываем зависимую переменную и факторы:
(пока выбираем: Показывать p-значения)
Получаем оценки параметров логит-модели:
2.2. Полученную логит-модель можно записать следующим образом:
Показатели качества модели:
Количество корректно предсказанных случаев |
80% |
Индекс R2 Макфаддена. |
0,328 |
AIC |
98,986 |
BIC |
109,406 |
HQC |
103,203 |
Проверим значимость модели в целом с помощью теста отношения правдоподобия (Likelihood Ratio test). Тест проводится по следующей схеме:
1) Выбирается уровень значимости α.
2)
Нулевая гипотеза
Альтернативная
гипотеза
3) Рассчитывается наблюдаемое значение статистики LR:
.
Если верна H0, то LR имеет асимптотическое распределение χ2(k).
4) Для наблюдаемого значения LR определяется p-value. Если p-value<α, нулевая гипотеза отвергается, делается вывод о значимости модели в целом.
В данном случае
Нулевая гипотеза отвергается. Модель в целом значима.
Теперь проверим значимость отдельных коэффициентов. Для этого используется z-тест (аналогичный t-тесту для множественной линейной регрессии):
1) Выбирается уровень значимости α.
2)
Нулевая гипотеза
;
Альтернативная гипотеза
3) Рассчитываются наблюдаемое значение z-статистики.
4.2) Для рассчитанного zнабл определяется p-value. Если p-value<α, нулевая гипотеза H0 отвергается и делается вывод о значимости коэффициента.
В нашем случае (используется α=0,05):
Фактор |
Коэффициент |
Вывод |
Константа |
β0 |
Нет |
IRR |
β1 |
Значим |
Pages |
β2 |
Нет |
Success |
β3 |
Значим |
Два коэффициента незначимы, наибольшее p-value получено для коэффициента β2 при Pages. Перестроим модель, исключив фактор Pages.
Полученную логит-модель можно записать следующим образом:
Показатели качества модели:
Количество корректно предсказанных случаев |
79% |
Индекс R2 Макфаддена. |
0,319 |
AIC |
98,144 |
BIC |
105,959 |
HQC |
101,307 |
Проведя LR-тест и z-тесты, делаем вывод, что модель в целом значима и все ее отдельные коэффициенты значимы. Значения информационных критериев уменьшились, новая модель предпочтительнее старой.
2.3. Рассчитаем значения срединных коэффициентов. Для этого при построении модели выберем «Показывать срединный угловой коэффициент»:
Угловой коэффициент показывает на какую величину изменяется вероятность P(y=1) при изменении фактора на 1, если значения всех факторов – средние по выборке. В данном случае для среднего проекта при увеличении внутренней нормы доходности на 1 процент вероятность его одобрения увеличивается на 0,061. Факт успешного сотрудничества в прошлом повышает вероятность одобрения на 0,318.
2.4. Рассмотрим вероятность одобрения проекта со следующими характеристиками: IRRf=27%, Success=0.
Для этого добавляем новое наблюдение: Правой кнопкой мыши на переменной – Изменить значения – Добавить… - Добавить наблюдение – Дописываем 101-е наблюдение – Применить
|
|
|
|
Заново строим логит-модель и выбираем: Анализ – Прогнозы:
Получаем следующий прогноз:
Итак, проект с IRR=27%, предложенный инициатором, с которым фонд не реализовывал совместных проектов в прошлом, будет одобрен с вероятностью 0,67 (скорее будет одобрен, чем нет).
