Тема 9 модели бинарного выбора
Прочтите сначала главу 10 учебника (издание 3).
В прошлый раз были фиктивные переменные – объясняющие переменные, которые принимают два значения 0 и 1
Теперь зависимая переменная принимает два значения 0 и 1
(выбор может быть также из многих альтернатив – тогда используются модели упорядоченного выбора - ordered)
У нас только двоичный выбор
Мой друг из США, увлекающийся статистикой и эконометрикой, прислал мне удивительно интересные данные о почти всех пассажирах и членах команды лайнера «Титаник». Некоторые из них выжили, некоторым это было не суждено, так что зависимая переменная здесь бинарная. В качестве независимых переменных используется обычная количественная переменная (класс каюты) и две фиктивных переменных. На примере этих мы изучим все основные принципы анализа бинарных переменных.
Логика анализа полностью соответствует той, что используется в учебнике на других примерах.
Файл TITANIC.WF1
SURV (Survived) – зависимая бинарная переменная
(это как фиктивная переменная, но зависимая – тогда она не называется фиктивной а называется бинарной)
CLASS 1, 2, 3 0 – команда (наиболее информированные люди)
AGE 1 – взрослые
SEX 1 – men, 0 – women
Сначала делаем ЛИНЕЙНУЮ ВЕРОЯТНОСТНУЮ МОДЕЛЬ
LS SURV C CLASS AGE SEX
Здесь SURV – по сути вероятность выжить
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
C |
0.984658 |
0.046973 |
20.96211 |
0.0000 |
CLASS |
-0.051497 |
0.007161 |
-7.190942 |
0.0000 |
AGE |
-0.164999 |
0.041573 |
-3.968919 |
0.0001 |
SEX |
-0.552221 |
0.022175 |
-24.90308 |
0.0000 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.227983 |
Mean dependent var |
0.323035 |
|
R-squared небольшой, так что многие другие факторы должны влиять на выживание
Все переменные значимы
Интерпретация:
Перемещение из 1го во 2й класс и из 2го в 3й класс снижает вероятность выживания примерно на 5 процентных пунктов
Для детей вероятность выживания выше примерно на 16 процентных пунктов
Оказаться женщиной в тот момент, согласно уравнению регрессии, было ключевым моментом для выживания – вероятность выжить для женщин на 55 процентных пунктов больше, чем для мужчин
НЕДОСТАТКИ ЛИНЕЙНОЙ ВЕРОЯТНОСТНОЙ МОДЕЛИ
