Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
57
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

6.2.1.Отношение шансов и логит

Отношение вероятности того, что событие произойдет,к вероятности того, что оно не произойдет,(1 –P),называется отношением шансов.

С этим отношением связано еще одно представление логистической регрессии, получаемое за счет непосредственного задания зависимой переменной в виде Z = Ln ((1 –P)), гдеP = P{y = 1X1,…,Xp}.ПеременнаяZ называетсялогитом. По сути дела, логистическая регрессия определяется уравнением регрессииZ = B0 +B1x1 + … +Bpxp.

В связи с этим отношение шансов может быть записано в следующем виде:

P/(1–P) =.

Отсюда получается, что, если модель верна, изменение xkна единицупри независимых x1, …, xp вызывает изменение отношения шансов в раз.

6.2.2. Решение уравнения с использованием логита

Решение такого уравнения упрощенно можно представить следующим образом

  1. Получаются агрегированные данные по переменным x, в которых для каждой группы, характеризуемой значениямиxj = , подсчитывается доля объектов, соответствующих событию {y = 1}. Эта доля является оценкой вероятности. В соответствии с этим для каждой группы получается значение логитаZj.

  2. На агрегированных данных оцениваются коэффициенты уравнения = B+B1x+ … +Bp x p. К сожалению, дисперсияZздесь зависит от значенийx, поэтому при использовании логита применяется специальная техника оценки коэффициентов – взвешенной регрессии.

Еще одна особенность состоит в том, что в реальных данных очень часто группы по xоказываются однородными поy, поэтому оценкиоказываются равными0или1. Таким образом, оценка логита для них не определена (для этих значений ).

В некоторых статистических пакетах такие группы объектов просто-напросто отбрасываются.

В настоящее время в статистическом пакете для оценки коэффициентов используется метод максимального правдоподобия, лишенный этого недостатка. Тем не менее проблема, хотя и не в таком остром виде,остается: если оценки вероятности для многих групп оказываются равными0или1, оценки коэффициентов регрессии имеют слишком большую дисперсию. Поэтому, имея в качестве независимых переменных такие признаки, как душевой доход в сочетании с возрастом, их следует укрупнить по интервалам, приписав объектам средние значения интервалов.

6.2.3. Неколичественные данные

Если в обычной линейной регрессии для работы с неколичественными переменными нам приходилось подготавливать специальные индикаторные переменные, то в реализации логистической регрессии в SPSS это делается автоматически. Для этого в диалоговом окне специально предусмотрены средства, сообщающие пакету, что ту или иную переменную следует считать категориальной. При этом, чтобы не получить линейно зависимых переменных, максимальный код ее значения (или минимальный, в зависимости от задания процедуры) не перекодируется в дихотомическую (индексную) переменную. Впрочем, средства преобразования данных позволяют не учитывать любой код значения. Имеются другие способы перекодирования категориальных (неколичественных) переменных в несколько переменных, но мы будем пользоваться только указанным способом как наиболее естественным.

6.2.4. Взаимодействие переменных

В процедуре логистической регрессии в SPSS предусмотрены средства для автоматического включения в уравнение переменных взаимодействий. В диалоговом окне в списке исходных переменных для этого следует выделить имена переменных, взаимодействия которых предполагается рассмотреть, затем переправить выделенные имена в окно независимых переменных кнопкой c текстом > b > .