6.2.5. Пример логистической регрессии и статистики

Процедура логистической регрессии в SPSS в диалоговом режиме вызывается из меню командой Statistics \Regression \Binary logistic….

В качестве примера по данным RLMS изучим, как связано употребление спиртных напитков с зарплатой, полом, статусом (ранг руководителя), курит ли он. Для этого подготовим данные: выберем в обследовании RLMS население старше 18 лет, сконструируем индикаторы курения (smoke) и употребления спиртных напитков (alcohol) (в обследовании задавался вопрос «Употребляли ли Вы в течение 30 дней алкогольные напитки»):

COMPUTE filter_$ = (vozr>18).

FILTER BY filter_$.

COMPUTE smoke = (dm71 = 1).

VAL LAB smoke 1 "курит" 0 "не курит".

COMPUTE alcohol = (dm80 = 1).

VAL LAB alcohol 1 "пьет" 0 "не пьет".

Укрупним переменную dj10(зарплата на основном рабочем месте). В данном случае группы по значениям этой переменной в основном достаточно наполнены. С методической целью покажем один из способов укрупнения. Для этого вначале получаем переменнуюwage, которая содержит номера децилей по зарплате, затем среднюю зарплату по этим децилям (см. табл. 6.5). Это осуществляется приведенной ниже программой:

MISSING VALUES dj6.0 (9997,9998,9999) dj10(99997,99998,99999).

RANK VARIABLES = dj10 (A) /NTILES (10) into wage /PRINT = YES /TIES = MEAN .

MEANS TABLES = dj10 BY wage /CELLS MEAN,

в результате которой получается

Таблица 6.5

Средняя зарплата по децилям

WAGE децили зарплаты	1	2	3	4	5	6	7	8	9	10
DJ10 зарплата за 30 дней	1,01	2,11	3,07	4,16	5,42	7,03	8,53	11,08	15,65	34,64

Полученные средние используем для формирования переменной, соответствующей укрупненной зарплате (для удобства, чтобы коэффициенты регрессии не были слишком малы, в качестве единицы ее измерения возьмем сто рублей).

RECODE wage (1 = 1.01) (2 = 2.11) (3 = 3.07) (4 = 4.16) (5 = 5.42) (6 = 7.03) (7 = 8.53) (8 = 11.08) (9 = 15.65) (10 = 34.64).

RECODE dj6.0 (SYSMIS = 4)(1 THRU 5 = 1)(6 thru 10 = 2) (10 THRU HI = 3) INTO manag.

VAR LAB manag "статус" wage "зaработок".

VAL LAB manag 4 "не начальник" 1 "шеф" 2 "начальничек" 3 "начальник".

EXEC.

Далее формируем переменную manag(«статус») из переменнойdj6.0– «количество подчиненных».

Запускаем команду построения регрессии LOGISTIC REGRESSION, в которой использованы переменныеwage– зарплата,manag– статус,dh5– пол (1 – мужчины, 2 – женщины)smoke– курение (1 – курит, 0 – не курит),dh5 wage– «взаимодействие» пола с зарплатой (для женщин значение – 0, для мужчин – совпадает с зарплатой).

LOGISTIC REGRESSION VAR = alcohol /METHOD = ENTER wage manag dh5 smoke dh5*wage /CONTRAST (dh5) = Indicator /CONTRAST (manag) = Indicator /CONTRAST (smoke) = Indicator /PRINT = CI(95) /CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.69).

В выдаче программа сообщает прежде всего о перекодировании данных:

Dependent Variable Encoding:

Original Internal

Value Value

.00 0

1.00 1

Следует обратить внимание, что зависимая переменная здесь должна быть дихотомической, и ее максимальный код считается кодом события, вероятность которого прогнозируется. Например, если Вы закодировали переменную ALCOHOL: (1 – употреблял, 2 – не употреблял), то будет прогнозироваться вероятность неупотребления алкоголя.

Далее идут сведения о кодировании индексных переменных для категориальных переменных; из-за их естественности здесь мы их не приводим.

Далее следуют обозначения для переменных взаимодействия, в нашем простом случае это

Interactions:

INT_1 DH5(1) by WAGE

<<< < Предыдущая 42 43 44 45 46 47 48 49 50 51 52 5354 / 6954 55 56 57 58 59 60 61 62 63 64 65 66 > Следующая >>>