Скачиваний:
43
Добавлен:
21.01.2014
Размер:
702.46 Кб
Скачать

Взаимосвязь правонарушения и решения суда

Правонарушение

Приговор

Всего

штраф

условный приговор

тюремное заключение

автомобильная кража

5

30

5

40

кража со взломом

0

30

20

50

подделка денег

5

0

5

10

Всего

10

60

30

100

Другой тип коэффициентов взаимосвязи номинальных (и не только номиналь­ных) переменных называют мерами «пропорционального уменьшения ошибки». Все они основаны на следующем предположении (или модели): если две пере­менные взаимосвязаны, мы можем предсказать значение одной переменной для данного наблюдения (случая), зная, какое значение принимает другая перемен­ная. Степень соответствия такого предсказания действительности и использу­ется в качестве коэффициента взаимосвязи. Любой коэффициент взаимосвязи, основанный на модели «пропорционального уменьшения ошибки» («ПУО»), имеет общую структуру, задаваемую формулой:

где Е1 количество ошибок в предсказаниях значений зависимой переменной, с деланных без учета распределения по второй, независимой, переменной, а Е2 — количество ошибок в предсказаниях значений зависимой переменной, сделан­ных на основе значений независимой переменной. Конкретные коэффициенты, основанные на «ПУО», будут различаться в зависимости от того, что мы счита­ем ошибкой и как подсчитывается количество ошибок. В качестве примера мож­но рассмотреть «may-коэффициент» Гудмана-Краскела1. Ошибкой в данном случае считается просто ошибочная классификация наблюдения, отнесение его в «неправильную» категорию. Рассмотрим таблицу сопряженности для приводимого Мюллером и соавторами примера2 гипотетических данных о влиянии типа правонарушения на характер решения суда (см. табл. 8.7).

Ошибка предсказания зависимой переменной (приговор), сделанного исклю­чительно на основе ее собственного распределения, т. е. без учета распределе­ния независимой переменной, определяется следующим образом. Мы знаем (см. маргиналы столбцов в нижней строчке таблицы), что в 60 случаях из 100 приговор был условным, но нам неизвестно, в каких именно шестидесяти случаях он был условным. Точно так же мы знаем, что в десяти случаях судья ограни­чился денежным штрафом, но мы наверняка неоднократно ошибемся, наугад определяя для каждого случая из 100, считать ли его одним из десяти «штраф­ных». Если бы каждому случаю соответствовала карточка с надлежащей над­писью, которую мы с завязанными глазами помещали бы в одну из трех стопок, то при угадывании мы могли бы руководствоваться лишь значениями маргиналов по столбцам: в конечном счете в первой стопке должно оказаться 10 карточек, во второй — 60, а в третьей — 30.

Если мы наугад поместим во вторую стопку «условных приговоров» 60 карто­чек, то для каждой отдельной карточки (для каждого наблюдения) вероятность ошибки будет равна вероятности попадания туда карточки «штраф» или «тю­ремное заключение», т. е. 10/100 + 30/100 = 40/100. Иными словами, в среднем мы сде­лаем ошибки для категории «условный приговор». Для первой категории («штраф») мы в среднем сделаем 10 х (60/100 + 30/100) = 9 ошибок. Для ка­тегории «тюремное заключение» (30 карточек) мы можем ожидать, что сделаем 21 ошибку. Суммарное значение числа ошибок предсказания Е1 (если в расчет принимается только распределение зависимой переменной) составит сумму этих трех значений:

Е1 = 24 + 9 + 21 = 54 ошибки.

Представим теперь, что распределяя карточки по трем категориям приговора, мы располагаем сведениями о том, каково значение второй переменной — «ха­рактер преступления» — для каждой карточки, т. е. для каждого наблюдения. Пусть, например, кто-нибудь каждый раз сообщает нам, каким было в данном случае правонарушение, предоставляя нам возможность самостоятельно пред­сказать приговор суда. Мы также знаем заранее, что 5 (12,5%) автомобильных краж из 40 повлекли за собой штраф, 30 (75%) — условный срок, а еще 5(12,5%) — тюремное заключение.

Нам, однако, предстоит угадать, какие именно из этих 40 случаев автомобиль­ных краж попали в каждую из трех описанных категорий приговора. Процесс подсчета числа ошибок при таком угадывании сходен с вышеописанным. Зная, каково распределение наблюдений в строке «автомобильные кражи», мы мо­жем оценить ожидаемые ошибки. Ожидаемая ошибка при случайном помеще­нии 5 карточек с автомобильными кражами (из 40) в категорию «штраф» соста­вит ошибки; при случайном размещении 30 карточек с автомобильными кражами в категорию «условный приговор» мы ожидаем, что ошибок предсказания в среднем будетошибки и т. д. Размещая 5 фальшивомонетчиков из 10 в стопку «штрафов», мы сделаемошибки. Про­ведя аналогичные подсчеты для всех трех строктаблицы 8.7 и просуммировав все ожидаемые ошибки, мы получим величину Е2, т. е. ожидаемое число оши­бок в предсказаниях приговора суда, сделанных с учетом информации о харак­тере преступления (независимой переменной). Для данных, приведенных в таб­лице 8.7, величина Е2 составит 45,25. Отсюда,

Таблица 8.8