Взаимосвязь правонарушения и решения суда

Правонарушение	Приговор			Всего
Правонарушение	штраф	условный приговор	тюремное заключение	Всего
автомобильная кража	5	30	5	40
кража со взломом	0	30	20	50
подделка денег	5	0	5	10
Всего	10	60	30	100

Другой тип коэффициентов взаимосвязи номинальных (и не только номинальных) переменных называют мерами «пропорционального уменьшения ошибки». Все они основаны на следующем предположении (или модели): если две переменные взаимосвязаны, мы можем предсказать значение одной переменной для данного наблюдения (случая), зная, какое значение принимает другая переменная. Степень соответствия такого предсказания действительности и используется в качестве коэффициента взаимосвязи. Любой коэффициент взаимосвязи, основанный на модели «пропорционального уменьшения ошибки» («ПУО»), имеет общую структуру, задаваемую формулой:

где Е₁ — количество ошибок в предсказаниях значений зависимой переменной, с деланных без учета распределения по второй, независимой, переменной, а Е₂— количество ошибок в предсказаниях значений зависимой переменной, сделанных на основе значений независимой переменной. Конкретные коэффициенты, основанные на «ПУО», будут различаться в зависимости от того, что мы считаем ошибкой и как подсчитывается количество ошибок. В качестве примера можно рассмотреть «may-коэффициент» Гудмана-Краскела^¹. Ошибкой в данном случае считается просто ошибочная классификация наблюдения, отнесение его в «неправильную» категорию. Рассмотрим таблицу сопряженности для приводимого Мюллером и соавторами примера^² гипотетических данных о влиянии типа правонарушения на характер решения суда (см. табл. 8.7).

Ошибка предсказания зависимой переменной (приговор), сделанного исключительно на основе ее собственного распределения, т. е. без учета распределения независимой переменной, определяется следующим образом. Мы знаем (см. маргиналы столбцов в нижней строчке таблицы), что в 60 случаях из 100 приговор был условным, но нам неизвестно, в каких именно шестидесяти случаях он был условным. Точно так же мы знаем, что в десяти случаях судья ограничился денежным штрафом, но мы наверняка неоднократно ошибемся, наугад определяя для каждого случая из 100, считать ли его одним из десяти «штрафных». Если бы каждому случаю соответствовала карточка с надлежащей надписью, которую мы с завязанными глазами помещали бы в одну из трех стопок, то при угадывании мы могли бы руководствоваться лишь значениями маргиналов по столбцам: в конечном счете в первой стопке должно оказаться 10 карточек, во второй — 60, а в третьей — 30.

Если мы наугад поместим во вторую стопку «условных приговоров» 60 карточек, то для каждой отдельной карточки (для каждого наблюдения) вероятность ошибки будет равна вероятности попадания туда карточки «штраф» или «тюремное заключение», т. е. ¹⁰/₁₀₀+ ³⁰/₁₀₀^=
40/₁₀₀. Иными словами, в среднем мы сделаем ошибки для категории «условный приговор». Для первой категории («штраф») мы в среднем сделаем 10 х (⁶⁰/₁₀₀+ ³⁰/₁₀₀) = 9 ошибок. Для категории «тюремное заключение» (30 карточек) мы можем ожидать, что сделаем 21 ошибку. Суммарное значение числа ошибок предсказания Е₁ (если в расчет принимается только распределение зависимой переменной) составит сумму этих трех значений:

Е₁= 24 + 9 + 21 = 54 ошибки.

Представим теперь, что распределяя карточки по трем категориям приговора, мы располагаем сведениями о том, каково значение второй переменной — «характер преступления» — для каждой карточки, т. е. для каждого наблюдения. Пусть, например, кто-нибудь каждый раз сообщает нам, каким было в данном случае правонарушение, предоставляя нам возможность самостоятельно предсказать приговор суда. Мы также знаем заранее, что 5 (12,5%) автомобильных краж из 40 повлекли за собой штраф, 30 (75%) — условный срок, а еще 5(12,5%) — тюремное заключение.

Нам, однако, предстоит угадать, какие именно из этих 40 случаев автомобильных краж попали в каждую из трех описанных категорий приговора. Процесс подсчета числа ошибок при таком угадывании сходен с вышеописанным. Зная, каково распределение наблюдений в строке «автомобильные кражи», мы можем оценить ожидаемые ошибки. Ожидаемая ошибка при случайном помещении 5 карточек с автомобильными кражами (из 40) в категорию «штраф» составит ошибки; при случайном размещении 30 карточек с автомобильными кражами в категорию «условный приговор» мы ожидаем, что ошибок предсказания в среднем будетошибки и т. д. Размещая 5 фальшивомонетчиков из 10 в стопку «штрафов», мы сделаемошибки. Проведя аналогичные подсчеты для всех трех строктаблицы 8.7 и просуммировав все ожидаемые ошибки, мы получим величину Е₂, т. е. ожидаемое число ошибок в предсказаниях приговора суда, сделанных с учетом информации о характере преступления (независимой переменной). Для данных, приведенных в таблице 8.7, величина Е₂ составит 45,25. Отсюда,



Таблица 8.8

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1913 14 15 16 17 18 19 > Следующая >>>