
книги / 41
.pdf
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 26 |
|
|
|
|
|
|
|
|
Интервальная шкала диагностики пола* |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Значение биометрического показателя х |
Пол |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
х < |
|
|
|
|
- 3,30σ для мужчин |
Достоверно женщина |
|
||||||
х |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
- 3,30σ ≤ х < |
|
|
|
- 1,54σ для мужчин |
Вероятно женщина |
|
|||||
х |
х |
||||||||||||
|
|
|
|
|
|
|
|
||||||
х ≥ |
|
|
- 1,54σ для мужчин |
|
|
||||||||
х |
Не определен |
|
|||||||||||
х ≤ |
|
|
+ 1,54σ для женщин |
|
|||||||||
х |
|
|
|||||||||||
|
|
+ 1,54σ < х ≤ |
|
|
+ 3,30σ для женщин |
Вероятно мужчина |
|
||||||
х |
х |
||||||||||||
|
|
|
|
|
|||||||||
х > |
|
|
+ 3,30σ для женщин |
Достоверно мужчина |
|
||||||||
х |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Примечание. Шкала предназначена для классификации биометрических показателей, средние значения которых у мужчин превышают таковые для женщин.
Достоверный вывод о мужской или женской половой принадлежности формулируется только при превышении значения исследуемого показателя пределов категорий «очень большой» для женщин и соответственно «очень малый» для мужчин. При остальных значениях биометрического показателя половая принадлежность идентифицируемого объекта считается не установленной (см. табл. 26). Необходимо уточнить, что средние значения некоторых биометрических показателей у женщин превышают таковые у мужчин. В этом случае применяется аналогичная шкала с инверсией категорий изменчивости и экспертных выводов. Примером таких показателей являются толщина костей черепа в некоторых краниометрических ориентирах [33], размерные показатели таза [64].
Следует отметить, что выбор пределов категорий размеров и, соответственно, границ интервальной шкалы экспертных решений о половой принадлежности идентифицируемых объектов является субъективным. Например, в работе, посвященной разработке способов определения пола человека по рентгенограммам кисти, вместо интервалов 1,54s и 3,30s авторы использовали интервалы 2s и 3s [17]. Данное отличие является сугубо количественным и принципиального значения не имеет. Для сравнения результатов биометрических исследований, выполненных авторами с применением различных категорий изменчивости, целесообразно использовать следующие табулированные данные (табл. 27).
181
Таблица 27
Объем нормально распределенной генеральной совокупности, заключенный в пределах µ ± zσ , %
z |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
0 |
0,000 |
7,966 |
15,852 |
23,582 |
31,084 |
38,292 |
45,149 |
51,607 |
57,629 |
63,188 |
1 |
68,269 |
72,867 |
76,986 |
80,640 |
83,849 |
86,639 |
89,040 |
91,087 |
92,814 |
94,257 |
2 |
95,450 |
96,427 |
97,219 |
97,855 |
98,360 |
98,758 |
99,068 |
99,307 |
99,489 |
99,627 |
3 |
99,730 |
99,806 |
99,863 |
99,903 |
99,933 |
99,953 |
99,968 |
99,978 |
99,986 |
99,990 |
Недостатками одномерного дискриминантного анализа, рассматривающегося в настоящее время в качестве стандарта судебноантропологического исследования, являются невозможность формулирования количественных вероятностных выводов о половой принадлежности идентифицируемых объектов и использование при определении категорий изменчивости биометрического показателя вместо истинных параметров его распределения их точечных оценок. При этом обязательны смещения рассчитанных категорий изменчивости от их истинных значений [16]. Изложенное приводит к тому, что при практическом использовании результатов одномерного дискриминантного анализа большая (15-20%) вероятность ошибочной классификации существует даже в случаях достоверного экспертного определения пола. Указанное обстоятельство обязывает делать завершающим этапом подобного судебноантропологического исследования осуществление кросс-проверки.
Втеории дискриминантного анализа кросс-проверка представляет собой процедуру оценки точности классификации объектов с помощью данных из специальной тестовой выборки (в математической статистике используется также термин кросс-проверочная выборка). При наличии выборок достаточно большого объема рекомендуется часть наблюдений (половину или две трети) использовать для обучающей выборки, а оставшиеся наблюдения - для тестовой [13]. Если на тестовой выборке модель классификации дает результаты того же качества, что и на обучающей выборке, то считается, что модель хорошо прошла кросс-проверку.
Всвязи с изложенным, тестирование точности классификации пола является неотъемлемой частью судебно-антропологического исследования. Поэтому процедура проведения большинства исследований соответствующей тематики предусматривает разделение
182
имеющихся биометрических данных на обучающую группу и группу верификации. При этом для разработки интервальной шкалы диагностики пола используются только данные обучающей группы, а группа верификации служит лишь для определения точности классификации. Данный подход дает ориентировочное (поскольку доверительные интервалы точности классификации не вычисляются) представление о доле случаев ошибочной классификации пола. Однако это достигается ценой значительного уменьшения объема потенциально пригодных для определения параметров распределения изучаемого показателя биометрических данных, что в итоге приводит к снижению точности идентификации.
Учитывая данное обстоятельство, отдельные авторы используют все имеющиеся в их распоряжении биометрические данные для разработки модели классификации пола и на них же проверяют ее точность [17]. Такой подход противоречит теории дискриминантного анализа, в соответствии с которой только классификация новых наблюдений позволяет определить качество дискриминантной модели [13].
Относительно необходимости кросс-проверки следует заметить, что так называемый в судебно-медицинской литературе «одномерный дискриминантный анализ», собственно говоря, таковым не является, представляя собой процедуру определения вероятности значений признака при заданных параметрах его распределения. Смысл сказанного заключается в том, что если истинные значения параметров распределения изучаемого биометрического показателя в совокупностях объектов мужской и женской половой принадлежности были известны, то проведение кросс-проверки стало бы ненужным. Необходимость кросс-проверки отпадает также, если вместо неизвестных истинных значений параметров распределения использовать их интервальные оценки.
Поэтому существенным недостатком одномерного дискриминантного анализа является использование при определении доверительных интервалов (каковыми являются категории изменчивости) для значений биометрического показателя вместо истинных параметров его распределения их точечных оценок, полученных при исследовании ограниченных выборок зачастую небольшого объема. При этом в зависимости от объема выборки точечные оценки генерального среднего и генерального стандартного отклонения могут значительно отклоняться от их истинных значений (рис. 33).
183

45 |
|
|
|
|
|
|
|
40 |
|
|
|
|
|
|
|
35 |
- выборка объемом n = 30; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
30 |
- выборка объемом n = 100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
25 |
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
-0,6 |
-0,5 -0,4 -0,3 -0,2 -0,1 |
0,0 |
0,1 |
0,2 |
0,3 |
0,4 |
0,5 |
|
|
µ − х |
|
|
|
|
|
|
|
|
|
σ |
|
|
|
|
60 |
- выборки объемом n = 30; |
|
|
|
|
|
||
|
|
|
|
|
|
|||
50 |
- выборки объемом n = 100 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
40 |
|
|
|
|
|
|
|
|
30 |
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
-0,4 |
-0,3 |
-0,2 |
-0,1 |
0,0 |
0,1 |
0,2 |
0,3 |
0,4 |
|
|
|
|
σ − s |
|
|
|
|
|
|
|
|
σ |
|
|
|
|
Рис. 33. Распределение отклонений точечных оценок генерального среднего |
||||||||
(вверху) и генерального стандартного отклонения (внизу) от их истинных |
||||||||
значений, полученные при исследовании 100 случайных выборок из 30 и 100 |
||||||||
членов. По оси абсцисс – отклонение, по оси ординат – число наблюдений. |
||||||||
Случайные выборки при заданных параметрах распределения генерированы |
||||||||
с помощью приложения Microsoft Excel пакета Microsoft Office 2003. |
184

Действительно, для нормально распределенной генеральной совокупности с известными значениями среднего и стандартного отклонения (100 −α)% допустимый интервал для значений определя-
ется как
xi µ ± zα σ .
Однако при неизвестных параметрах µ и δ определение доверительных интервалов для определенной части нормально распределенной генеральной совокупности значительно затрудняется, поскольку x и s являются не более чем точечными оценками истинных параметров µ и δ, как правило, не совпадающими с ними. При этом ошибка в оценке x накладывается на ошибку в оценке s – в результате шансы получить правильный результат становятся очень низкими [16]. Поэтому в качестве доверительного для определенной части генеральной совокупности берется более широкий интервал
xi х ± kα ;γ ;n s,
где kα ;γ ;n - допустимый коэффициент для нормального распределения. Величина kα ;γ ;n зависит от доли γ членов генеральной сово-
купности, которые должны попасть в доверительный интервал, от вероятности 1 - α того, что они действительно туда попали и от объема выборки n [30,93]. Важно отметить, что допустимые коэффициенты недействительны при анормальных или неизвестных распределениях биометрических данных [110,140,159].
Однако в процессе создания критериев диагностики пола вместо истинных значений параметров распределения остеометрических показателей обычно используются их точечные оценки. Данное обстоятельство приводит к сужению и смещению границ категорий изменчивости каждого из исследовавшихся остеометрических показателей. Возникающие несоответствия между декларируемыми и реальными границами категорий размеров, хотя и не являются значительными, тем не менее, искажают интервальную шкалу диагностики пола и при практическом использовании могут привести к ошибочному экспертному заключению.
Наличие указанных недостатков одномерного дискриминантного анализа побудило нас предложить альтернативный метод одномерной биномиальной классификации нормально распределенных биометрических данных [57]. Данный метод уже был успешно использован нами при идентификации принадлежности фрагментов
185

печени и селезенки недоношенным новорожденным с постнанатальной инволюцией экстрамедуллярной кроветворной ткани [11,53].
Алгоритм метода включает выполнение следующих этапов:
1.Фиксируют значения изучаемых количественных показателей
увсех членов двух альтернативных совокупностей объектов классификации.
2.Проверяют соответствие полученных биометрических данных нормальному распределению с помощью любого статистического
критерия или группы критериев ( χ 2 - критерий согласия, критерий
согласия Колмогорова-Смирнова, критерий Колмогорова-Смирнова в модификации Лиллиефорса, тест Шапиро-Уилка, критерий отношения размаха к стандартному отклонению и др.). Предпочтитель-
ным является совместное использование χ 2 - критерия и критерия Колмогорова-Смирнова в модификации Лиллиефорса.
3.При отсутствии отклонений от нормальности определяют точечные оценки параметров распределений биометрических показателей в каждой из двух альтернативных совокупностей объектов классификации.
4.Вычисляют объединенную оценку дисперсии каждого биометрического показателя:
s2 = (n1 −1)s12 + (n2 −1)s22 ,
n1 + n2 − 2
где s – объединенная оценка дисперсии; n1 и n2 - объемы выборок альтернативных групп идентифицируемых объектов; s1 и s2 - вы-
борочные стандартные отклонения.
5. Для каждого биометрического показателя определяют нормированные межгрупповые различия по формуле:
ϕ = x2 − x1 , s
где φ – параметр нецентральности; x2 и x1 – выборочные средние, и
ранжируют потенциальные критерии классификации по абсолютным значениям φ. Наибольшая точность классификации пола будет соответствовать биометрическому показателю с максимальным, а наименьшая – с минимальным модулями параметра нецентральности.
186

6. Для каждого показателя определяют наихудшие с позиции точности классификации интервальные оценки генерального среднего и генерального стандартного отклонения. Для двух альтернативных групп объектов, состоящих из n1 и n2 членов с точечными
оценками параметров х1, s1 и х2 , s2 , причем x1 < х2 , наихудшими для точности классификации интервальными оценками неизвест-
ных параметров распределения µ1, σ1 и µ2 , σ 2 являются: |
|
||||||||||||||||||||||||||||||||||
µ |
|
= |
|
|
|
|
+ t |
|
|
|
|
|
|
s1 |
и σ |
|
= s |
|
|
|
|
n1 −1 |
|
; |
|
|
(34) |
||||||||
|
х |
|
α ;n1−1 |
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
χ12−α / 2;n −1 |
|||||||||||||||||||||
|
1 |
1 |
|
|
|
|
|
n1 |
|
1 |
|
1 |
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
µ |
|
= |
|
|
|
− t |
|
|
|
|
s2 |
|
и σ |
|
= s |
|
|
|
|
n2 −1 |
|
, |
(35) |
||||||||||||
2 |
х |
2 |
α;n2 |
−1 |
2 |
2 |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
χ 2 |
|
|||||||||||||||||||||||||||
|
|
|
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
n 2 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1−α / 2;n2 −1 |
|
|||||
где tα ;n−1 и χ12−α / 2;n−1 |
|
- значения двустороннего критерия Стьюдента |
и χ 2 - критерия при уровне значимости α и v = n −1 количестве сте-
пеней свободы.
7. Строят упорядоченный ряд дискретных значений каждого исследуемого показателя: х1 > х2 > … хn−1 > хn , причем х1 ≥ х2 + 3s2 , хn ≤ х1 − 3s1, а xi − xi+1 = ε , где ε – максимальная погрешность из-
мерительного инструмента.
8. Используя наихудшие для точности классификации интервальные оценки параметров распределения, дважды нормируют каждое значение xi упорядоченного ряда х1 > х2 > … хn−1 > хn :
zi |
= |
xi − µ2 |
и zi |
= |
xi − µ1 |
, |
|
|
|||||
2 |
|
s2 |
1 |
|
s1 |
|
|
|
|
|
где z – стандартная нормальная переменная.
9. Для каждого значения z определяют функцию плотности стандартного нормального распределения:
|
|
1 |
|
e− |
z2 |
|
|
|
f (z) = |
|
|
2 , |
(36) |
||||
|
|
|
||||||
2π |
||||||||
|
|
|
|
|
|
|
после чего строят два ряда значений f (z2i ) и 1− f (z1i ).
10. Для каждого xi определяют вероятность принадлежности к альтернативным классифицируемым группам по формулам:
|
1− f (zi |
) |
|
|
|
f (zi |
) |
|
|
||
p1 = |
|
1 |
|
|
100% и |
p2 = |
|
2 |
|
|
100%, (37) |
(1− f (zi |
)) + f (zi |
) |
(1− f (zi |
)) + f (zi |
) |
||||||
1 |
|
2 |
|
|
|
1 |
|
2 |
|
|
187
осуществляют проверку: p1 + p2 = 1. Полученные данные табули-
руют или представляют в форме набора номограмм.
Важнейшим отличием результатов приведенного алгоритма является формулирование экспертных выводов в количественной вероятностной форме, а не в терминах ранговой шкалы (достоверно, вероятно, пол не определен). Причем производится заблаговременный расчет вероятностей половой принадлежности для любого значения биометрического показателя идентифицируемого объекта, которое только возможно получить с помощью конкретного измерительного инструмента. Это позволяет в дальнейшем при производстве антропологических экспертиз по конкретному результату биометрии с помощью номограмм или табулированных данных сразу определять количественный вероятностный вывод о половой принадлежности идентифицируемого объекта.
Следующим принципиальным отличием приведенного метода одномерной биномиальной классификации от стандартного одномерного дискриминантного анализа является базирование всех расчетов на наихудших для точности классификации интервальных оценках параметров распределения исследуемого биометрического показателя. Следствием данного подхода является сведение риска ошибочности количественных вероятностных выводов о половой принадлежности идентифицируемых объектов к заранее определенному минимуму. Указанный минимум характеризуется вероятностью выхода истинного значения хотя бы одного какого-либо параметра распределения исследуемого показателя в одной из двух альтернативных групп объектов за пределы рассчитанных интервальных оценок. Данная вероятность полностью определяется уровнем значимости, равняясь 2α, и зависит от выбора исследователя. Изложенный подход позволяет утверждать, что вероятность половой принадлежности идентифицируемых объектов с надежностью 1− 2α не меньше значения, рассчитанного с помощью описанного метода одномерной биномиальной классификации. Это освобождает от необходимости последующего тестирования точности классификации пола.
Последнее отличие изложенного метода одномерной биномиальной классификации от одномерного дискриминантного анализа заключается в том, что ранжирование диагностических критериев позволяет использовать для идентификации лишь один показатель с максимальной точностью классификации пола, а при невозмож-
188
ности его определения в случаях исследования фрагментированных объектов – показатель, по точности следующий за первым.
Практическое использование метода одномерной биномиальной классификации можно показать на примере идентификации половой принадлежности подъязычной кости с использованием остеометрических данных В.Н. Звягина, Н.Л. Мальцевой, Л.А. Алексиной и О.И. Галицкой, полученных названными авторами при исследовании указанных костных объектов от 133 трупов лиц мужского и женского пола в возрасте 15-83 лет [41].
Программа остеометрии подъязычной кости, выполненная указанными авторами, включала определение 16 размеров, обозначенных ими как М1 – М16. Границы категорий отдельно взятого размера в данной работе устанавливали исходя из общепринятых величин (см. табл. 25). Отмеченная авторами встречаемость случаев в этих границах составила 33%, по 22%, 11,5% и 0% соответственно.
Осуществленная нами проверка показала соответствие распределений каждого из 16 количественных показателей подъязычной
кости нормальному распределению ( χ 2 > 10,359; р > 0,110). Одномерная биномиальная классификация при уровне значимости α = 0,05 выполнялась только для 10 остеометрических показателей, характеризовавшихся наличием половых различий.
Проведенное по точности классификации пола ранжирование остеометрических критериев показало, что в экспертной практике для определения половой принадлежности подъязычной кости необходимо использовать лишь показатель М16 (общая длина подъязычной кости), а при невозможности его определения в случаях исследования фрагментированных объектов – показатель М1 (усредненная длина больших рогов) и т.д. (табл. 28). Следует отметить, что показатели М5 (максимальный диаметр булавовидного утолщения больших рогов) и М12 (длина 3-го сегмента больших рогов) ввиду небольших межгрупповых различий оказались непригодными для проведения одномерной биномиальной классификации, поскольку интервальные оценки генерального среднего для женщин превысили таковые для мужчин.
Результаты выполнения остальных этапов одномерной биномиальной классификации приводим только для остеометрического показателя М16, характеризующегося наибольшей точностью диагностики пола (табл. 29).
189

Таблица 28
Исходные данные*, объединенная дисперсия, нормированные межполовые различия и интервальные оценки параметров распределения остеометрических показателей подъязычной кости
|
|
|
|
|
М16** |
М1 |
М4 |
М2 |
М3 |
М8 |
М13 |
М9 |
М5 |
М12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n2 |
89 |
89 |
89 |
89 |
89 |
89 |
89 |
89 |
89 |
89 |
||||
|
|
|
2 |
41,1 |
31,7 |
30,8 |
24,1 |
46,2 |
8,1 |
15,0 |
10,2 |
4,7 |
8,1 |
|
|
x |
|||||||||||||
|
s2 |
3,5 |
2,9 |
3,3 |
2,9 |
6,9 |
1,5 |
2,1 |
2,1 |
1,0 |
3,1 |
|||
|
n1 |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|||
|
|
|
|
1 |
35,7 |
27,6 |
26,6 |
20,8 |
39,3 |
6,8 |
13,3 |
9,1 |
4,3 |
6,9 |
|
|
x |
||||||||||||
|
|
s1 |
3,2 |
3,2 |
3,3 |
2,1 |
6,3 |
1,1 |
1,9 |
1,5 |
0,7 |
2,6 |
||
|
|
s |
3,411 |
2,998 |
3,266 |
2,653 |
6,743 |
1,391 |
2,013 |
1,946 |
0,908 |
2,920 |
||
|
|
φ |
1,583 |
1,367 |
1,286 |
1,244 |
1,023 |
0,935 |
0,844 |
0,565 |
0,441 |
0,411 |
||
µ2 |
40,36 |
31,09 |
30,12 |
23,50 |
44,74 |
7,78 |
14,56 |
9,75 |
4,49 |
7,46 |
||||
σ 2 |
4,12 |
3,40 |
3,81 |
3,37 |
8,14 |
1,78 |
2,44 |
2,49 |
1,16 |
3,59 |
||||
µ1 |
36,67 |
28,57 |
27,60 |
21,45 |
41,22 |
7,13 |
13,87 |
9,57 |
4,52 |
7,69 |
||||
σ1 |
4,05 |
4,04 |
4,18 |
2,71 |
8,01 |
1,37 |
2,37 |
1,94 |
0,90 |
3,31 |
Примечание. * - исходные данные приведены из работы В.Н. Звягина, Н.Л. Мальцевой, Л.А. Алексиной и О.И. Галицкой [41]; ** - показатели указаны в порядке убывания точности классификации пола. Поскольку средние значения остеометрических показателей у лиц мужского пола превышают таковые у лиц женского пола, то для всех статистик нижний индекс, равный 1, соответствует женщинам, равный 2 - мужчинам.
Учитывая, что для М16 х2 + 3s2 = 51,6 мм, х1 − 3s1 = 26,1 мм, а максимальная погрешность измерительного инструмента ε = 0,1 мм, упорядоченный ряд дискретных значений данного остеометрического критерия имеет вид: 51,6; 51,5; … 26,2; 26,1 мм. Графическое выражение полученных для показателя М16 результатов классификации пола представлено на следующей номограмме (рис. 34).
Таблица 29 Вероятности половой принадлежности для экстремумов М16
М16, мм |
z2i |
z1i |
f (z2i ) |
1− f (z1i ) |
p2 |
p1 |
51,6 |
2,730 |
3,682 |
0,997 |
1,159 10−4 |
99,988 |
0,012 |
26,1 |
-3,730 |
-2,879 |
9,561 10−5 |
0,998 |
0,010 |
99,990 |
190