- •6.6. Классификация наблюдений в случае нескольких генеральных совокупностей
- •6.7. Классификация наблюдений в случае нескольких многомерных нормальных совокупностей
- •6.8. Пример классификации в случае нескольких многомерных нормальных генеральных совокупностей
- •§6.2. Берксон [1]; Берт [I]; Блекуэлл и Гиршик [1]; Вальд [3].
6.8. Пример классификации в случае нескольких многомерных нормальных генеральных совокупностей
Рао [6] рассмотрел три генеральные совокупности, состоящие из членов индийских каст браминов (), ремесленников () и корва ().
Для каждого члена касты измерялись рост стоя (), рост сидя (x2), ширина носа (x3) и длина носа (х4). Средние значения этих величин для трех генеральных совокупностей приведены в таблице 6.
Таблица 6
|
Брамины ()
|
Ремесленники ()
|
Корва ()
|
Рост стоя ()....
|
164,51
|
160,53
|
158,17
|
Рост сидя (х2) ....
|
86,41
|
81,47
|
81,16
|
Ширина носа (х3) . .
|
25,49
|
23,84
|
21,44
|
Длина носа (х4) . . .
|
51,24
|
48,62
|
46,72
|
Корреляционная матрица для всех генеральных совокупностей равна
1,0000
|
0,5849
|
0,1774
|
0,1974
|
0,5849
|
1,0000
|
0,2094
|
0,2170
|
0,1774
|
0,2094
|
1,0000
|
0,2910
|
0,1974
|
0,2170
|
0,2910
|
1,0000 |
Стандартные отклонения равны = 5,74;= 3,20;= 1,75;=3,50. Предположим, что каждая генеральная совокупность является нормальной. Задача состоит в том, чтобы разбить пространство четырех случайных величинx1 ,х2,,х3,, х4 на три области классификации. Предположим, что цены ошибочных классификаций равны между собой. Мы найдем: 1) множество областей в предположении, что новоенаблюдение можно с одинаковой вероятностью отнести к каждой из генеральных совокупностей (=q2 =q3= 1/3) и 2) множество таких областей, что наибольшая вероятность ошибочной классификации будет минимальной (минимаксное решение).
Сначала мы вычислим коэффициенты иТогда. Затем мы вычислим
.
Мы получим дискриминантные функции1)
(х) =-0,0708+0,4990+0,3373+ 0,0887x4 + 43,13,
u,13(x) = 0,000З+0,3550+ 1,1063+ 0,1375x4-|-62,49, (2)
u23 (х) = 0,0711- 0,1440+ 0,7690- 0,0488x4 + 19,36.
Другие три функции определяются следующим образом:
Если известны априорные вероятности и если они равны между собой, то наилучшее множество областей классификации определяется таким образом:
и
Например, если при измерении некоторого индивидуума мы получили такой результат х, что и u13 (x), то мы отнесем его к касте браминов.
Чтобы найти вероятности ошибочных классификаций, когда индивидуум взят из совокупности , необходимо знать средние значения, дисперсии и ковариации соответствующих парu. Они приведены в таблице 71).
Таблица 7
Генеральная совокупность х
|
u
|
Среднее
|
Стандартное отклонение
|
Коэффициент корреляции
|
|
|
1,491
|
1,727
|
|
|
|
|
|
0,8658
|
|
|
3,487
|
2,641
|
|
|
|
1,491
|
1,727
|
|
|
|
|
|
—0,3894
|
|
|
1,031
|
1,436
|
|
|
|
3,487
|
2,641
|
|
|
|
|
|
0,7983
|
|
|
1,031
|
1,436
|
|
Вероятности ошибочных классификаций получаются тогда посредством использования таблиц для двумерного нормального распределения. Эти вероятности равны 0,21 для , 0,42 для и 0,25 для. Например, если измерения произведены над брамином, то вероятность классифицировать его как ремесленника или как члена касты корва равна 0,21.
Минимаксное решение получается посредством нахождения констант ,c2 и с3 для (3) § 6.7 так, чтобы вероятности ошибочной классификации были равны между собой. Области классификации определяются следующим образом:
:0,54;u13 (х) 0,29;
-0,54; u23(x)- 0,25; (3)
-0,29; 0,25.
Полная вероятность ошибочной классификации (с точностью до двух десятичных знаков) равна 0,30. Таким образом, максимальная вероятность ошибочной классификации уменьшена с 0,42 до 0,30.
ЛИТЕРАТУРА