Скачиваний:
50
Добавлен:
01.05.2014
Размер:
1.04 Mб
Скачать

6.8. Пример классификации в случае нескольких многомерных нормальных генеральных совокупностей

Рао [6] рассмотрел три генеральные совокупности, состоящие из членов индийских каст браминов (), ремеслен­ников () и корва ().

Для каждого члена касты измеря­лись рост стоя (), рост сидя (x2), ширина носа (x3) и длина носа 4). Средние значения этих величин для трех генеральных совокупностей приведены в таблице 6.

Таблица 6

Брамины ()

Ремесленники ()

Корва ()

Рост стоя ()....

164,51

160,53

158,17

Рост сидя 2) ....

86,41

81,47

81,16

Ширина носа 3) . .

25,49

23,84

21,44

Длина носа 4) . . .

51,24

48,62

46,72

Корреляционная матрица для всех генеральных совокуп­ностей равна

1,0000

0,5849

0,1774

0,1974

0,5849

1,0000

0,2094

0,2170

0,1774

0,2094

1,0000

0,2910

0,1974

0,2170

0,2910

1,0000


Стандартные отклонения равны = 5,74;= 3,20;= 1,75;=3,50. Предположим, что каждая генеральная совокуп­ность является нормальной. Задача состоит в том, чтобы разбить пространство четырех случайных величинx12,,х3,, х4 на три области классификации. Предположим, что цены ошибочных классификаций равны между собой. Мы найдем: 1) множество областей в предположении, что новоенаблюдение можно с одинаковой вероятностью отнести к каждой из генеральных совокупностей (=q2 =q3= 1/3) и 2) множество таких областей, что наибольшая вероятность ошибочной классификации будет минимальной (минимаксное решение).

Сначала мы вычислим коэффициенты иТогда. Затем мы вычислим

.

Мы получим дискриминантные функции1)

(х) =-0,0708+0,4990+0,3373+ 0,0887x4 + 43,13,

u,13(x) = 0,000З+0,3550+ 1,1063+ 0,1375x4-|-62,49, (2)

u23 (х) = 0,0711- 0,1440+ 0,7690- 0,0488x4 + 19,36.

Другие три функции определяются следующим образом:

Если известны априорные вероятности и если они равны между собой, то наилучшее множество областей классифи­кации определяется таким образом:

и

Например, если при измерении некоторого индивидуума мы получили такой результат х, что и u13 (x), то мы отнесем его к касте браминов.

Чтобы найти вероятности ошибочных классификаций, когда индивидуум взят из совокупности , необходимо знать средние значения, дисперсии и ковариации соответ­ствующих парu. Они приведены в таблице 71).

Таблица 7

Генеральная совокупность х

u

Среднее

Стандартное отклонение

Коэффициент корреляции

1,491

1,727

0,8658

3,487

2,641

1,491

1,727

—0,3894

1,031

1,436

3,487

2,641

0,7983

1,031

1,436

Вероятности ошибочных классификаций получаются тогда посредством использования таблиц для двумерного нормаль­ного распределения. Эти вероятности равны 0,21 для , 0,42 для и 0,25 для. Например, если измерения произ­ведены над брамином, то вероятность классифицировать его как ремесленника или как члена касты корва равна 0,21.

Минимаксное решение получается посредством нахожде­ния констант ,c2 и с3 для (3) § 6.7 так, чтобы вероят­ности ошибочной классификации были равны между собой. Области классификации определяются следующим образом:

:0,54;u13 (х) 0,29;

-0,54; u23(x)- 0,25; (3)

-0,29; 0,25.

Полная вероятность ошибочной классификации (с точностью до двух десятичных знаков) равна 0,30. Таким образом, максимальная вероятность ошибочной классификации умень­шена с 0,42 до 0,30.

ЛИТЕРАТУРА