4.2 Многоклассовая задача
Уже упомянутая в выражении (3) матрица модифицируются для решения трехклассовой задачи следующим образом:
|
(5) |
Появившийся коэффициент в общем виде записывается как и отражает число классов, в нашем случае 3: ФЖ, ЖТ, НР. Средний внутриклассовый разброс также подлежит перерасчету относительно всех трех классов разом . Классификация подразумевает нахождение весовых векторов и и проецирование исходных данных в новое пространство признаков, где классы хорошо разделимы.
Для нахождения весовых векторов воспользуемся следующей формулой:
|
(6) |
где равняется 2 наибольшим собственным числам, для которых и приходятся собственными векторами.
Рисунок 11 – Проекция объектов на плоскость в пространстве признаков W1 и W2
Запишем получившиеся в результате нахождения собственных векторов и чисел произведения (6) коэффициенты весовых векторов:
W1 = [-0.0179; -0.0541; -0.0213; 0.1513; 0.2360; -0.0176; -0.3387; -0.2238; 0.0427; 0.4325; 0.2248; 0.2020; -0.0872; -0.4694; -0.4944] при = 4.3;
W2 = [0.0311; -0.0900; -0.1188; 0.0576; -0.0322; -0.0923; -0.3598; -0.1684; 0.0174; -0.1235; -0.3679; 0.2126; 0.7729; -0.1123; 0.0085] при = -3.6;
Запишем уравнения дискриминантной функции и соответствующие им решающие правила.
= –0.0179(x1) – 0.0541(x2) – 0.0213(x3) + 0.1513(x4) + 0.236(x5) – 0.0176(x6) – 0.3387(x7) – 0.2238(x8) + 0.0427(x9) + 0.4325(x10) – 0.2248(x11) + 0.2020(x12) – 0.0872(x13) – 0.4694(x14) – 0.4944(x15) – 4.3 = 0;
Если полученная скалярная проекция искомого вектора X на весовой вектор W1 больше, чем пороговое значение , то данный объект принадлежит классу ФЖ.
= 0.0311(x1) – 0.0900(x2) – 0.1188(x3) + 0.0576(x4) – 0.0322(x5) – 0.0923(x6) – 0.3598(x7) – 0.1684(x8) + 0.0174(x9) – 0.1235(x10) – 0.3679(x11) + 0.2126(x12) + 0.7729(x13) – 0.1123(x14) + 0.0085(x15) – 3.6 = 0;
Если полученная скалярная проекция искомого вектора X на весовой вектор W2 меньше, чем пороговое значение , то данный объект принадлежит классу ЖТ, иначе к НР.
Проведем оценку точности, чувствительности и специфичности алгоритма классификации по критерию Фишера для трехклассовой задачи задачи (см. таблицы 9-11).
Таблица 9 – Оценка ошибок классификации по проекциям на W1
Этап классификации |
TP |
FP |
TN |
FN |
Чувствительность, % |
Специфичность, % |
Точность, % |
Выделение ФЖ |
30 |
0 |
60 |
0 |
100 |
100 |
100 |
Таблица 10 – Оценка ошибок классификации по проекциям на W2
Этап классификации |
TP |
FP |
TN |
FN |
Чувствительность, % |
Специфичность, % |
Точность, % |
Выделение ЖТ |
29 |
0 |
30 |
1 |
96.6 |
100 |
98.3 |
Таблица 11 – Сводная таблица оценок ошибок классификации
Истинный класс |
Число объектов |
Результат распознавания |
||
НР |
ЖТ |
ФЖ |
||
НР |
30 |
30 |
0 |
0 |
ЖТ |
30 |
1 |
29 |
0 |
ФЖ |
30 |
0 |
0 |
30 |
Вывод: при использовании метода классификации по критерию Фишера (двухклассовая задача) точность на первом этапе и на втором этапе достигла 100 %, что значительно превышает результаты, полученные классификацией по критерию минимума расстояний. Для гауссовского распределения точность на первом и втором этапе составили соответственно 99.8 % и 98.6 %. На обоих этапах классификации проекции классов практически не пересекаются, что и объясняет удивительно высокие показатели точности. При решении трехклассовой задачи была достигнута 100 % точность в определении опасной фибрилляции и нормального фонового ритма, однако показатель снизился до 98.3 % при детекции пограничного состояния трепетания желудочков сердца. Общая точность составила 98.8 %.