
Оценка точности алгоритма kNN.
В методе распознавания kNN следует для разных значений k (число ближайших соседей) оценивать качество классификации.
Таблица. Матрица результатов классификации
Истинный |
Число |
Результат распознавания (класс), j |
|||
класс, |
объектов |
|
|
|
|
1 |
2 |
3 |
|||
i |
|
||||
|
|
|
|
||
|
|
|
|
|
|
1 |
N1 |
F11=T1 |
F12 |
F13 |
|
|
|
|
|
|
|
2 |
N2 |
F21 |
F22=T2 |
F23 |
|
|
|
|
|
|
|
3 |
N3 |
F31 |
F32 |
F33=T3 |
|
|
|
|
|
|
Ti – число верно распознанных объектов i-го класса.
Fij – число объектов i-го класса, отнесенных к классу j.
Оценка качества классификации (общая точность):
OA |
F11 F22 F33 |
|
T1 T2 T3 |
. |
||||||
N N |
|
N |
|
|
||||||
|
2 |
3 |
|
N N |
2 |
N |
3 |
|
||
|
1 |
|
|
1 |
|
|
OA – это доля правильно распознанных классов (из общего числа ответов алгоритма). Показывает возможность алгоритма правильно распознавать классы.
Следует построить зависимость OA от k.
Такой способ оценки эффективности распознавания можно использовать для двух вариантов (критериев) алгоритма kNN: максимальное число ближайших соседей (1), взвешенный способ (2).
Учитывая важность задачи обнаружения крайне опасной аритмии
(фибрилляция желудочков сердца, ФЖ) можно оценить чувствительность обнаружения именно этой патологии. Это способность алгоритма обнаруживать именно этот класс.
В общем случае вычисляется как отношение диагонального элемента матрицы результатов (i=j) к сумме элементов соответствующей строки.