
- •2.1. Введение
- •2.2. Признаки объекта
- •2.3. Мера сходства объектов и классов. Расстояния.
- •2 .3.1 Метрика Махалонобиса
- •2.3.1.1. Центр класса, дисперсия и среднеквадратичное отклонение
- •2.3.1.2. Скейлинг (масштабное преобразование) и стандартизованное расстояние
- •2.3.1.3 Ковариационная матрица
- •2.3.1.4 Алгоритм вычисления расстояния по Махалонобису
- •2.3.2. Функции сходства.
- •2.3.3 Расстояние между списками
- •2.4. Общая схема классификации и распознавания образов
- •2.4.1. Понятие об обучении. Обучение с учителем и без учителя.
- •2.4.2. Общая схема системы классификации
- •2.5. Разделяющие поверхности и разделяющие функции
2.3.2. Функции сходства.
В том случае, когда существенные признаки объектов имеют бинарные значения, для определения меры близости таких образов используют специальные функции сходства, которые позволяют проводить классификацию таких объектов.
Пусть заданы два
объекта
и
,
- бинарные значения существенных
признаков этих объектов. Для того чтобы
определить функции сходства введем в
рассмотрение следующие параметры:
Количество одинаковых признаков, которые есть у объектов и
:
;
(2.13)
Количество одинаковых признаков, которых нет у объектов и :
;
(2.14)
Количество одинаковых признаков, которых нет у объекта , и которые есть у :
;
(2.15)
Количество одинаковых признаков, которые есть у объектов
, и которых нет у
:
.
(2.16)
Рассмотрим пример,
пусть заданы два объекта
и
.
Вычислим значения параметров, приведенных
выше, для этих двух объектов.
Из определения
этих параметров следует, что чем больше
сходство между объектами
и
,
тем больше должен быть параметр
.
При этом функция сходства должна обладать
следующими свойствами. Она должна быть
возрастающей по
,
убывающей в зависимости от
и симметричной относительно
и
.
Рассмотрим различные функции сходства:
Функция
определяет взвешенное значение параметра
,
для того чтобы исключить зависимость
от количества значений существенных
признаков
.
Следует отметить, что в случае двух
идентичных объектов
,
а
.
При этом функция
стремится к бесконечности, функции
,
,
,
и
равняются единице, а
.
Рассмотрим применение функций сходства на простом примере распознавания объектов самолет, автомобиль и птица, которые характеризуются следующими признаками: крылья, колеса, двигатель и оперение. Установим значения существенных признаков для представителей этих классов (таблица 2.2).
Таблица 2.2. Бинарные значения существенных признаков |
|||||
|
Крылья |
Колеса |
Двигатель |
Оперение |
|
1 |
Автомобиль |
0 |
1 |
1 |
0 |
2 |
Самолет |
1 |
1 |
1 |
0 |
3 |
Птица |
1 |
0 |
0 |
1 |
Пусть системе
распознавания предъявлен объект
.
Вычислим функцию сходства
для каждого класса. Для ее определения
нужно найти значения только параметра
.
Для первого класса
,
отсюда следует, что для этого класса
.
Для второго класса
,
и
.
И наконец, для третьего класса
,
при этом
.
Поскольку для третьего класса функция
сходства имеет наибольшее значение, то
предъявленный объект является птицей.
Предположим теперь, что вследствие
ошибок допущенных на стадии определения
существенных признаков распознаваемого
объекта на вход системы поступил
следующий набор их значений
.
Не трудно убедиться, что функция сходства
для второго класса в этом случае будет
иметь наибольшее значение
и, следовательно, данный объект, скорее
всего, является самолетом.
В заключение следует отметить, что функции сходства, как это следует из их определения, не являются метрическим расстоянием.