Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Класс_Кт.doc
Скачиваний:
25
Добавлен:
08.12.2018
Размер:
2.29 Mб
Скачать

2.3.1 Метрика Махалонобиса

Метрика Махалонобиса, или расстояние по Махалонобису используется для вычисления расстояний между объектами и центрами классов. Эта метрика является обобщением евклидовой метрики и, в отличие от других метрик, учитывает, так называемый скейлинг или масштабное преобразование значений существенных признаков. При этом расстояние становится безразмерной величиной. Метрика Махаланобиса может использоваться в процедурах классификации, использующих такие алгоритмы, как простой или нечеткий алгоритм К-средних и алгоритм ИЗОДАТА.

Метрика Махаланобиса позволяет значительно улучшить процедуру обучения автоматической системы классификации в следующих случаях:

  1. Существенные признаки объектов выбраны неадекватно, классы плохо разделяются;

  2. Существенные признаки объектов сильно коррелируют между собой;

  3. Разделяющая поверхность между классами сильно изогнута;

  4. Классы могут состоять из подклассов, не соприкасающихся между собой в пространстве существенных признаков;

  5. Р азделяющие поверхности между классами имеют очень сложную форму.

Эти случаи размещения объектов в пространстве существенных признаков проиллюстрированы на рис. 2.10.

Расстояние по Махалонобису между объектом и центром некоторого класса вычисляется по формуле:

, (2.7.)

где - матрица, обратная к ковариационной матрице для данного класса, матрица – столбец элементы которой – разности одноименных координат объекта и центра класса .

Для того чтобы найти расстояние между объектом и классом в метрике Махалонобиса используются такие величины как центр класса, дисперсия, среднеквадратическое отклонение и матрица ковариаций. Рассмотрим их определения и методы вычисления.

2.3.1.1. Центр класса, дисперсия и среднеквадратичное отклонение

Пусть имеется некоторый класс , который содержит объектов, у каждого из которых существенных признаков, то есть

, , .

Центром класса является вектор , компоненты которого – средние значения одноименных, существенных признаков всех объектов данного класса. Другими словами, средним значением - того существенного признака объектов того класса является арифметическое среднее:

. (2.8)

Таким образом, центр класса - вектор, координаты которого – среднеарифметические значения одноименных существенных признаков, или среднеарифметический вектор

.

Дисперсия – это мера «размытости» класса, или мера отклонения значений существенных признаков объектов от центра данного класса. В -мерном пространстве существенных признаков дисперсия для класса определяется в виде вектора-строки или матрицы-строки вида , причем элементы этой матрицы - дисперсии того признака - определяются из соотношения:

. (2.9.)

Здесь, как и раньше, - количество объектов в данном классе.

Стандартным или среднеквадратичным отклонением называется корень квадратный из дисперсии , причем среднеквадратическое отклонение того признака объектов того класса определяется по формуле

. (2.10.)

Эта величина измеряется в тех же единицах, что и среднее значение существенных признаков данного класса.