Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по СППР / Лекция 6-7.doc
Скачиваний:
190
Добавлен:
23.03.2016
Размер:
2.2 Mб
Скачать

Сравнение данных

Определение 16образец данных, n-атрибутным образцом данных называется вектор, состоящий из п элементов, называемых также атрибутами, представленных вещественными значениями. Другое название для образца

данных — точка данных, или вектор данных.

Будем оценивать степень подобия образцов данных понятием расстояния между ними d.

Пусть дано Q образцов данных (множество Хр), имеющих по К атрибутов. Построим, используя расстояние d, семейство нечетких множеств, которые можно назвать "точки, схожие с точкой q". Степень принадлежности элементов данных множеств будет показывать, насколько образец данных "схож" предъявляемым образцом данных.

Определение 17 мера сходства по расстоянию. Мерой сходства по расстоянию с образцом данных х0 назовем функцию , которая определяется по формуле:

где К— постоянный коэффициент, выбираемый в соответствии с ограничениями на область значений функции f (х).

Определение 18нормальной мерой сходства по расстоянию с образцом нных х0 назовем такую меру, которая достигает своих граничных значений множестве X.

С учетом определений 17 и 18 функции принадлежности вводимых в рассмотрение нечетких множеств можно называть мерами сходства соответствующих точек данных.

Очень важное значение при определении данных нечетких множеств имеет конструктивная процедура определения меры сходства. Даже при помощи одного понятия расстояния между образцами данных можно по-разному определить указанную меру сходства, по-разному выбирая коэффициент К из определения 17. Учитывая это, определения 16 и 17 и замечание 8 можно представить по крайней мере два способа конструктивного определения значений функции принадлежности:

Обе формулы удовлетворяют определению меры сходства, причем первая из них в соответствии с определением 18 является нормальной мерой сходства. Для дальнейшего анализа потребуется именно нормальная мера сходства. Ее достоинства заключаются в гарантии, что для каждого образца данных,- существует по крайней мере один образец данных, который абсолютно схож с Xi (мера сходства при этом достигает значения 1). Таким образцом является сам образец данных, одновременно с этим для каждого образца данных х, существует по крайней мере один образец данных, максимально отличающийся от х, (мера сходства при этом достигает значения 0). С другой стороны, данная мера сходства не учитывает расстояния между остальными точками (расстояния, отличные от расстояний d(x , xk), q— заданная точка,

Рис. 7.10. Выбор нормирующего коэффициента для определения меры сходства по расстоянию

Вторая мера сходства сравнивает образцы данных относительно двух взаимно удаленных точек, что усложняет интерпретацию значений данной меры сходства, когда необходимо узнать, какая точка является наиболее близкой к данной, а какая наиболее удаленной.

Подведем итоги:

  • определен способ построения Q нечетких множеств, имеющих название "множество точек, близких к точке q";

  • в каждом множестве есть по крайней мере один элемент, обладающий нулевой степенью принадлежности данному множеству, и по крайней мере один элемент, обладающий единичной степенью принадлежности данному множеству (соответствующая точка q);

  • функции принадлежности построенных нечетких множеств являются нормальными мерами сходства относительно соответствующих образцов данных.

Соседние файлы в папке Лекции по СППР