Реброва М.П. Размытые множества в теории классификации // НТИ. Сер 2. – 1976. - № 10. – С. 15-21.
УДК 519.5.025.4.01
РАЗМЫТЫЕ МНОЖЕСТВА В ТЕОРИИ КЛАССИФИКАЦИИ
М. П. Реброва
I. Размытые множества
Решение многих информационных задач связано с разбиением множества каких-то определенных объектов на четко разграничиваемые классы, например, массив документов — на тематические подмассивы, множество запросов — на группы. Формальной предпосылкой постановки таких задач служат «квазиопределения» [1] канторовской теории множеств, предполагающие, в частности, задание способа различения элементов множества. В большинстве же реальных ситуаций возникает необходимость описывать переход элемента от одного множества к другому. Иллюстрацией того, каким образом это можно сделать, служит введенное Л. Заде понятие размытого множества (в переводной литературе нечеткого, расплывчатого), интуитивно—класса, не имеющего строго -определенных границ. Такое множество определяется путем задания степеней принадлежности каждого элемента множеству.
В связи с этим приведем ряд основных понятий теории размытых множеств и размытых отношений [2,3].
Начнем с определений.
Определение 1. Размытое множество А в пространстве объектов Х — это множество упорядоченных пар {{х, /а (.»•))}, где !л(х) обозначает степень вхождения х в А, лежащую в интервале [0, I].
Носитель размытого множества А есть множество элементов х, для которых /а (х) положительна.
Ограничение области значения характеристической •функции вхождения единичным интервалом сделано в целях удобства. Принято считать, что чем ближе значение функции к 1, тем выше степень вхождения объекта во множество. В этом случае, когда мы имеем дело с множеством в обычном смысле этого слова, его характеристическая функция вхождения принимает только два значения — 1 и 0, в зависимости от того, принадлежит или нет объект множеству.
Пример 1. Пусть Х — множество действительных чисел, больших 1, а=|{о, 1, 5, 10, 100}. Тогда функция вхождения в размытое множество А может быть задана следующим образом:
/д(0)=0; /д(1)=0; /^(5) =0,01; /д (10) =0,2;
/^ (100) = 0,95.
Пример 2. Размытое множество А людей среднего возраста может быть задано таблицей его характеристической функции вхождения:
В этой таблице приведены те х, которые образуют носитель множества А.
Пример 3. Ранжирование объектов (терминов в частотных словарях, названий или кодов журналов при исследовании документальных потоков) можно рассматривать как процедуру приписывания каждому объекту нормированной степени вхождения в размытое множество исследуемых объектов.
Примем для обозначения размытого множества выражение
А^{(х.^(х))}.
В общем случае функция вхождения может быть задана различным образом: формулой, таблицей, некоторым алгоритмом, либо через другие функции вхождения.
Понятие размытого множества не имеет статистической природы, поэтому схожесть характеристической функции вхождения ,с вероятностной, когда Х — перечислимое множество, чисто внешнее. Особенно это ясно становится из последующих операций над размытыми множествами. (Вероятностная трактовка функций вхождения дана в '[4].)
Определение 2. Размытое множество А называется пустым (А=0), если характеристическая функция вхождения тождественно равна нулю (}л(х)=^0).
Определение 3. Размытое множество А совпадает с размытым множеством В (А=В}, если }л(х)=}в{х) для 'ух(^_х. В этом случае принято писать: /д-=/в.
Очевидно, что множества А и б имеют один и тот же носитель.
Определение 4. Дополнение размытого множества А обозначают А' и определяют через функцию вхождения следующим образом:
/Л——1-/А.
Определение 5. Размытое множество А называется подмножеством размытого множества В (АсгВ), если для всех х}л(х)<}в(х).
В этом и в дальнейших определениях носители множеств А и В могут не совпадать, если, например, А-= •={(д:,, 0,6), (л:;, 0,3)} и В={(д-,, 0,8), (Хч, 0,5), (Хз.0,6)}, то Ас5.
Определение 6. Объединение двух размытых множеств А и В называется размытое множество С(С=А[)В), если /с=тах[/А, <в]. Последнее обозначается иногда так: ^с=!л\/^в. •
Определение 6'. Размытое множество С, являющееся объединением размытых множеств А и В (С==А\]В) с функцией вхождения ^с= спахал, ^в], называется наи-
Возраст х
|
40
|
41
|
42
|
43
|
44
|
45
|
46
|
47
|
48
|
49
|
50
|
51
|
52
|
53
|
Степень
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
вхождения {д (х)
|
0,3
|
0,5
|
0,8
|
0,9
|
1
|
1
|
1
|
1
|
1
|
0,9
|
0,8
|
0,7
|
0,5
|
0,3
|
ИНФОРМАЦИОННЫЙ АНАЛИЗ . НТИ . СЕР. 2 . № 10 . 1976 15
большим размытым множеством, содержащим как А, так и В.
Это определение связано с тем, что функция вхождения /с, ограниченная сверху /Е=1, имеет точную, верхнюю границу. По аналогии с границами точечных множеств (а каждое размытое множество можно рассматривать, в свою очередь, как объединение составляющих его одноточечных множеств [5, с. 12]) объединение двух размытых множеств является наибольшим размытым множеством, содержащим А к В.
Определение 7. Пересечение двух размытых множеств А и В является размытым множеством С (С'=А(}В), если функция вхождения {с^ттЦл, /в], что обозначается /С=/АЛ/В.
Определение Т. Пересечением С двух размытых множеств А и В называется наибольшее размытое множество, входящее одновременно в А и Д.
Это определение пересечения С связано с тем, что характеристическая функция вхождения ^е, ограниченная снизу }==0, имеет точную нижнюю границу.
Иллюстрация характеристической функции вхождения, соответствующей объединению двух размытых множеств (участки 1 и 2) и пересечению (участки 3 и 4), дана на рис. 1.
Рис. 1
Операции объединения, пересечения и дополнения над размытыми множествами удовлетворяют следующим •наиболее важным законам:
СП (А{]В}={С[}А) и (СГ}В)\ Дистрибутивные СЦ (апв) = (СЦА) П (СЦбЯ-законы
Ли(йиО=(^и5)иС) . ЛП (5ПО = (АПВ) ПС; Ассоциативные законы
(АиВ)'=А'Г\В'\ _ (А^Ву=А'^В'\ законы Моргана
Размытые множества в пространстве Х образуют дистрибутивную структуру с нулем и единицей [6, с. 16]. Роль нуля играет пустое множество, а единицы—все прОстранстьо X.
Алгебраические операции над размытыми множествами
Определение 8. Алгебраивческое произведение двух размытых множеств А я В обозвавается АВ и определяется а терминах функций вхождения соотношением /ав==/а/я. Понятно, что АВ<=А[\В.
Определение 9. Алгебраическая сумма двух размытых множеств А иВ обозначается через А+В к определяется /а+л=/а+/я, где /А+/да^1. Когда /д+/в>1, объект ве включается в алгебраическую 'сумму.
Операция, двойственная алгебраическому произведению, является прямой суммой АО)В=(А'В')'=А+В—АВ (теорема Ковера).
Для обычных множеств пересечение и алгебраическое произведение являются эквивалентными операциями, так же как Ц и ®. •
Определение 10. Абсолютная разность А и 5 обозначается /А—В/ и определяется через }л и /в следующим образом: //л-в/^Пл—Ы.
В случае обычных множеств множество /Л—В/ является симметрической разностью А а В, определяемой:
/А-В{=(А\В)[}(В\А).
Выпуклость, ограниченность, отделимость размытых множеств в евклидовом пространстве
Соответствующие определения для обычных множеств» можло посмотреть ,в [7, с. 122, 123, 159].
Выпуклая комбинация. В основе многих важных разделов теории линейных пространств лежит понятие вы-' пуклости. В линейном пространстве Х множество называется выпуклым, если оно вместе с любыми двумя точками (х, у(:Х) содержит и соединяющий их отрезок. Под выпуклой комбинацией двух векторов / и § обычно» понимают линейную комбинацию / и §• в виде А^-г-' + (1—^)5, где О^Л^1.
Определение 11. Пусть А, В и Л—произвольные размытые множества. Выпуклая комбинация обозначается через (А, В; Л) и определяется соотношением (А, В, Л) ^АА+А.'В. Пусть пространство Х является Евклидовым пространством размерности А. Обозначим его Е11.
Определение 12. Размытое множество А в пространстве Е11 называется выпуклым, если множества" Га'='{^|/А(^)^а} выпуклые для всех а6[0,1]. (Множества Га являются множествами в обычном смысле-слова—см. определение 9,части II.)
Приведем второе, равносильное первому, определение" выпуклости (доказательство см. в [2]).
Определение 12'. Размытое множество Л называется» выпуклым, если и[Кх1+(1-^,}хг]'^тт[}А(х1), Щх^)} для всех х\Хч^Х и Хб[0, I].
Второе определение никак не связано с выпуклостью-функции }{х), что видно из рис. 2. В обоих случаях
^м
' ^[^^Ц-Л1х,]
л, ^ х^ х; х
Я. х^{1-Л)х^ 1-ГлМ быпуклаго размытого мнажестКа И^х) нейыпутюго разттага множестЛа.
Рис. 2
знак 'выпуклости функции меняется, однако в первом' случае представлена функция выпуклого размытого^ множества, а во втором — невыпуклого. Основное свойство-выпуклых размытых множеств состоит в том, что если-А и В выпуклые, то их пересечение также выпукло.
Ограниченность. Как. известно, для нормированных пространств понятие ограниченности совпадает с ограниченностью по норме, т. е. с возможностью поместить данное множество внутрь некоторого шара.
Определение 13. Размытое множество А ограничено в пространстве Е^, если множества Га={^|/А (х)^о^ ограничены для всех сб>0.
Возможны две интерпретации последнего определения. Во-первых, для каждого а>0 существует множество /?('«) такое, что \\х\\<К{а} для всех -сбГа. Во-вторых, для каждого е>0 существует гиперплоскость Н такая, что {л(х)^е, для х, лежащих. по ту сторону от Я, которая не содержит начала координат. Попробуем это показать. В линейном простран-