Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по СИИ.doc
Скачиваний:
175
Добавлен:
02.05.2014
Размер:
3.54 Mб
Скачать

2.3.3. Типы классификаций

Как уже указывалось ранее, между таксонами существуют определенные взаимосвязи. Наиболее простая связь между двумя таксонами –отношение включения. ТаксонТiсодержится в таксонеTj, если все виды таксонаТi принадлежат таксону Tj.Кроме того, таксоны могут быть связаны отношением пересечения.

Если таксоны Тiи Tjимеют непустое пересечение и один из них содержится в другом, то

классификационная структура таксонов по отношению включения является древовидной. Каждый таксон в этой структуре принадлежит определенному уровню в дереве (рис. 3).Наиболее ярким примеромдревовидной классификации,является Универсальная десятичная классификация (УДК). Как будет показано ниже, алгебраическая структура архетипов может быть как древовидной, так и иметь более сложное строение.

Рис. 3.Алгебраическая структура таксона в древовидной классификации

Возможна и противоположная ситуация: архетипы образуют структуру типа дерево, а множество всех таксонов организовано не в виде дерева, а устроено более сложно. Например, этими свойствами обладает рубрикатор реферативных журналов. Так, выпуск «Теоретическая кибернетика» входит как в раздел «Мате­матика», так и в раздел «Автоматика и телемеханика», т. е. древовидность таксонов не выполняется, однако архетипы, как показано ниже, организованы в виде древовидной структуры.

Наконец, в заключение рассмотрим два случая, когда древовидной структурой не обладают ни таксоны, ни архетипы. Как станет ясно позже, данный тип классификации является наиболее универсальным. Строение множества таксонов и определяющих его архетипов задается более сложными алгебраическими структурами, известными в математике как решетки. Решеткимогут быть определены как множества, для любой пары элементов которых можно указать наибольший и наименьший элементы. Это определение фактически задает на исходном множестве двойное отношение порядка: «сверху вниз» и «снизу вверх». Это, как мы увидим далее, позволяет установить глубокую связь между таксономией и мерономией, присущей классификационным схемам данного типа. Простейшими классификационными структурами данного типа являютсябулевы классификации.К другому типу таксономической структуры относятсяфасетнаяиликомбинативная классификации.В качестве фасетов (аспектов) такой классификации выступают признаки понятий, имеющие различные имена. Каждый признак определяет разбиение множества сущностей на непересекающиеся подмножества первого уровня. Попарные пересечения таксонов первого уровня, которые задаются признаками с различными именами, дают таксоны второго уровня, тройные пересечения –таксоны третьего уровня и т. д. В результате таксон может быть взаимосвязан с двумя и более таксонами верхнего уровня.

Следовательно, комбинативная классификационная структура не является древовидной. Как и в случае булевых классификаций, алгебраическая структура комбинативных классификаций является решеткой.

2.3.4. Древовидные классификации

Проведем сопоставление различных типов классификационных схем путем сравнения структур их таксономических решеток по отношению теоретико-множественного включения входящих в них таксонов. Отношение включения является на множестве таксонов также и отношением порядка. Простейшая классификаци­онная схема -древовидная иерархия. Порядок называется древовидным, если для двух таксоновТiиTj, либоТi Тj, либоТiTj пусто.

Для древовидной классификации существует максимальный таксон, включающий в себя все остальные таксоны, и для каждого таксона совокупность подчиненных ему таксонов образует совокупность непересекающихся подмножеств. В качестве примера древовидной классификации рассмотрим Универсальную десятичную классификацию документов.

В соответствии с принципами построения УДК потенциальное множество всех документов делится на десять непересекающихся классов, которые индексируются цифрами от 0 до 9.Каждый из полученных таким образом классов снова разбивается в свою очередь на десять подклассов и т. д. В результате некоторому классу приписывается цифровой код, который рассматривается и как имя соответствующего таксона документов, и как архетип класса, состоящий лишь из одного признака. Значения признака этого архетипа определяются последней цифрой кода, а имя признака -остальными цифрами. Например, код 535.31может интерпретироваться как имя таксона ГЕОМЕТРИЧЕСКАЯ ОПТИКА или как признак со значениями «призма» - 535.315,«тонкие линзы» -535.316,«толстые линзы» - 535.317и т. д. Очевидно, что в этом случае каждый архетип (признак) подчинен лишь одному более старшему архетипу, т. е. для УДК характерны иерархичность не только таксонов, но и архетипов. При этом каждый документ принадлежит некоторой рубрике УДК, которая в дальнейшем уже не делится. Причем чем меньше таксой класса документов, тем длиннее цифровой код, являющийся архетипом класса, и, наоборот, чем больше таксой, тем меньше цифровой код архетипа, т. е. мы имеем дело как бы с обратной иерархией архетипов.

Отметим, что иерархия признаков десятичной классификации обычно находит свое реальное отражение в классификаторе или тезаурусе информационной системы в виде иерархии соответствующих статей.