Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
53
Добавлен:
02.05.2014
Размер:
182.78 Кб
Скачать

Дескрипторная система классификации

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно ис­пользуется дескрипторная (описательная) система классификации, язык которой приближа­ется к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

  • отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;

  • выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;

  • создается словарь дескрипторов, т. е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Пример 2.13. В качестве объекта классификации рассматривается успеваемость сту­дентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподава­тель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, фа­культет, подразделение университета, аудитория, комната, лекция, практическое заня­тие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся; преподаватель, учитель, педагог; факуль­тет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, до­цент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

  • синонимические, указывающие некоторую совокупность ключевых слов как си­ нонимы;

  • родо-видовые, отражающие включение некоторого класса объектов в более пред­ ставительный класс;

  • ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.

Пример 2.14. Синонимическая связь: студент — учащийся — обучаемый.

Родо-видовая связь: университет — факультет — кафедра. Ассоциативная связь: студент — экзамен — профессор — аудитория.

СИСТЕМА КОДИРОВАНИЯ

Общие понятия

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования — совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код ха­рактеризуется:

  • длиной — число позиций в коде;

  • структурой — порядок расположения в коде символов, используемых для обозначе­ния классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), ко­торые образуют:

  • классификационную систему кодирования, ориентированную на про­ ведение предварительной классификации объектов либо на основе иерархической сис­темы, либо на основе фасетной системы;

  • регистрационную систему кодирования, не требующую предваритель­ной классификации объектов.

Рассмотрим представленную на рис. 2.7 систему кодирования.

Рис. 2.7. Система кодирования, использующая разные методы

Соседние файлы в папке Лекции по информатике и программированию