- •Информация и данные
- •Формы адекватности информации
- •Семантическая мера информации
- •Качество информации
- •2.2. Классификация и кодирование информации
- •Иерархическая система классификации
- •Фасетная система классификации
- •Дескрипторная система классификации
- •Классификационное кодирование
- •Регистрационное кодирование
- •Классификация информации по разным признакам
- •Ключевые понятия
- •Вопросы для самопроверки
Дескрипторная система классификации
Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.
Суть дескрипторного метода классификации заключается в следующем:
-
отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;
-
выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;
-
создается словарь дескрипторов, т. е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.
Пример 2.13. В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся; преподаватель, учитель, педагог; факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.
Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:
-
синонимические, указывающие некоторую совокупность ключевых слов как си нонимы;
-
родо-видовые, отражающие включение некоторого класса объектов в более пред ставительный класс;
-
ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.
-
Пример 2.14. Синонимическая связь: студент — учащийся — обучаемый.
Родо-видовая связь: университет — факультет — кафедра. Ассоциативная связь: студент — экзамен — профессор — аудитория.
СИСТЕМА КОДИРОВАНИЯ
Общие понятия
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Система кодирования — совокупность правил кодового обозначения объектов.
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
-
длиной — число позиций в коде;
-
структурой — порядок расположения в коде символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:
-
классификационную систему кодирования, ориентированную на про ведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
-
регистрационную систему кодирования, не требующую предварительной классификации объектов.
Рассмотрим представленную на рис. 2.7 систему кодирования.
Рис. 2.7. Система кодирования, использующая разные методы