- •Обобщенная структура системы передачи информации.
- •Информация. Формы адекватности информации: синтаксическая, семантическая, прагматическая.
- •Показатели качества информации: репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.
- •Системы классификации информации: иерархическая, фасетная, дескрипторная.
- •Понятие о кодировании. Характеристики кодирования. Классификационное и регистрационное кодирование.
- •Данные и знания. Экстенсионал и интенсионал понятия.
- •Сообщения, коды, шифры, знаки, символы.
- •Коды постоянной и переменной длины. Префиксные коды.
Системы классификации информации: иерархическая, фасетная, дескрипторная.
Классификация – это процесс соотнесения тех или иных объектов по классам в соответствии с определенными признаками, которые и позволяют определить сходство или различие объектов. Таким объектом может служить документ, файл, видеосессия, голосовой поток, запись в базе данных и даже абзац текста на Web-странице.
Иерархическая. Исходное множество элементов нулевого уровня делится в зависимости от выбранного признака информации на классы. Иерархический метод устанавливает отношение подчинения между различными группировками информации. Последовательно детализируются качественные свойства объектов множеств: класс, подкласс, группа, подгруппа, вид и т.д. Ступень классификации ─ этап классификации, результатом которого является совокупность классификационных группировок. Основные достоинства иерархической системы классификации:
традиционность и естественность;
большая информационная емкость.
Недостатками иерархической системы классификации являются:
Невозможность внесения изменений в классификатор (добавление или удаление классификационных признаков, изменение последовательности их применения) после его создания.
Трудоемкий поиск информации по произвольному сочетанию признаков классификации
Фасетная. Признаки классификации (фасеты) выбираются независимо друг от друга, а каждый фасет содержит совокупность однородных значений данного классификационного признака. Например, для фасета «конфиденциальность» значения могут быть «секретно», «публично», «конфиденциально». Именно эта система обычно применяется при классификации информации. К ее достоинствам можно отнести возможность использования большого числа классификационных признаков и возможность простой модификации системы. Фасетная система позволяет при группировке объектов выбирать классификационные признаки независимо друг от друга, что придает ей большую гибкость. К преимуществам фасетной системы относится практически не ограниченное добавление числа фасетов, расширения состава значения в отдельных фасетах, группировки множества по любому сочетанию и числу фасетов.
Дескрипторная. В данной схеме выбираются ключевые слова (дескрипторы), описывающие определенную предметную область, на основании которых создается классификатор информации, эффективно используемый при поиске. Дескрипторная классификация предполагает использования специального дескрипторного языка. Для кодирования показателей и документов по набору содержательных признаков используется информационный язык дескрипторного типа, который характеризуется совокупностью терминов, дескрипторов или лексикой и набором отношений между терминами.
Понятие о кодировании. Характеристики кодирования. Классификационное и регистрационное кодирование.
Комбинирование символов используемого алфавита для построения элементов сообщения по определенным правилам называется кодированием.
Различают обратимое и необратимое кодирование.
Обратимое кодирование это кодирование, для которого существует способ кодирования обратного, приводящего перекодированную информацию к точному исходному виду. Обратное кодирование обычно называется декодированием.
Избыточным называется обратимое кодирование, если обратное перекодирование возможно по части кодированной информации. Иногда избыточность является побочным эффектом кодирования и от него стараются избавиться, но есть виды, избыточность которых играет основную роль.
Классификационное кодирование применяется после проведения классификации объектов.
Различают последовательное и параллельное кодирование.
Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфику выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.
Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.
Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочивания объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов не велико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.
