Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Аттестация - октябрь-2012 - ответы.doc
Скачиваний:
90
Добавлен:
19.11.2019
Размер:
99.84 Кб
Скачать
  1. Системы классификации информации: иерархическая, фасетная, дескрипторная.

Классификация – это процесс соотнесения тех или иных объектов по классам в соответствии с определенными признаками, которые и позволяют определить сходство или различие объектов. Таким объектом может служить документ, файл, видеосессия, голосовой поток, запись в базе данных и даже абзац текста на Web-странице.

  • Иерархическая. Исходное множество элементов нулевого уровня делится в зависимости от выбранного признака информации на классы. Иерархический метод устанавливает отношение подчинения между различными группировками информации. Последовательно детализируются качественные свойства объектов множеств: класс, подкласс, группа, подгруппа, вид и т.д. Ступень классификации ─ этап классификации, результатом которого является совокупность классификационных группировок. Основные достоинства иерархической системы классификации:

традиционность и естественность;

большая информационная емкость.

Недостатками иерархической системы классификации являются:

Невозможность внесения изменений в классификатор (добавление или удаление классификационных признаков, изменение последовательности их применения) после его создания.

Трудоемкий поиск информации по произвольному сочетанию признаков классификации

  • Фасетная. Признаки классификации (фасеты) выбираются независимо друг от друга, а каждый фасет содержит совокупность однородных значений данного классификационного признака. Например, для фасета «конфиденциальность» значения могут быть «секретно», «публично», «конфиденциально». Именно эта система обычно применяется при классификации информации. К ее достоинствам можно отнести возможность использования большого числа классификационных признаков и возможность простой модификации системы. Фасетная система позволяет при группировке объектов выбирать классификационные признаки независимо друг от друга, что придает ей большую гибкость. К преимуществам фасетной системы относится практически не ограниченное добавление числа фасетов, расширения состава значения в отдельных фасетах, группировки множества по любому сочетанию и числу фасетов.

  • Дескрипторная. В данной схеме выбираются ключевые слова (дескрипторы), описывающие определенную предметную область, на основании которых создается классификатор информации, эффективно используемый при поиске. Дескрипторная классификация предполагает использования специального дескрипторного языка. Для кодирования показателей и документов по набору содержательных признаков используется информационный язык дескрипторного типа, который характеризуется совокупностью терминов, дескрипторов или лексикой и набором отношений между терминами.

  1. Понятие о кодировании. Характеристики кодирования. Классификационное и регистрационное кодирование.

 Комбинирование символов используемого алфавита для построения элементов сообщения по определенным правилам называется кодированием.

Различают обратимое и необратимое кодирование.

Обратимое кодирование это кодирование, для которого существует способ кодирования обратного, приводящего перекодированную информацию к точному исходному виду. Обратное кодирование обычно называется декодированием.

Избыточным называется обратимое кодирование, если обратное перекодирование возможно по части кодированной информации. Иногда избыточность является побочным эффектом кодирования и от него стараются избавиться, но есть виды, избыточность которых играет основную роль.

Классификационное кодирование применяется после проведения классификации объектов.

Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфику выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочивания объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов не велико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.