Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теоретический материал.doc
Скачиваний:
8
Добавлен:
17.04.2019
Размер:
865.28 Кб
Скачать
      1. Кодирование информации

Система кодирования – совокупность правил кодового обозначения объектов.

Система кодирования применяется для замены названия объекта на его условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации. Код строится на базе алфавита, состоящего из букв, цифр и других символов. Он характеризуется:

  • длиной, т. е. количеством символов;

  • структурой, т. е порядком расположения символов, используемых для обозна­чения классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис. 1.9), ко­торые образуют:

  • классификационную систему кодирования, ориентированную на про­ведение предварительной классификации объектов на основе иерархической или фасетной системы;

  • регистрационную систему кодирования, не всегда требующую предваритель­ной классификации объектов.

Рис. 1.9. Система кодирования, использующая разные методы

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классифи­кационной структуры. Его суть заключается в следующем: сначала записывается код группировки 1-го уровня, затем – код группировки 2-го уровня и т. д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же дос­тоинствами и недостатками, что и иерархическая система классификации.

Пример 1.12. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 1.6). Прежде чем начать кодирование, необхо­димо определиться с алфавитом. Для большей наглядности выберем десятичную систему счисления. В этом случае длина каждой кодовой комбинации будет определяться глубиной классификации, т. е. равна 4. Кодирование группировки на каждом уровне иерархии можно выполнять путем последовательной нумерации слева направо. В общем виде код запишется как ХХХХ, где X – значение десятичного разряда. Структура кода представлена на рис. 1.10.

Рис. 1.10. Пример последовательного кодирования информации

Принятая система кодирования позволяет легко расшифровать любой код, например:

1310 – студенты коммерческого факультета, в возрасте старше 30 лет, мужчины;

2221 – студенты факультета информационных систем, в возрасте от 20 до 30 лет, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Оно заключается в следующем: все фасеты кодируются независимо друг от друга и для значений каждого фасета выделяется определенное количество разрядов кода. Парал­лельная система кодирования обладает теми же достоинствами и недостатками, что и фа­сетная система классификации.

Пример 1.13. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 1.8). В качестве алфавита также выберем десятичную систему счисления. Тогда длина любой кодовой комбинации будет определяться количеством фасетов, т. е. равна 4. В отличие от последовательного кодирования для иерархической системы классификации в данном случае не имеет значения порядок кодирования фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Структура кода представлена на рис. 1.11.

Пол

Дети

Возраст

Факультет

Код

Значение

Код

Значение

Код

Значение

Код

Значение

1

М

1

Есть

1

Моложе 20 лет

1

Коммерческий

2

Ж

2

Нет

2

От 20 до30 лет

2

Информационные системы

0

Для мужчин

3

Старше 30 лет

Рис. 1.11. Пример параллельного кодирования информации

Принятая система кодирования позволяет легко расшифровать любой код, например:

2132 – женщины в возрасте старше 30 лет, имеющие детей и являющиеся студен­тами факультета информационных систем;

1021 – мужчины в возрасте от 20 до 30 лет, являющиеся студентами коммерческого факультета.

Регистрационное кодирование используется для однозначной идентификации объектов и не всегда требует предварительной классификации. Различают порядковую и серий­но-порядковую системы регистрационного кодирования.

Порядковая система кодирования предполагает последовательную нумерацию объектов натуральными числами. При этом порядок следования может быть случайным или опреде­ляться после предварительной сортировки объектов (например, по алфавиту). Этот метод применяется в случае, если количество объектов невелико (например, при кодировании названий факультетов университета или студентов в учебной группе).

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии прово­дится порядковая нумерация объектов. При этом каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является комбинированной – классифици­рующей и идентифицирующей. Она применяется в случае, если количество серий невелико.

Пример 1.14. Все студенты одного факультета разбиваются на учебные группы (серии), для которых используется порядковая нумерация. Внутри каждой группы проводится сортировка фамилий студентов по алфавиту и каждому студенту присваивается порядковый номер.