
- •Основы информатики после изучения главы вы должны знать:
- •Переход к информационному обществу
- •Информационная культура
- •Информационные ресурсы
- •Информационные продукты и услуги
- •Информатика, ее цель и задачи
- •Структура информатики
- •Измерение и представление информации
- •Измерение информации
- •Свойства информации
- •Классификация информации
- •Кодирование информации
- •Ключевые понятия
- •Вопросы для самопроверки
- •Информационные системы и технологии после изучения главы вы должны знать:
- •Информационные системы
- •Процессы в информационной системе
- •Структура информационной системы
- •Классификация информационных систем
- •Информационные технологии
- •Инструментарий информационной технологии
- •Соотношение информационной технологии и информационной системы
- •Составляющие информационной технологии
- •Этапы развития информационных технологий
- •Виды информационных технологий
- •Ключевые понятия
- •Вопросы для самопроверки
Кодирование информации
Система кодирования – совокупность правил кодового обозначения объектов.
Система кодирования применяется для замены названия объекта на его условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации. Код строится на базе алфавита, состоящего из букв, цифр и других символов. Он характеризуется:
длиной, т. е. количеством символов;
структурой, т. е порядком расположения символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис. 1.9), которые образуют:
классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов на основе иерархической или фасетной системы;
регистрационную систему кодирования, не всегда требующую предварительной классификации объектов.
Рис. 1.9. Система кодирования, использующая разные методы
Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.
Последовательное кодирование используется для иерархической классификационной структуры. Его суть заключается в следующем: сначала записывается код группировки 1-го уровня, затем – код группировки 2-го уровня и т. д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.
Пример 1.12. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 1.6). Прежде чем начать кодирование, необходимо определиться с алфавитом. Для большей наглядности выберем десятичную систему счисления. В этом случае длина каждой кодовой комбинации будет определяться глубиной классификации, т. е. равна 4. Кодирование группировки на каждом уровне иерархии можно выполнять путем последовательной нумерации слева направо. В общем виде код запишется как ХХХХ, где X – значение десятичного разряда. Структура кода представлена на рис. 1.10.
Рис. 1.10. Пример последовательного кодирования информации
Принятая система кодирования позволяет легко расшифровать любой код, например:
1310 – студенты коммерческого факультета, в возрасте старше 30 лет, мужчины;
2221 – студенты факультета информационных систем, в возрасте от 20 до 30 лет, женщины, имеющие детей.
Параллельное кодирование используется для фасетной системы классификации. Оно заключается в следующем: все фасеты кодируются независимо друг от друга и для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.
Пример 1.13. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 1.8). В качестве алфавита также выберем десятичную систему счисления. Тогда длина любой кодовой комбинации будет определяться количеством фасетов, т. е. равна 4. В отличие от последовательного кодирования для иерархической системы классификации в данном случае не имеет значения порядок кодирования фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Структура кода представлена на рис. 1.11.
Пол |
Дети |
Возраст |
Факультет |
||||
Код |
Значение |
Код |
Значение |
Код |
Значение |
Код |
Значение |
1 |
М |
1 |
Есть |
1 |
Моложе 20 лет |
1 |
Коммерческий |
2 |
Ж |
2 |
Нет |
2 |
От 20 до30 лет |
2 |
Информационные системы |
|
|
0 |
Для мужчин |
3 |
Старше 30 лет |
|
|
Рис. 1.11. Пример параллельного кодирования информации
Принятая система кодирования позволяет легко расшифровать любой код, например:
2132 – женщины в возрасте старше 30 лет, имеющие детей и являющиеся студентами факультета информационных систем;
1021 – мужчины в возрасте от 20 до 30 лет, являющиеся студентами коммерческого факультета.
Регистрационное кодирование используется для однозначной идентификации объектов и не всегда требует предварительной классификации. Различают порядковую и серийно-порядковую системы регистрационного кодирования.
Порядковая система кодирования предполагает последовательную нумерацию объектов натуральными числами. При этом порядок следования может быть случайным или определяться после предварительной сортировки объектов (например, по алфавиту). Этот метод применяется в случае, если количество объектов невелико (например, при кодировании названий факультетов университета или студентов в учебной группе).
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии проводится порядковая нумерация объектов. При этом каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является комбинированной – классифицирующей и идентифицирующей. Она применяется в случае, если количество серий невелико.
Пример 1.14. Все студенты одного факультета разбиваются на учебные группы (серии), для которых используется порядковая нумерация. Внутри каждой группы проводится сортировка фамилий студентов по алфавиту и каждому студенту присваивается порядковый номер.