Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
50
Добавлен:
03.03.2015
Размер:
460.29 Кб
Скачать

Лекция 11. Кодирование информации. Базы данных словарей информации.

Под кодированием понимается процесс присвоения символьных обозначений некоторым объектам. Его цель – представление информации в более компактной форме для обработки в вычислительных системах. Наибольшее распространение получили цифровые коды, то есть такие коды, для построения которых в качестве знаков алфавита используется набор цифр. При этом коды остаются символьными переменными. Текстовые обозначения призначных частей показателей дополняются или заменяются соответствующими им цифровыми кодами. Процесс обработки классифицированной и закодированной информации становится менее трудоемким, так как цифровые коды в несколько раз короче соответствующих текстов. Экономия труда при обработке информации обратно пропорциональна длине кодов. Кодирование позволяет идентифицировать явление или объект, а также упростить составление программ, реализующих алгоритмы вычисления показателей.

Известные в настоящее время методы кодирования информации можно свести к следующим основным видам: порядковый, серийно-порядковый, позиционный комбинированный. Каждый из них обладает рядом преимуществ и может быть успешно применен в зависимости от конкретных обстоятельств и целей.

Порядковый метод кодированиянаиболее простой. Суть его заключается в том, что позиции кодируемой номенклатуры обозначаются порядковыми номерами. Расположение позиций номенклатуры для их кодирования может проводиться в любом порядке: хронологическом, алфавитном, случайном и др. Ниже приведен пример построения порядкового кода вида бетона, применяемого при изготовлении железобетонных конструкций:

Код Признак

1 Тяжелый цементный бетон

2 Легкий цементный бетон

3 Ячеистый цементный бетона

4 Тяжелый силикатный бетон

5 Легкий силикатный бетон

  1. Ячеистый силикатный бетон

  2. Бетон из гипсоцемента

Для удобства обработки информации используется равномерная длина кодов для всей номенклатуры объектов кодирования. Зависимость между длиной кодового обозначения и числом объектов номенклатуры, которое может быть закодировано с его помощью, выражается формулой гдеN – число объектов в номенклатуре кодируемого множества, a - число символов, составляющих алфавит кода (например, для цифрового кода в десятичной системе счисления оно будет равняться десяти), l - число разрядов кода (длина кодового обозначения).

Этот метод кодирования обладает рядом достоинств. Он обеспечивает минимальную длину кода, позволяет легко вносить изменения в кодификатор: каждому вновь появляющемуся объекту присваивается очередной свободный порядковый номер. Долговечность порядкового кода практически может быть достигнута за счет незначительной избыточности, так как добавление только одного разряда увеличивает емкость кода в a раз.

Недостатком порядкового метода кодирования является то, что код дает представление лишь о порядке расположения позиций номенклатуры, но не несет в своей структуре какой-либо информации о свойствах или классификационных отношениях объектов. Поэтому порядковые коды в наибольшей степени обеспечивают лишь идентификацию объекта.

Серийно-порядковый методотличается от порядкового тем, что номенклатура кодируемых объектов предварительно разбивается на подмножества, которые состоят из элементов, обладающих общим свойством. Элементы каждого подмножества кодируются порядковыми номерами в пределах отведенной для него серии номеров. В каждой серии обычно предусматриваются резервные номера (на случай появления новых позиций), которые могут располагаться в любом месте серии.

В качестве примера можно привести кодирование стеновых железобетонных панелей и блоков по их назначению:

Код Назначение панелей и блоков

От 0001 до 7999 Обычные

От 8000 до 8999 Электротехнические

От 9000 до 9599 Вентиляционные

От 9600 до 9799 Санитарно-технические

От 9800 до 9999 Отопительные

Позиционный метод кодированияосновывается на разделении кодируемой номенклатуры объектов на ряд классификационных группировок. Структура позиционного кода выражает принятую систему классификации объектов. В качестве признаков группировок выбираются такие свойства объектов, которые отвечают требованиям задач, решаемых с помощью классификаторов. Для выражения каждого признака объекта выделяется группа (позиция) из одного или нескольких разрядов кода. Таким образом, код объекта, построенный с использованием позиционного метода, состоит из нескольких позиций, отражающих классификационные признаки. Значение признака объекта определяется не только конкретным числом (группой чисел), но и той позицией числа (группы чисел) в структуре кода, которая отведена для выражения данного признака. Внутри группировки объекту присваивается порядковый номер.

На практике при построении цифровых кодов каждую классификационную группировку стараются сформировать таким образом, чтобы она состояла из числа группировок нижестоящего уровня, кратного десяти, поэтому коды, построенные таким образом, называют позиционными десятичными.

Различают две разновидности позиционного метода кодирования: последовательное и параллельное кодирование свойств объектов.

При последовательном кодировании значение характеристики объекта, выраженного каким-либо числом на определенной позиции, зависит от конкретного значения предыдущих разрядов кодовой комбинации (за исключением разрядов старшей группировки).

Примером построения такого кода может служить кодирование первых двух позиций рассмотренного выше классификатора конструкций и деталей сборного железобетона. Первая позиция кода характеризует назначение детали, а вторая позиция – ее характерный признак (Х+Х – двухпозиционный код). Например:

10 – Конструкции и детали фундаментов

11 – Блоки фундаментов

12 – Фундаменты стаканного типа и башмаки

13 – Плиты фундаментов

14 – Детали ростверков

15 – Резерв

16 – Резерв

17 – Сваи

20 – Конструкции и детали каркасов зданий и сооружений

21 – Колонны

22 – Балки стропильные и подстропильные

23 – Балки подкрановые

24 – Балки обвязочные

25 – Ригели и прогоны

26 – Фермы

27 – Элементы рам

28 – Перемычки

29 – Распорки

30 – Конструкции и детали стен и перегородок

31 – Панели стеновые наружные

32 – Панели стеновые внутренние

33 – Перегородки

34 – Резерв

35 – Блоки стеновые

и т.д.

Эта разновидность позиционного метода кодирования имеет широкое распространение. К его достоинствам относится то, что форма кода отражает логику классификатора и наглядно и

Рис. Граф классификационного множества.

наглядно выражает свойства кодируемого объекта. Кроме того, этот код позволяет при вычислениях легко получать итоги по группировкам, осуществлять поиск данных и выполнять логические операции. Вместе с тем последовательное кодирование имеет ряд серьезных недостатков. Появление новых объектов может привести к переполнению отдельных классификационных группировок и незначительному заполнению других, что видно в примере, приведенном выше. Конструктивных форм элементов фундаментов всего пять, а форм элементов деталей каркасов зданий – девять. Изменение отдельных группировок, их исключение или введение новых может потребовать перекодирование части объектов. Для удлинения продолжительности существования кодов предусматривается значительное количество резервных позиций путем увеличения длины кодового обозначения.

При параллельном кодировании значение характеристики объекта, выраженного каким-либо числом на определенной позиции, не зависит от конкретного значения предыдущей позиции и не зависит от конкретного значения предыдущих разрядов кодовой комбинации. В структуре такого кода находит свое отражение фасетная классификация. Для обозначения каждой фасеты отводится определенный разряд или группа разрядов, в пределах которой каждому свойству объекта присваивается символьный идентификатор.

Примером параллельного кодирования служит добавление к фасете конструктивных форм железобетонных конструкций фасет признака вида армирования и вида применяемого бетона (ХХ+Х+Х – четырехпозиционный код). Пример обозначения конструкции будет выглядеть следующим:

3000 – Конструкции и детали стен и перегородок

3200 – Панель стеновая внутренняя

3220 – Панель стеновая внутренняя с обычным армированием

3221 – Панель стеновая внутренняя с обычным армированием из тяжелого цементного бетона

Важным достоинством рассматриваемого метода построения кода является гибкость структуры кода, что позволяет относительно просто наращивать количество аспектов классификации и добавлять при необходимости отдельные офсеты.

Комбинированные методы кодирования представляют собой синтез вышеописанных методов. При этом достигается объединение положительных качеств отдельных методов построения кодов. Комбинированный код может быть построен таким образом, что некоторые свойства объекта кодируются порядковым или серийно-порядковым методом, а остальные – позиционным.

Интерес представляет одна из разновидностей этого метода, носящая название «метода ранжирования». Иерархическую классификацию можно представить в виде графа типа «дерево». Корнем дерева будет понятие высшей группировки, висящими вершинами – элементы классификационного множества, а вершинами, находящимися между ними, – группировки, образованные по определенным признакам из элементов множества. Уровень расположения вершин дерева относительно его корня называется рангом вершины. Ранг вершины соответствует ее порядковому номеру на пути от корня дерева до данной вершины. Ранг корневой вершины принимается равным нулю.

Рис. Граф классификационного множества материалов,

используемых для изготовления железобетонных изделий.

Код объекта, построенный рассмотренным методом, состоит из двух частей: в первой (старший разряд) ставится обозначение ранга позиции, во второй – порядковый номер расположения объекта, который состоит из порождающего порядкового номера вышестоящего ранга и порядкового номера рассматриваемого уровня. Для удобства пользования кодом можно задаться постоянным числом разрядов кода. В этом случае для промежуточных рангов порядковый номер справа дополняется нулями. Примером такого кода может быть код материалов, используемых для изготовления железобетонных изделий (рис. и табл.).

Код, построенный с помощью этого метода, хорошо отражает иерархию кодируемых позиций и позволяет при помощи несложных алгоритмов реализовывать на ЭВМ операции агрегирования (получения итогов различной степеней, вычисление средних величин и т.д.). Однако при большой номенклатуре трудно наглядно представить подчиненность позиций, так как для этого требуется просматривать большие фрагменты номенклатуры кодируемых объектов.

При разработке информационного обеспечения автоматизированной системы проектирования и управления в строительстве используются коды объектов строительства, строительных материалов и конструкций, строительных работ, строительных организаций и их заказчиков, технико-экономических показателей и единиц измерения.

Таблица.

Схема построения кода методом ранжирования

Наименование

Код

Ранг позиции

Порядковый номер

Железобетонное изделие

0

000

Составные элементы бетонной смеси и арматуры

1

000

Вяжущие вещества

1

100

Наполнители

1

200

Вода

1

300

Арматура

1

400

Материалы

2

000

Цемент

2

110

Известь

2

120

Асфальт

2

130

Песок

2

210

Гравий

2

220

Щебень

2

230

Стержни

2

410

Канаты

2

420

Проволока

2

430

Сетка

2

440

Каркас

2

450

Марки и величины материалов

3

000

Марки цемента (5 марок)

3

111 – 115

Сорт извести (3 сорта)

3

121 – 123

Диапазоны величины зерна песка (5 диапазонов)

3

211 – 215

Диапазоны величины зерна гравия (4 диапазона)

3

221 – 224

Диапазоны величины кусков щебня (5 диапазонов)

3

231 – 235

Диаметры стержней (9 диаметров)

3

411 – 419

Классы диаметров канатов (7 классов)

3

421 – 427

Диаметры проволоки (3 диаметра)

3

431 – 433

Объемные схемы металлических конструкций (9)

3

441 – 449

Соседние файлы в папке KONSP-OTZ