
- •Гинзбург в.М.
- •Лекция 11. Кодирование информации. Базы данных словарей информации.
- •1 Тяжелый цементный бетон
- •Лекция №12. Общероссийские системы кодирования информации
- •Еще один пример общероссийского классификатора – Общероссийский классификатор основных фондов (окоф). Окоф обеспечивает информационную поддержку решения следующих задач:
- •Х0 0000000 – раздел
- •Функционально-видовая классификация и структура основных фондов
- •Выборка из классификатора
- •2. Национальные единицы измерения, включенные в ескк
- •Лекция №13.
- •Системное и локальное кодирование информации
- •Классификация строительных работ возведения зданий и сооружений.
- •Примером системной классификации может служитьКлассификация строительных работ возведения зданий и сооружений.
- •Локальный классификатор и система кодирования каменных работ
- •Индексация строительных машин
- •Базы данных словарной информации
Лекция 11. Кодирование информации. Базы данных словарей информации.
Под кодированием понимается процесс присвоения символьных обозначений некоторым объектам. Его цель – представление информации в более компактной форме для обработки в вычислительных системах. Наибольшее распространение получили цифровые коды, то есть такие коды, для построения которых в качестве знаков алфавита используется набор цифр. При этом коды остаются символьными переменными. Текстовые обозначения призначных частей показателей дополняются или заменяются соответствующими им цифровыми кодами. Процесс обработки классифицированной и закодированной информации становится менее трудоемким, так как цифровые коды в несколько раз короче соответствующих текстов. Экономия труда при обработке информации обратно пропорциональна длине кодов. Кодирование позволяет идентифицировать явление или объект, а также упростить составление программ, реализующих алгоритмы вычисления показателей.
Известные в настоящее время методы кодирования информации можно свести к следующим основным видам: порядковый, серийно-порядковый, позиционный комбинированный. Каждый из них обладает рядом преимуществ и может быть успешно применен в зависимости от конкретных обстоятельств и целей.
Порядковый метод кодированиянаиболее простой. Суть его заключается в том, что позиции кодируемой номенклатуры обозначаются порядковыми номерами. Расположение позиций номенклатуры для их кодирования может проводиться в любом порядке: хронологическом, алфавитном, случайном и др. Ниже приведен пример построения порядкового кода вида бетона, применяемого при изготовлении железобетонных конструкций:
Код Признак
1 Тяжелый цементный бетон
2 Легкий цементный бетон
3 Ячеистый цементный бетона
4 Тяжелый силикатный бетон
5 Легкий силикатный бетон
Ячеистый силикатный бетон
Бетон из гипсоцемента
Для
удобства обработки информации используется
равномерная длина кодов для всей
номенклатуры объектов кодирования.
Зависимость между длиной кодового
обозначения и числом объектов номенклатуры,
которое может быть закодировано с его
помощью, выражается формулой
гдеN
– число
объектов в номенклатуре кодируемого
множества, a
- число
символов, составляющих алфавит кода
(например, для цифрового кода в десятичной
системе счисления оно будет равняться
десяти), l
- число
разрядов кода (длина кодового обозначения).
Этот метод кодирования обладает рядом достоинств. Он обеспечивает минимальную длину кода, позволяет легко вносить изменения в кодификатор: каждому вновь появляющемуся объекту присваивается очередной свободный порядковый номер. Долговечность порядкового кода практически может быть достигнута за счет незначительной избыточности, так как добавление только одного разряда увеличивает емкость кода в a раз.
Недостатком порядкового метода кодирования является то, что код дает представление лишь о порядке расположения позиций номенклатуры, но не несет в своей структуре какой-либо информации о свойствах или классификационных отношениях объектов. Поэтому порядковые коды в наибольшей степени обеспечивают лишь идентификацию объекта.
Серийно-порядковый методотличается от порядкового тем, что номенклатура кодируемых объектов предварительно разбивается на подмножества, которые состоят из элементов, обладающих общим свойством. Элементы каждого подмножества кодируются порядковыми номерами в пределах отведенной для него серии номеров. В каждой серии обычно предусматриваются резервные номера (на случай появления новых позиций), которые могут располагаться в любом месте серии.
В качестве примера можно привести кодирование стеновых железобетонных панелей и блоков по их назначению:
Код Назначение панелей и блоков
От 0001 до 7999 Обычные
От 8000 до 8999 Электротехнические
От 9000 до 9599 Вентиляционные
От 9600 до 9799 Санитарно-технические
От 9800 до 9999 Отопительные
Позиционный метод кодированияосновывается на разделении кодируемой номенклатуры объектов на ряд классификационных группировок. Структура позиционного кода выражает принятую систему классификации объектов. В качестве признаков группировок выбираются такие свойства объектов, которые отвечают требованиям задач, решаемых с помощью классификаторов. Для выражения каждого признака объекта выделяется группа (позиция) из одного или нескольких разрядов кода. Таким образом, код объекта, построенный с использованием позиционного метода, состоит из нескольких позиций, отражающих классификационные признаки. Значение признака объекта определяется не только конкретным числом (группой чисел), но и той позицией числа (группы чисел) в структуре кода, которая отведена для выражения данного признака. Внутри группировки объекту присваивается порядковый номер.
На практике при построении цифровых кодов каждую классификационную группировку стараются сформировать таким образом, чтобы она состояла из числа группировок нижестоящего уровня, кратного десяти, поэтому коды, построенные таким образом, называют позиционными десятичными.
Различают две разновидности позиционного метода кодирования: последовательное и параллельное кодирование свойств объектов.
При последовательном кодировании значение характеристики объекта, выраженного каким-либо числом на определенной позиции, зависит от конкретного значения предыдущих разрядов кодовой комбинации (за исключением разрядов старшей группировки).
Примером построения такого кода может служить кодирование первых двух позиций рассмотренного выше классификатора конструкций и деталей сборного железобетона. Первая позиция кода характеризует назначение детали, а вторая позиция – ее характерный признак (Х+Х – двухпозиционный код). Например:
10 – Конструкции и детали фундаментов
11 – Блоки фундаментов
12 – Фундаменты стаканного типа и башмаки
13 – Плиты фундаментов
14 – Детали ростверков
15 – Резерв
16 – Резерв
17 – Сваи
20 – Конструкции и детали каркасов зданий и сооружений
21 – Колонны
22 – Балки стропильные и подстропильные
23 – Балки подкрановые
24 – Балки обвязочные
25 – Ригели и прогоны
26 – Фермы
27 – Элементы рам
28 – Перемычки
29 – Распорки
30 – Конструкции и детали стен и перегородок
31 – Панели стеновые наружные
32 – Панели стеновые внутренние
33 – Перегородки
34 – Резерв
35 – Блоки стеновые
и т.д.
Эта
разновидность позиционного метода
кодирования имеет широкое распространение.
К его достоинствам относится то, что
форма кода отражает логику классификатора
и наглядно и
Рис. Граф классификационного множества.
наглядно выражает свойства кодируемого объекта. Кроме того, этот код позволяет при вычислениях легко получать итоги по группировкам, осуществлять поиск данных и выполнять логические операции. Вместе с тем последовательное кодирование имеет ряд серьезных недостатков. Появление новых объектов может привести к переполнению отдельных классификационных группировок и незначительному заполнению других, что видно в примере, приведенном выше. Конструктивных форм элементов фундаментов всего пять, а форм элементов деталей каркасов зданий – девять. Изменение отдельных группировок, их исключение или введение новых может потребовать перекодирование части объектов. Для удлинения продолжительности существования кодов предусматривается значительное количество резервных позиций путем увеличения длины кодового обозначения.
При параллельном кодировании значение характеристики объекта, выраженного каким-либо числом на определенной позиции, не зависит от конкретного значения предыдущей позиции и не зависит от конкретного значения предыдущих разрядов кодовой комбинации. В структуре такого кода находит свое отражение фасетная классификация. Для обозначения каждой фасеты отводится определенный разряд или группа разрядов, в пределах которой каждому свойству объекта присваивается символьный идентификатор.
Примером параллельного кодирования служит добавление к фасете конструктивных форм железобетонных конструкций фасет признака вида армирования и вида применяемого бетона (ХХ+Х+Х – четырехпозиционный код). Пример обозначения конструкции будет выглядеть следующим:
3000 – Конструкции и детали стен и перегородок
3200 – Панель стеновая внутренняя
3220 – Панель стеновая внутренняя с обычным армированием
3221 – Панель стеновая внутренняя с обычным армированием из тяжелого цементного бетона
Важным достоинством рассматриваемого метода построения кода является гибкость структуры кода, что позволяет относительно просто наращивать количество аспектов классификации и добавлять при необходимости отдельные офсеты.
Комбинированные методы кодирования представляют собой синтез вышеописанных методов. При этом достигается объединение положительных качеств отдельных методов построения кодов. Комбинированный код может быть построен таким образом, что некоторые свойства объекта кодируются порядковым или серийно-порядковым методом, а остальные – позиционным.
Интерес представляет одна из разновидностей этого метода, носящая название «метода ранжирования». Иерархическую классификацию можно представить в виде графа типа «дерево». Корнем дерева будет понятие высшей группировки, висящими вершинами – элементы классификационного множества, а вершинами, находящимися между ними, – группировки, образованные по определенным признакам из элементов множества. Уровень расположения вершин дерева относительно его корня называется рангом вершины. Ранг вершины соответствует ее порядковому номеру на пути от корня дерева до данной вершины. Ранг корневой вершины принимается равным нулю.
Рис.
Граф классификационного множества
материалов,
используемых для изготовления железобетонных изделий.
Код объекта, построенный рассмотренным методом, состоит из двух частей: в первой (старший разряд) ставится обозначение ранга позиции, во второй – порядковый номер расположения объекта, который состоит из порождающего порядкового номера вышестоящего ранга и порядкового номера рассматриваемого уровня. Для удобства пользования кодом можно задаться постоянным числом разрядов кода. В этом случае для промежуточных рангов порядковый номер справа дополняется нулями. Примером такого кода может быть код материалов, используемых для изготовления железобетонных изделий (рис. и табл.).
Код, построенный с помощью этого метода, хорошо отражает иерархию кодируемых позиций и позволяет при помощи несложных алгоритмов реализовывать на ЭВМ операции агрегирования (получения итогов различной степеней, вычисление средних величин и т.д.). Однако при большой номенклатуре трудно наглядно представить подчиненность позиций, так как для этого требуется просматривать большие фрагменты номенклатуры кодируемых объектов.
При разработке информационного обеспечения автоматизированной системы проектирования и управления в строительстве используются коды объектов строительства, строительных материалов и конструкций, строительных работ, строительных организаций и их заказчиков, технико-экономических показателей и единиц измерения.
Таблица.
Схема построения кода методом ранжирования
Наименование |
Код | |
Ранг позиции |
Порядковый номер | |
Железобетонное изделие |
0 |
000 |
Составные элементы бетонной смеси и арматуры |
1 |
000 |
Вяжущие вещества |
1 |
100 |
Наполнители |
1 |
200 |
Вода |
1 |
300 |
Арматура |
1 |
400 |
Материалы |
2 |
000 |
Цемент |
2 |
110 |
Известь |
2 |
120 |
Асфальт |
2 |
130 |
Песок |
2 |
210 |
Гравий |
2 |
220 |
Щебень |
2 |
230 |
Стержни |
2 |
410 |
Канаты |
2 |
420 |
Проволока |
2 |
430 |
Сетка |
2 |
440 |
Каркас |
2 |
450 |
Марки и величины материалов |
3 |
000 |
Марки цемента (5 марок) |
3 |
111 – 115 |
Сорт извести (3 сорта) |
3 |
121 – 123 |
Диапазоны величины зерна песка (5 диапазонов) |
3 |
211 – 215 |
Диапазоны величины зерна гравия (4 диапазона) |
3 |
221 – 224 |
Диапазоны величины кусков щебня (5 диапазонов) |
3 |
231 – 235 |
Диаметры стержней (9 диаметров) |
3 |
411 – 419 |
Классы диаметров канатов (7 классов) |
3 |
421 – 427 |
Диаметры проволоки (3 диаметра) |
3 |
431 – 433 |
Объемные схемы металлических конструкций (9) |
3 |
441 – 449 |