![](/user_photo/_userpic.png)
книги из ГПНТБ / Баясанов, Д. Б. Автоматизированные системы управления трубопроводными объектами коммунального хозяйства
.pdfсовпадающими значениями в меньшую группу стандартных терминов с более точно распространенными значениями, что уменьшит число терминов, используемых в системе; сделать стандартным описание любого предмета или сообщения; до вести до максимума возможность нахождения документа, имеющего отношение к решаемому вопросу, и до минимума— не имеющего отношения; обеспечить запрос в системе тре буемого количества материалов.
Создание информационно-поискового языка требует
предварительного изучения, выделения и классификации
круга понятий, терминов и предложений в отрасли, установ
ления связей между ними. При выборе и анализе терминов
нужно решить, на какие вопросы будет отвечать система:
специальные, общие или комплексные; каков объем и ха рактер материалов, которые предполагается охватить си стемой; какие термины могут быть использованы в качестве дескрипторов; установление связей между дескрипторами
и т. п. В этой связи можно выделить три основных типа
дескрипторных поисковых систем: 1) дескрипторная поиско
вая система, -язык и логика которой, по существу, исчерпы
ваются перечнем дескрипторов; 2) система, в которой между
дескрипторами задаются фиксированные отношения, неза
висимо от контекста документов, называемые базисными
и позволяющими в процессе поиска устанавливать смысловое
соответствие |
между запросами и документами, что являет |
||
ся |
основным |
средством сокращения потерь |
информации; |
3) |
система, характеризуемая, помимо базисных |
отношений, |
наличием текстуальных отношений между дескрипторами,
определяемыми контекстом сообщений, служащих одним из основных средств борьбы с информационными шумами.
Для снижения информационного шума при поиске сле дует стремиться к уменьшению числа общих дескрипторов. Если последние применяются для повышения поисковой эф
фективности системы, то необходимо использовать дополни
тельные средства для снижения шумов.
Между общими дескрипторами, а также между общими
и специальными устанавливаются иерархические связи. Различают системы с сильной иерархией, в которых каждый
элемент последовательности имеет единственного предшест
венника, и системы со слабой иерархией, где каждый де
скриптор может быть подчинен несколько другим, более
общим по роду дескрипторам. Несмотря на некоторое уве
личение длительности времени поиска, последние системы
более гибки, поскольку различным элементам здесь разре
1 1 0
шается иметь несколько сопредшественников. При фасет
ной — многоаспектной классификации дескриптор |
внутри |
каждого фасета (разряда) имеет сильную иерархию, |
меж |
ду фасетами — слабую.
Существуют также способы фиксирования связей между
дескрипторами при помощи алфавитного указателя-тезу-
руса, специальных таблиц дескрипторов, составленных в оп
ределенном линейном порядке, методами взаимного фикси рования и т. п. Более общим методом установления отно
шений между дескрипторами является способ взаимного
фиксирования. Метод записи дескрипторов в линейной по
следовательности имеет тот недостаток, что он позволяет
устанавливать в системе только бинарные связи, т. е. связи между определенными и примыкающими к ним дескрипто рами, а отношения более высоких порядков здесь учтены
быть не могут.
Важным вопросом при создании автоматизированных информационно-поисковых систем является выбор носителей информации, который обусловливал бы наиболее эффектив
ное функционирование системы. Выбор каждого носителя
определяется задачами и типом информационно-поисковой
системы, объемом материалов, подлежащих хранению, и т. п. При организации поисковой картотеки должны быть учтены
следующие характеристики системы: тип носителя инфор
мации и используемое оборудование; форма организации картотеки; способ доступа к картотеке, расположение вводов на карточках, порядок расстановки карточек в кар тотеке, тип вывода информации из системы; взаимораспо
ложение поискового образа и оригинала документа. В ка
честве носителей информации могут быть использованы: перфокарты с внешней и внутренней перфорацией (с краевой перфорацией), перфокарты цедевые, суперпозиционные, апертурные, кляссерные, перфорированные и магнитные ленты и другие.
Карты с краевой перфорацией изготовляют из прочной,
плотной, гладкой бумаги с одним или несколькими рядами
отверстий по краям. Для осуществления обмена информа цией при стандартных системах кодирования выпускаемые нашей промышленностью карты стандартизированы. Кодо вое поле карты типа К-5, к примеру, дает возможность
закодировать до 200 различных поисковых признаков. При
большем числе поисковых признаков осуществляется мно
гоаспектный поиск по совокупности поисковых призна ков. Большое свободное от перфорации внутреннее поле
111
карты может быть использовано для хранения визуальной
информации — текстов, чертежей и т. п.
Условия ручного использования карт, сравнительно
небольшое количество поисковых признаков, которые можно
на них закодировать, и чисто технические трудности поиска при сложных системах кодирования информации ограни
чивают сферу применения этих карт.
В связи с использованием счетно-перфорационных ма
шин для поиска и обработки информации применяют и ма
шинные перфокарты, которые по форме фиксируемой ин
формации можно разделить на карты:
1) кодированные без какой-либо визуальной инфор мации на естественном языке;
2)содержащие кодированные и визуальные части;
3)апертурные, содержащие, помимо закодированных данных, вмонтированные в них микрофильмы.
Использование для поиска информации карт второго и третьего типов может быть ограничено по чисто техни ческим причинам, и главным образом из-за срока их служ бы. При частом прогоне через аппаратуру перфокарты быст
ро выходят из строя. Замена кодированной части перфокарт
несложна, а восстановление текстовых или апертурных
перфокарт — операция более сложная и дорогая.
Суперпозиционные карты применяют при инверсном
способе организации поисковых информационных масси
вов, когда носитель информации (карта) соответствует по
исковому признаку и на нем фиксируются все адреса (но мера) документов, в которых и содержится поисковый
признак. Для организации инверсного массива нужно сфор
мировать общий для всей поисковой системы перечень поисковых признаков и для каждого признака выделить
носитель информации. При этом каждому поступающему
в поисковую систему документу присваивается адрес, по которому его можно найти в хранилище, причем этот адрес
не зависит от содержания документа. Затем документ ана
лизируют с целью определения его поискового образа. Для этого в документе отыскивают независимо друг от
друга все содержащиеся в нем поисковые признаки, входя
щие в ранее составленный перечень поисковых признаков
системы. Адрес документа записывают на карты с соответ
ствующими поисковыми признаками. Для поиска запрос анализируют так же, как и сам документ. В поисковых си
стемах можно использовать в качестве суперпозиционных — машинные перфокарты. На 80-колонной перфокарте можно
112
закодировать до 960 номеров документов. Суперпозицион-
ные перфокарты являются эффективным средством много
аспектного поиска документов. Создание поисковых массивов
на них требует тщательной подготовки списков поисковых
признаков документов в процессе формирования массива. Поиск при этом осуществляется быстро, с малой затратой труда. Система для своей реализации не требует дорогих и сложных технических средств. Одной из очень важных положительных сторон суперпозиционных карт является то, что, в противоположность картам с краевой перфора
цией и отчасти машинным картам, при их использовании
практически не ограничены ни общее число поисковых при
знаков системы, ни число поисковых признаков каждого
вводимого в систему документа. Действительно, увеличение
общего числа поисковых признаков в системе будет означать
просто увеличение числа карт в картотеке, а увеличение
числа поисковых признаков документа приведет только
к необходимости отперфорировать адрес этого документа
на большем числе карт.
В качестве носителей информации используют и микро
фильмы. Микрофильмирование является наиболее эффектив
ным средством сжатия объемов документальных хранений.
В микрофильмированных массивах возможен быстрый поиск
ивыдача копий документов. Возможны два варианта тех нического осуществления документального поискового мас
сива на микрофильмах: рулонный, карточный, когда доку менты копируются на короткие отрезки пленки или карты.
Карточное хранение имеет ряд преимуществ по сравнению
с рулонным. В этом случае можно легко упорядочить хране ние уже после подготовки микрокопий микрофильмов. Съемки при этом можно вести в любом порядке. Можно легко изъять, пополнить в любом месте, заменить документы в массиве, а в случае необходимости — реорганизовать, пе ресортировать информационный массив. Недостатком дис
кретного хранения является то, что не удается полностью
использовать площадь носителя информации-микрофильма,
так как размер микрокарты стандартный, а размеры доку ментов меняются в широких пределах, что ведет к лишнему
расходу кинопленки.
Процесс перевода содержания документов или запросов
на язык информационно-поисковой системы складывается из анализа их содержания и самого перевода результатов
анализа на машинный язык — операция кодирования. Вы
деление из документа или запроса их содержания на естест-
113
венном языке, предназначенных для последующего поиска, осуществляется: реферированием — концентрированным
изложением на обычном языке основных элементов содер
жания документов; индексированием — выделением из до
кументов отдельных слов или понятий, представляющих
существенное содержание материалов; классифицирова
нием — отнесением документов к элементам классифика
ционной структуры.
Операция кодирования — перевода результатов анализа
документов на язык информационно-поисковой системы —
должна удовлетворять требованиям однозначности, крат кости, аддитивности, программируемости результатов. Ос
новными положительными признаками, определяющими
выбор способа кодирования, являются степень соответст
вия целям информационно-поисковой системы и пригод ность для экономной и эффективной работы как в процессе
самого кодирования, так и при поиске. Различают кодиро
вание: прямое, когда кодируемому поисковому признаку
соответствует элемент носителя информации; комбиниро
ванное, когда кодируемому поисковому признаку соот
ветствует комбинация элементов носителей информации; в фиксированной зоне, когда поисковому признаку отво дится на носителе информации зона, включающая строго
определенное количество элементов, что характерно для перфокарт; с наложением, когда в одной зоне кодируется несколько признаков.
В качестве символов кодирования используют цифры,
буквы, специальные символы и т. п. При выборе метода
кодирования, а следовательно, и вида оборудования сле дует учитывать природу информационных запросов и ха
рактер информационных материалов.
Любой код обычно состоит из определенного количества символов и установленных правил отношений между этими символами. В теории информации принято считать, что код является оптимальным, если он занимает 50% площади но сителя, отведенной под кодирование. Работа с кодирован ным материалом будет минимальной, если коды употреб ляются одинаково часто и равны по длине или употреб
ляются с различной частотой, но при этом длина кодового
сообщения обратно пропорциональна частоте его употреб
ления.
В зависимости от конфигурации и места расположения кодовых символов коды подразделяются на локальные, пря
мые, нелокальные и суперпозиционные. При локальном
114
коде кодовое обозначение характеристик различается рас положением полей для записи характеристики и конфигу
рации кодовых символов. Локальный код применяют в слу
чае кодирования взаимоисключающих характеристик, об
разующих отдельную группу. При этом для каждой группы
отводится свое поле перфокарты, где любая характеристика группы может быть записана в виде определенной конфигу
рации символов. Взаимоисключаемость означает, что каж дый элемент информации имеет не более одной характе
ристики из любой группы взаимоисключающих характе
ристик.
Прямой код представляет собой одну из разновидностей локального. Здесь кодовые обозначения характеристик раз личаются только расположением отводимых для них полей, в каждом из которых возможны только две конфигурации символов, отмечающих наличие или отсутствие характе ристики. Прямой код бывает выгоден, когда элементы ин
формации содержат большое число характеристик. При
этом коде каждому понятию соответствует вполне опреде
ленное отверстие на перфокарте. Иногда для каждого де
сятичного разряда порядкового номера понятия на карте
отводят 10 отверстий. Тогда для записи любого номера от
0 до 99 понадобятся только 20 отверстий. Второй способ
более трудно реализуем. Кроме этих способов составления
прямых кодов применяют код 0— 1—2—4—7 и пирамидаль
ный.
С помощью кода 0— 1—2—4— 7 можно записать проре зями любое число от 0 до 9 включительно, т. е. код позво ляет записывать в отдельности десятичный разряд номера понятия поискового образа. Для записи любой цифры от
0 до 9 надо отвести только 5 отверстий, а не 10, как в пре
дыдущем случае. В коде 0— 1—2—4—7 каждое число изо
бражается двумя прорезями на перфокарте. Этот код пред
ставляет собой частный случай пирамидального кода, с по мощью которого можно записать любые буквы и числа (рис. 22). При использовании этого кода на перфокартах печатается пирамида.
Для нелокального кода обозначения характеристик раз
личаются конфигурациями кодовых символов, помещенных
в отдельных для каждой характеристики произвольно рас
положенных полях. Нелокальный код наиболее гибкий
и компактный. При его использовании на перфокарте записываются только те характеристики, которые содер
жатся в данном элементе информации.
115
Для суперпозиционного кода обозначения характе
ристик различаются только конфигурацией кодовых сим
волов, причем разные кодовые обозначения помещены
в одном поле, как бы накладываясь друг на друга. В этом случае возможно образование ложных конфигураций кодо
вых символов. Однако он позволяет размещать в одном и
том же поле несколько характеристик, что увеличивает
Рис. 22..Примерная схема пирамидального кода
а — для букв; б — для чисел
объем информации, которую можно записывать на отдель
ную перфокарту. Однако в каждом случае необходимо ана
лизировать, насколько применение такого кода ухудшает эффективность поиска вследствие отбора лишних элемен
тов информации. Суперпозиционный код отличается от рас
смотренных тем, что в одно и то же поле записывается не одна буква, а две или три.
При выборе той или иной информационно-поисковой системы или ее разработке необходимо учитывать ее соот ветствие объему накапливаемой и выдаваемой информации и тем задачам, которые эта система должна решать. При со
здании этих систем, независимо от избранных технических
средств поиска и хранения информации,. необходимо зара
нее предусмотреть при расширении масштабов обслужива
ния возможность внесения изменения в схемы индексиро вания и хранения данных без нарушения основных прин ципов. К примеру, при переходе от перфолент через перфо карты на магнитные ленты; при переходе к центральной, координированной системе в результате развития подразде
лов системы дескрипторного индексирования.
К информационно-поисковым обслуживающим подси
стемам АСУ предъявляются следующие требования:
1) селективность в работе, т. е. способность ограничить число единиц информации, которые должны быть просмотре
ны после поиска;
116
2)способность к корреляционному анализу процесса поиска;
3)надежность в работе при соблюдении достаточной
вероятности отбора полезной информации и исключения
ложной;
4)быстродействие, т. е. обеспечение приемлемого вре мени реализации выдачи информации с момента ввода в си
стему запроса на нее;
5)стабильность форм выдаваемой информации.
Эти требования могут быть выполнены только при ма
шинной обработке информации и машинных методах ее вы
дачи по запросам. Наиболее перспективными здесь являют
ся информационно-поисковые системы с магнитными носи
телями непрерывного (магнитные ленты) и дискретного
(магнитные карты) типов. В том или другом случае носи
тели информации снабжаются магнитным покрытием, что
позволяет использовать их и в ЭЦВМ. Основными обла стями применения вычислительной техники здесь можно
считать; подготовку предметных и авторских указателей,
составление указателей ключевых слов, автоматическое реферирование материала, автоматический поиск информа ции, машинный перевод, автоматическую систематизацию
и распределение информации. Будущее ЭЦВМ в области
автоматизированных информационно-поисковых систем бу
дет, видимо, заключаться в их всемерной специализации и направленного развития в информационно-логические машины, обладающие достаточной емкостью запоминающих устройств, уменьшенным временем выборки, данных из последних, удовлетворительными и надежными вводными
и выводными устройствами, сильно развитой логикой и т. п.
Информационно-поисковая система как подсистема ин
формационного обслуживания АСУ должна обеспечивать
запросы различных служб коммунальных хозяйств данными о научно-технических достижениях и передового опыта и строиться по иерархическому принципу. Структура ин формационно-поисковой системы должна представлять со бой сеть функциональных и отраслевых центров, которые должны перерабатывать и хранить всю необходимую ин
формацию. Эти данные они будут передавать в записи на
магнитных лентах в бюро информационного обслуживания,
призванных непосредственно обеспечивать заявки потре
бителей. Рациональная сеть таких бюро должна учитывать
экономические особенности и иерархию управления объек тами коммунальных хозяйств в стране. На каждом уровне
117
системы информационно-поискового типа должны быть по
лучены ответы на запросы, входящие в их компетенцию,
а запросы, которые не могут быть удовлетворены нижним
уровнем, пропускать на следующий, более высокий уровень. Подразделения этой системы должны быть оснащены сов
местимыми вычислительными машинами со специализи
рованными периферийными элементами и оборудованием,
которые будут работать в режиме разделения времени. Это обеспечит высокую эффективность применения средств вы
числительной техники для решения информационно-по
исковых задач.
§6. ОБЩИЕ ВОПРОСЫ РАЗРАБОТКИ СХЕМЫ ПЕРЕДАЧИ
ИОБРАБОТКИ ИНФОРМАЦИИ В АСУ
Вопрос создания надежной системы информации для
схем АСУ является одним из важнейших. Стоимость сбора и обработки единицы информации, ее надежность и объек тивность, интенсивность загрузки линий связи непосредст венно зависят от тех принципов, которые 'закладываются при проектировании информационной системы. Узловыми моментами, которые должны быть подробно разработаны при создании информационной системы в частности и инфор
мационного обеспечения АСУ в общем, должны быть: изу чение и анализ существующих в системе информационных связей и потоков между основными подразделениями трубо проводного хозяйства; изучение и обоснование задач, реша емых в информационной системе АСУ; разработка и реализа
ция методов и устройств, обеспечивающих сбор, передачу, хранение и выдачу объективной и достоверной информации;
создание интегрированной системы обработки информацион ных показателей.
В первую очередь создается всеобъемлющая схема инфор мационных связей и потоков информации, циркулирующих в рамках подразделений трубопроводного хозяйства, для которого создается АСУ. На этой информационной схеме указываются пункты формирования и получения информа ции, ее значимость, объемы передаваемых сообщений и т. п. Трудоемкость обследования системы для составления этой
информационной схемы чрезвычайно велика и требует при
мерно до 30% времени, затрачиваемого на разработку АСУ. Информационную схему используют обычно для определе
ния маршрутов документов с целью последующей рациона
118
лизации потоков информации., объемов циркулирующей
в системе информации, места для установки устройств сбо
ра и передачи информации. Однако, как показывает опыт проектирования многих АСУ, здесь имеются следующие осо бенности, которые необходимо учитывать: большая трудо емкость в реализации этой задачи; значительные изменения информационных потоков ввиду значительного разрыва во времени между обследованиями и внедрением АСУ, так как
технические средства и все задачи, решаемые в информа
ционной системе АСУ, внедряются обычно поэтапно.
Поэтому обследование на стадии, предшествующей тех
ническому проектированию АСУ, должно быть ограничено по своему объему и строго целенаправлено. Оно должно
касаться лишь основных структурных подразделений систе
мы и наиболее важных документов, сообщений и их маршру тов. Причем важность того или иного документа должна быть определена анализом задач, предназначенных к перво
начальному внедрению в реализации АСУ. Поэтому в этой
стадии разработки АСУ необходимо фиксировать лишь те
показатели и соответственно документы и их маршруты, ко
торые участвуют в решении первоочередных задач.
Разработка и использование технических средств сбора,
переработки, хранения и выдачи информации играют важ
ную роль в обеспечении эффективного функционирования
информационной системы АСУ. Большое значение имеют
также аппаратурные, программные, тестовые и т. п. методы повышения надежности передачи и обработки информации
(см. гл. IV). Результирующим этапом создания информа
ционной системы АСУ является разработка и реализация схемы интегрированной обработки информации.
Многие авторы отмечают, что основной предпосылкой создания интегрированной системы обработки информацион ных данных является четкое разделение управленческих функций на «творческие» процессы, т. е. процессы принятия
решений по управленческим воздействиям на объект конт
роля и управления, и «механические», суть которых заклю чается в сборе информации, ее размножении, переписке, составлении сводных документов и т. п. В АСУ обычно пер вые операции осуществляет управленческий аппарат соот ветствующих иерархических уровней отраслей коммуналь
ного хозяйства, а механические операции — эксплуата
ционная служба АСУ, т. е. системы ИВДП, РИВЦ и ГИВЦ.
Говоря об организации интегрированной системы обработ ки информационных данных, следует иметь в виду, что речь
119