книги из ГПНТБ / Садовников, В. И. Потоки информации в системах управления
.pdfподачи на автоматические устройства (электронные, счетно-аналитические и т. п.) обработки информации.
В настоящее время известны информационные языки (ИЯ), предназначенные для поиска научно-технической литературы ![Л. 8, 31, 44]. Так как структура любого ИЯ определяется в основном его функциями, рассмотрим кратко сущность такого поиска.
Содержание каждого литературного источника (кни ги, журнала, статьи и т. п.), называемого документом, представляется в виде набора характерных для данного текста слов, называемых ключевыми словами. Наборы ключевых слов в различных текстах одной и той же тематики отличаются не только из-за различия содержа ния, но также из-за наличия синонимии. Для построения ИЯ библиографической информационно-поисковой си стемы (ИПС) из массива ключевых слов, характеризую щих тексты рассматриваемой тематики, составляется стандартный набор терминов со строго фиксированными лексическими значениями [Л. 64], в котором устранены синонимы.' Эти термины, представленные отдельными словами или группами слов, называются дескрипторами, а наборы таких терминов — словарем дескрипторов (иногда — тезаурусом [Л. 71]). Для каждого документа составляется набор дескрипторов, называемый поиско вым образом документа (ПОД). Для поиска необходи мой литературы составленный запрос переводится на ИЯ и представляется набором дескрипторов, называе мым поисковым образом запроса (ПОЗ). Сам поиск проводится, как правило, сравнением ПОЗ и ПОД. Ос новой для такого сравнения является принятый в кон кретной системе критерий смыслового соответствия меж ду поисковыми образами.
Описанный поиск информации производится с по мощью дескрипторного ИЯ без грамматики. Более эф фективными являются дескрипторные ИЯ с граммати кой, в которых дескрипторы, относящиеся к ПОД, и де скрипторы, входящие в состав ПОЗ, снабжаются допол нительными символами, указывающими на семантиче скую роль этих дескрипторов (субъект процесса, объект процесса, атрибут, причина и т. п.). Иногда роль де скрипторов определяется их положением в наборе поискового образа. Применение таких ИЯ позволяет улучшить полноту и точность информационного' поиска.
77
Однако поиск с помощью любого из дескрипторных ИЯ приводит к выдаче излишних документов или, нао борот, к потере нужных документов (информационный шум).
Применительно к задаче описания потоков информа ции наиболее близок метод дескрипторного языка с грамматикой. Этот метод с учетом специфики задачи описания потоков реализуется и развивается следующим образом.
Содержание каждого документа представляется в ви де набора СК потока информации, элементами которых являются свойства (характеристики и признаки) исход ных объектов. Из-за наличия синонимии эти свойства могут быть записаны по-разному в различных докумен тах исследуемого объекта управления. Свойства исходных объектов выбираются в качестве дескрипторов ОИЯ, по сле чего составляется тезаурус ОИЯ (словарь дескрип торов), в котором устранены синонимы. Каждая СК опи сывается набором дескрипторов, порядок расположения которых определяется форматом компоненты (§ 1-4, п. «б»), В задаче описания потоков производится описа ние и поиск структурных компонент, а не документов, как в случае библиографического поиска. Характерной особенностью ОИЯ рассматриваемого применения явля ется то, что в нем не допускается информационный шум. Это означает, что одни и те же объекты, описанные на ОИЯ независимо различными лицами, получают один и тот же код, и обратно, одним и тем же кодам ОИЯ со ответствуют одни и те же объекты.
Кроме того, отметим, что использование ОИЯ при описании информации в отличие от таких способов опи сания, как, например, объектно-характеристические таб лицы ГЛ. 34] и т. п., в которых элементы информации идентифицируются через номера таблиц и документов, делает это описание более гибким и независимым от носителя информации.
Отметим также, что постоянные ссылки в этой работе на документы и примеры, построенные на документах, отражают скорее широко распространенный -на практи ке подход к изучению потоков информации, чем суще ство дела. Говоря точнее, использование ОИЯ в качестве средства описания СК объективизирует описание потока, делает его независимым от носителей и форм представ ления информации и равно пригодным как для описания
78
существующих, так и проектируемых новых информа ционных систем.
В дальнейшем будем различать естественный и искус ственный уровни ОИЯ.
Естественный уровень ОИЯ
Исследование отраслевого естественного языка, на котором записываются сообщения об исходных объектах, показывает, что этот язык в известной степени нормали зован. Однако такая стихийная нормализация несовер шенна с точки зрения требований, предъявляемых к язы ку, для описания СК потоков информации. При разра ботке ОИЯ необходима дополнительная нормализация, учитывающая синтаксический, семантический и праг матический аспекты.
Синтаксически нормализованный язык четко опреде ляет встречающиеся в нем выражения, поэтому с по мощью только синтаксических средств можно опреде лить, имеет ли смысл в таком языке данное выражение. Преимущество синтаксически нормализованного языка состоит в его ясной структуре. Семантическая нормали зация позволяет установить однозначную связь языковых знаков и их значения (смысла). Семантически нормали зованный язык располагает словарем с единым и точ ным соответствием слов и понятий. С точки зрения праг матики, нормализация языка повышает действенность слов и словосочетаний за счет применения языковых сте реотипов при описании различных процессов и явлений, т. е. для обозначения нормализованных ситуаций исполь зуются нормализованные обороты речи, что способствует повышению экономичности мышления.
СК, наименования которых записаны на естествен ном и нормализованном языках, эквивалентны по смыс лу, но внешне отличны друг от друга. Содержание СК, записанной на естественном языке, передается грамма тически правильным предложением, а на нормализован ном языке — некоторым канонизированным предложе
нием. |
записанной |
на естественном языке: |
Пример СК, |
||
«Бригада № (...), за смену № |
(...), числа (...), меся |
|
ца (...), года (...) прокатала |
из плавки № (...) (...) |
|
слитков размером |
(...), марка стали которых определе |
|
на как (. ..)». |
|
|
79
Пример этой же СК, записанной на нормализованном языке: «Количество слитков прокатанных; в течение смены (смена, число, месяц, год); номер плавки; марка стали; размеры слитка; номер бригады».
Запись СК. на естественном языке содержит знамена тельные члены предложения (характеристику и призна ки), служебные слова и знаки препинания (Л. 5]. Зна менательные члены предложения в свою очередь содер жат знаменательные слова, служебные слова и знаки пре пинания. Знаменательные слова имеют самостоятельный смысл (самостоятельное логическое значение). Служеб ные слова не способны выступать самостоятельно в функции членов предложения и служат для выражения различных семантико-синтаксических отношений между знаменательными словами.
Примером служебных слов в СК, записанной на есте ственном языке, могут служить связки между знамена тельными словами и между знаменательными членами предложения: в, на, с, при, по, имеет, находится, и, кото рый, пустая связка (при наличии причастного оборота) и т. п.
Синтаксическое нормирование состоит в том, что СК, записанная на естественном языке, разбивается на ряд словосочетаний [Л. 5]. Каждое словосочетание соответ ствует характеристике или признаку компоненты и пред ставляет собой соединение двух или более знаменатель ных слов вместе с относящимися к ним служебными сло вами и знаками препинания.
Примеры словосочетаний:
1.Характеристика — «Количество слитков, поступивих в цех слябинг с завода «Днепроспецсталь»
2.Признак — «Марка стали».
Каждая характеристика строится так, что на первом месте располагается понятие-категория.
В естественном языке, используемом в конкретной отрасли, категории обычно отражают наиболее общие количественные характеристики сырья, материалов, гото вой продукции, агрегатов и т. л. Примерами из области прокатного производства являются следующие понятиякатегории: количество, вес, продолжительность, расход, цена и т. д.
Справа от категории находится понятие, называемое центральным логическим термином (ЦЛТ). ЦЛТ обозна чает объекты, характеристика которых дается полным
80
наименованием структурной компоненты. В состав ЦЛТ, кроме наименований объектов, могут входить одно или несколько понятий, обозначающих свойства этих объек тов. Примеры характеристик такого вида приведены в табл. 1-24.
|
Т а б л и ц а |
1-24 |
Категория |
ЦЛТ |
|
Количество |
слитков |
|
Количество |
слитков прокатанных |
|
Вес |
слитков нержавеющих марок стали прокатанных |
|
Количество |
слитков, переданных мартеновским цеком |
цеху |
Вес |
слябинг |
|
слябов |
|
|
Вес |
слябов нагретых и прокатанных |
|
В том случае, когда понятие-категория характери зует свойство объекта, справа от категории стоит поня тие, обозначающее это свойство. Примеры таких харак теристик приведены в табл. 1-25.
|
Т а б л и ц а 1-25 |
Категория |
ЦЛТ |
Продолжительность |
прокатки слитков |
Продолжительность |
простоя стана слябинг |
Время начала |
обработки слябов |
Время окончания |
посада плавки |
• • * |
. . . |
Иногда понятие-категория состоит из нескольких слов, часть которых расположена в начале характеристики, а остальные — в конце. Между этими словами распола гается ЦЛТ. Примером могут служить характеристики, приведенные в табл. 1-26.
Структура временного признака такова, что на пер вом месте располагается понятие, отражающее интервал или момент времени. Справа от него (в скобах) распо лагается ряд понятий, которые отражают возрастающую последовательность временных интервалов (моментов), элементом которой является данный интервал (момент).
6—193 |
81 |
|
|
Т а б л и ц а 1-26 |
Категория |
цлт |
Категория |
Расход |
шлака в цехе слябинг |
по норме |
Расход |
топлива в цехе слябинг |
по норме |
Вес |
слябов, полученных при порезе |
по плану |
Например, «На начало |
смены |
(смена, число, месяц, |
год)»; «В течение смены |
(смена, число, месяц, год)»; |
|
«С начала смены на |
текущий |
момент смены (те |
кущий момент смены, смена, число, месяц, год)» и т. д. Структура прочих признаков отражает специфику объек та управления каждой конкретной отрасли.
При объединении выделенных словосочетаний в нор мализованное предложение порядок относительного рас положения элементов предложения определяется форма том СК. Элементы нормализованного предложения от деляются точкой с запятой.
Семантическая нормализация обеспечивается созда нием словарей характеристик, признаков и синонимов (тезауруса ОИЯ).
С точки зрения лиц, использующих нормализованный язык, преимуществом нормализованной записи является ясная структура, однозначная связь языковых знаков и их значения (смысла), экономичность мышления за счет того, что нормализованные ситуации обозначаются нор мализованными средствами. Недостаток нормализацииотносительное неудобство чтения записи на нормализо ванном языке.
Искусственный уровень ОИЯ
Отраслевой информационный язык оперирует едини цами двух видов: дескрипторами и структурными компо нентами.
Дескрипторы — это знаки, передающие информацию о характеристиках, признаках и значениях признаков исходных объектов; структурные компоненты — это зна ки, передающие семантическую информацию, т. е. описы вающие состояния исходных объектов. Знаками ОИЯ
82
искусственного уровня являются восьмеричные цифро вые коды.
ОИЯ задается тезаурусом>„(словарем дескрипторов) и синтаксисом (правилом построения наименований струк турных компонент с использованием дескрипторов). Де скрипторы в тезаурусе разбиты на классификационные группы с указанием синонимов для тех дескрипторов, которые этого требуют. Разработка тезауруса и синтак сиса производится одновременно на основании определе ния структурной компоненты (§ 1-4, п. «б») и текстов естественного языка, используемого в данной отрасли производства для описания сообщений об исходных объ ектах.
Тезаурус ОИЯ
Тезаурус состоит из трех частей: прямого и обращен ного словарей (аналогично, например, русско-английско му и англо-русскому словарям) и словаря синонимов. Прямой словарь используется в процессе обследования объекта управления для записи наименований структур ных компонент на ОИЯ-
Обращенный словарь используется на всех этапах проектирования автоматизированной системы, когда не обходимо перейти от наименований структурных ком понент, записанных в кодах ОИЯ (искусственный уро вень ОИЯ), к наименованиям компонент, записанных с использованием лексики естественного языка (естест венный уровень ОИЯ). Словарь синонимов необходим как при разработке прямого словаря, в котором не дол жно быть синонимов, так и при обследовании объекта управления, когда одним и тем же (по смыслу) свойст вам исходных объектов должен быть присвоен один и тот же код ОИЯ. Наличие отдельного словаря синони мов, а не объединенного с прямым словарем, обусловле но необходимостью иметь перечень синонимов, располо женных в алфавитном порядке, так как в процессе работы с тезаурусом возникает необходимость поиска дескриптора — представителя группы синонимов по од ному из синонимов этой группы.
Прямой словарь состоит из трех списков: первый
список {р} содержит дескрипторы-характеристики исход ных объектов; второй список {21} — дескрипторы, пред-
6 * |
83 |
ставляющие собой временные признаки исходных объек
тов; третий |
список {г?, ..., zn} — прочие дескрипторы- |
признаки. |
• |
Словарь оформляется в виде таблицы (см. приведен ный ниже фрагмент тезауруса ОИЯ для прокатного про изводства). В первом списке прямого словаря в первой графе располагаются дескрипторы; во второй — коды, соответствующие этим дескрипторам; в третьей — отно шения (язык для записи отношений — см. § 1-4, п. «ж»). Синтаксическое и семантическое определения кодов ха рактеристик и отношений приведены в § 1-4, п. «ж». От ношение, соответствующее некоторой характеристике, показывает, что любая СК, содержащая эту характе ристику, может быть получена преобразованием СК, содержащих характеристики, указанные в формуле спра ва от знака равенства (с целью сокращения записи знак равенства не записывается).
Кроме записи отношений третья графа списка (ц) используется для обозначения характеристик, входящих в состав исходных (относительно арифметических опера ций) компонент. Эти характеристики обозначаются
втретьей графе индексом «исх.». Обозначенная таким индексом характеристика может быть исходной на том объекте управления, для которого разрабатывается дан ный конкретный ОИЯ. На другом объекте эта характери стика может входить в состав вычисляемой СК. Наличие
втретьей графе списка {р} индекса «—» говорит о том, что СК, содержащая отмеченную таким образом харак1 теристику, не может быть получена с помощью правила
(1.4.1).
После записи отношений в выводе каждой характе ристики выявляются и устраняются противоречивые характеристики (§ 1-4, п. «з»).
Пусть, например, в описке fp) прямого словаря в стро ке, соответствующей дескриптору-характеристике 021, в третьей графе записана формула 015 + 016. Эта запись означает, что любая СК, содержащая дескриптор-харак теристику 021 и некоторый набор дескрипторовпризна ков, может быть получена с помощью арифметической операции сложения из двух СК, одна из которых содер
жит |
дескриптор-характеристику 015, а другая — 016 и |
обе |
содержат одинаковый набор дескрипторов-призна |
84
ков, совпадающий с набором этих признаков у искомой СК.
Запись индекса «исх.» в строке, соответствующей дескриптору-характеристике 047, означает, что эту ха
рактеристику может содержать, |
например, |
исходная |
|
компонента лгі= (047, 222, 201, 206) |
и получаемые из |
||
нее с помощью правила (1.4.1) структурные компоненты |
|||
х2= |
(047, 222, 201), х3 = (047, 222, 206) и т. д. |
|
|
фе |
Во втором списке {гі} прямого словаря в первой гра |
||
располагаются дескрипторы — временные |
признаки, |
||
а во второй — соответствующие им |
коды. Порядок рас |
||
положения дескрипторов в словаре следующий. Первым сверху располагается граничный (сверху) временной интервал; затем — интервал, являющийся одним из эле ментов граничного; затем — интервал, являющийся од ним из элементов второго интервала, и т. д.
В третьем списке {z2, . . ., гп} прямого словаря в пер вой графе записываются дескрипторы-признаки; во вто рой— соответствующие им коды; а в третьей — отноше ния признаков, которые используются при выводе и за писи формул преобразования структурных компонент с использованием правила (1.4.2). Отношения признаков показывают, что каждому значению признака, стоящего слева от знака отношения, соответствует группа значе ний признака, указанного справа от этого знака.
Пусть, например, в списке {z2, ..., zn) прямого сло варя в строке, соответствующей дескриптору-признаку 206, в третьей графе записано 206-<—>-Т 207 Т.Эта запись вводится в § 1-4, п. «ж» и означает, что каждому значе нию дескриптора-признака 206 соответствует опреде ленная группа значений признака 207. В строке, соответ ствующей дескриптору-іпризнаку 207, записывается отно шение Т207 —>-206, которое означает, что группе зна чений дескриптора-признака 207 соответствует одно определенное значение дескриптора-признака 206 (см. приведенный ниже фрагмент тезауруса). Все дескрипто ры прямого словаря кодируются путем сквозной нуме рации.
Обращенный словарь тезауруса состоит из двух спи сков: списка дескрипторов-свойств (характеристик и признаков) и списка дескрипторов-значений свойств. Выделение самостоятельного списка дескрипторов-значе-
85
пий свойств обусловлено тем, что отдельным свойствам может соответствовать большое число (порядка сотни) значений. Объединение этого списка с прямым или об ращенным словарем тезауруса могло бы значительно затруднить пользование ими. Размещение списка де скрипторов-значений свойств в обращенном словаре вы звано тем, что этот список используется главным обра зом в процессе программирования автоматизированной системы, когда СК потока информации уже записаны
вкодах ОИЯ.
Всписке дескрипторов-свойств в первой графе рас полагаются в порядке возрастания цифровые коды; во второй графе —соответствующие им дескрипторы (см. приведенный ниже фрагмент тезауруса).
Всписке дескрипторов-значений свойств в первой графе записываются в порядке возрастания коды де скрипторов-свойств, для каждого из которых записыва
ются коды дескрипторов-значений свойств. Значения каждого дескриптора-свойства кодируются по порядку номеров. Во второй графе этого списка располагаются соответствующие дескрипторы-свойства и дескрипторызначения свойств. В третьей графе указываются отноше ния дескрипторов-признаков и соответствующие некото рому значению одного дескриптора-признака группы зна
чений другого дескриптора-признака |
(см. приведенный |
||
ниже фрагмент тезауруса). |
определения ко |
||
Синтаксическое |
и |
семантическое |
|
дов признаков, кодов |
значений признаков и отношений |
||
между признаками |
и между их значениями приведены |
||
в§ 1-4, п. «ж».
Всписок дескрипторов-значений свойств записывают ся только те значения, которые имеют алфавитную или алфавитно-цифровую форму. Значения, имеющие цифро
вую форму, как правило, не записываются. Исключение составляет случай, когда необходимо указать, что каж дому значению данного свойства соответствует группа значений некоторого другого свойства; при этом цифро вые значения не кодируются. Например, для каждого алфавитно-цифрового значения признака «группа ширин слябов» необходимо указать группу соответствующих цифровых значений признака «ширина сляба». Здесь значения признака «группа ширин слябов» кодируются, а значения признака «ширина сляба» — не кодируются. Исключение цифровых значений позволяет значительно
