Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Белоногов Г.Г. Автоматизированные информационные системы

.pdf
Скачиваний:
9
Добавлен:
25.10.2023
Размер:
14.28 Mб
Скачать

лишь в том случае, если поиск ведется в оперативной

памяти).

Часть клеток матрицы информационной таблицы обычно бывает пустой. Это может происходить по двум причинам. Во-первых, объект и класс характеристик, указанный на входе таблицы, могут быть несовместимы. Это означает, что данному объекту несвойственна ха­ рактеристика, сформулированная в наименовании клас­ са. Во-вторых, могут отсутствовать сведения по ряду характеристик. Поэтому при записи информационных таблиц в памяти машины целесообразно применять спе­ циальные меры по экономии места. Одной из таких мер может быть введение логической шкалы перед каждой строкой или перед каждым столбцом матрицы (в зависи­ мости от того, в каком порядке проводилась ее линейная развертка). Логическая шкала содержит столько двоич­ ных знаков, сколько клеток в матрице информационной таблицы. Символом 0 в шкале обозначаются клетки ин­ формационной таблицы, которые соответствуют несовме­ стимым парам кодов объектов и характеристик. Осталь­ ные клетки матрицы обозначаются символом 1. После логической шкалы записывается массив отсылочных адресов к значениям характеристик, который содержит

столько позиций, сколько единиц имеется в логической шкале. Если сведения по какому-либо значению характе­ ристики отсутствуют, то вместо отсылочного адреса про­ ставляется нулевой код. В дальнейшем при пополнении сведений об объектах этот код может быть заменен на отсылочный адрес к значению характеристики. Буквенные коды значений характеристик, входящих в состав строки или столбца информационной таблицы, записываются в порядке их поступления. В начале каждого буквенного кода указывается количество ячеек памяти, занимаемое значением характеристики.

Порядок записи в памяти ЭВМ одной строки значе­ ний характеристик иллюстрирует табл. 12.3. В разделе а) таблицы приведены условные обозначения, в разделе

б ) — исходная

структура

строки,

а в разделах в), г),

д ) — основные

компоненты

строки

значений характери­

стик при ее записи

в

памяти ЭВМ (логическая

шкала,

отсылочные адреса

к

значениям

характеристик

и б у к ­

венные коды значений характеристик). В разделе б) на­ ряду с буквенными кодами значений характеристик (строки, обозначенные буквой z) для наглядности указа­

220

ны также номера столбцов у и количество ячеек п, зани­ маемое каждым значением характеристики. В разделе г) записаны отсылочные адреса к значениям характери­ стик, а после каждого адреса в скобках указан порядко­ вый номер символа 1 в логической шкале, которому этот адрес соответствует (в действительности порядковые но­ мера отсылочных адресов в памяти ЭВМ нигде не фик-

 

 

 

 

 

 

 

 

Т а б

и ц а

12.3

 

П р и м е р

записи в

пам ят и

машины

ст ро ка

 

ч ен ій

 

 

зн ал

 

2а)

Условные

 

х а ракт е рист ик

 

 

 

 

обозначения:

 

 

 

 

 

 

п — номера столбцов матрицы информационной таблицы;

 

у

 

 

 

 

 

характеристик;

 

 

 

— буквенные коды значений

 

 

ячей­

ках) ; — длина

буквенных

кодов

значений

характеристик (в

н — признак

несовместимости

 

объекта

и характеристики;

 

«—» — сведения

по характеристике отсутствуют.

объекту х;

б)

Исходная

структура

строки,

соответствующая

У

1

 

2

3

4

 

н

6

 

7

8

п

 

Zi,2

 

^г.з

 

H

H

Z

1

 

2

 

 

 

 

4

 

 

 

 

 

 

12

 

13

15

io

Z

9

 

10

11

 

14

У

 

 

 

 

^1,13

 

 

zi, 16

п

н

 

Н

н

12

 

Zi,l5

 

17

 

18

 

3

 

1

22

 

1

2

УZ

 

19

20

 

21

23

24

п

Zt.l7

 

н

2г,19

Н

 

^І,21

н

H

У

1

 

26

7

28

 

2

30

•31

32-

Z

25

 

27

 

29

п

 

н

н

 

Z t ,30

z

i , 31

У

33

 

34'

 

/

 

. . .

12

k ^3

 

 

 

 

k— 2

 

\

k

 

Н

 

 

 

 

 

 

 

Z

П ы

 

 

 

zi,h - t

^ i,h ~ 1

2 .

 

 

Ziі

 

 

п

 

 

2

 

1

 

 

1

 

2

221

в) Логическая шкала строки

11

1 1 0 1 0 0 0 0 0 1 1 1 1 1 1 0 1 0

 

 

 

 

1 0 1 0 1 1 0 1 1 1 1 1 0 1 . . .

1 . .

 

 

 

 

г) Отсылочные

адреса

 

 

к

значениям характеристик

 

 

 

 

 

 

0001 ( 1)

 

0002(2)

0000(3)

 

 

 

 

 

 

 

0000 (4)

 

0004(5)

0008(6)

 

 

 

 

 

 

 

ООП (7)

 

0000(8)

0012(9)

 

 

 

 

 

 

 

0013(10)

0015(11)

0016(12)

 

 

 

 

 

 

 

0023(13)

0000(14)

0000(15)

 

 

 

 

 

д) Буквенные

0000(16)

0000(17)

0025(18)

 

 

 

 

 

коды значений характеристик

 

 

 

 

 

Адрес ячейки

Значение характерис­

Адрес

Значение характери­

 

тики

 

ячейки

стики

 

 

 

0001

 

 

 

 

 

 

 

0015

 

 

 

 

19

0002

 

2і2

 

0016

Zz i

i, ,

0003

 

 

0017

0004

 

 

 

0018

 

 

 

 

, 9

0005

 

 

 

 

ä

 

 

0019

24,19

0006 .

 

Z

i

 

 

 

0020

 

 

 

 

 

0007

 

Z

i

s

 

 

0021

 

 

 

 

 

0008

 

Z

i

 

,

1 2

 

0022

 

 

 

 

 

0009

 

 

 

 

 

 

 

0023

 

 

 

 

 

0010

 

 

 

 

 

13

 

. 0024

Z

i

 

, 2

1

ООП

 

Z

t

,

 

 

0025

 

 

 

 

 

0012

 

Z

i

,

i b

 

0026

Z

i

, /

»

0013

 

 

 

 

 

 

 

0027

z

 

i

,

30

0014

 

2

l

,

IG

 

 

 

сируются). В одной ячейке размещается несколько от­ сылочных адресов. Массив буквенных кодов значений характеристик условно изображен в разделе д). Если какое-либо значение характеристики занимает более од­ ной ячейки памяти, то символ г повторяется несколько

раз (см. например, значения характеристик Zi,2 и 2г-,6 в разделах б) и д) табл. 12.3).

Значения характеристик в матрице информационной таблицы ищутся в следующем порядке. Сначала по но­ меру строки таблицы выбирается информация, соответ­ ствующая этой строке (логическая шкала, отсылочные адреса к значениям характеристик и массив буквенных кодов значений характеристик). Затем по номеру столб­ ца находится соответствующий разряд логической шка­ лы и его содержимое проверяется на наличие призна-

2 2 2

*

ка 0. Если такой признак имеется, то поиск прекра­ щается, так как объект и характеристика несовместимы. Если его нет, то суммируются единицы логической шка­ лы от ее начала до проверяемого разряда включительно. Найденная сумма далее интерпретируется как номер позиции в массиве адресов отсылки к значениям харак­ теристик и по ней выбирается отсылочный адрес. Если отсылочный адрес равен нулю, то процесс поиска пре­ кращается из-за отсутствия сведений по искомой харак­ теристике. Если не равен нулю, то он используется для обращения к буквенному коду искомого значения харак­ теристики.

Логическая шкала размещается в нескольких ячей­ ках памяти. Для ускорения процесса поиска в каждой ячейке отводится место для записи числа единиц во всех предшествующих ячейках шкалы и пересчет единиц ве­ дется только в пределах одной последней ячейки.

Рассмотренный способ представления матриц инфор­ мационных таблиц с помощью логических шкал и отсы­

лочных адресов к значениям

характеристик является

по существу модификацией

гнездового ассоциативно­

адресного способа. Здесь для каждой строки матрицы предусмот-рено свое гнездо адресных отсылок, но, в от­ личие от обычнрго применения гнездового способа, поиск в гнездах производится не перебором, а путем вычисле­

ния адресов

записи

необходимых

адресных отсылок

к значениям

характеристик.

информационных

Гнездовой

способ

представления

таблиц неудобен в том отношении, что изменение соста­ ва столбцов при развертке таблиц по строкам и изме­ нение состава строк при развертке их по столбцам свя­ зано с перемещением массивов адресных отсылок (их раздвижкой или уплотнением). Этого можно избежать, если выбрать в качестве основной единицы хранения информации не строку или столбец таблицы, а элемен­ тарное сообщение, состоящее из кода объекта, кода ха­ рактеристики, кода значения характеристики и кода от­ ношения между объектом, характеристикой и ее значе­

нием.

Тогда информационная таблица

может

быть

представлена в виде массива элементарных

сооб­

щений,

и добавление или изъятие строки

или столбца

сведется к добавлению или изъятию группы элементар­ ных сообщений. Более того, можно забыть о «табличном происхождении» массива элементарных сообщений и

223

записывать в него сведения об объектах с различным количеством и составом характеристик. Таким образом, элементарное сообщение может выступать в. качестве основной единицы смысла в фактографической информа­ ционно-поисковой системе.

Для представления массива элементарных сообщений в виде ассоциативно-адресной структуры может быть использован узловой способ. По этому* способу сообще­ ния будут представлены узлами адресных отсылок, по три адреса в каждом узле (с учетом кодов отношений — по четыре адреса), а в процессе поиска будут просма­ триваться только такие сообщения, которые содержат хотя бы одно понятие из запроса. Для удобства поиска адресные узлы могут сопровождаться кодами сообщений в виде последовательностей кодов понятий.

Глав а 13 ПРИМЕРЫ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ

_

Автоматизированная фактографическая

информационно-поисковая система

^

Автоматизированная фактографическая поисковая

система предназначена для накопления, хранения, об­ новления, поиска, обработки и выдачи потребителям све­ дений, поступающих от различных источников. Сведения, содержащие числовую и текстовую информацию, запи­ сываются по определенной форме на специальных блан­ ках (табл. 13.1), переносятся на перфоноситель и авто­ матически вводятся в ЭВМ.

На бланках указываются наименования объектов, наименования характеристик, значения характеристик и признаки логической связи между этими элементами со­

общений (см. последнюю

графу

табл.

13.1). Перечень

 

 

Бланк формуляра сообщений

Т а б л и ц а 13.1

п/п

Наименование

Наименование ха­

Значение

Признак ло­

объекта

рактеристики

характеристики

гической связи

ЛѴ

1

Бетонный за-

Рабочие

и слу-

135

01

2

вод

жащие

 

г. Бийск

00

 

 

Местоположение

2 2 4

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 1 3 .2

 

 

 

 

 

 

 

 

 

 

 

 

Условное

 

 

 

 

 

 

Вид отношения

 

 

 

обозначе­

 

 

 

 

 

 

 

 

 

 

ние

п/п

 

Объект X

включает

в свой состав элементы у

в

01

1

 

2

количествеX

г

 

 

у

 

 

объекты

г,

02

 

Объект

х

включает

в свой состав

3

принадлежащиеу

классу

 

 

г,у

принадлежа­

03

 

Объект

X

имеет

характеристику

4

щую классу

имеет

z

 

 

 

в

количест­

04

 

Объект

X

характеристику

г ,

5

венном выражении

 

в состоянии у,

 

отнесенном

05

к

Объекту

X

находится

 

6

классу

 

 

имеет

характеристику

 

выраженную

06

 

Объект

X

 

7

кодом г . При этом код г не выражает

количества

07

 

Объект

 

 

у

в состав объекта

г ,

 

х ,

 

 

 

входит

принадле­

 

8

жащегоz

классу

отношений

между

элементами

 

00

У, Прочие виды

 

используемых

 

в

системе

логических

отношений

дан

в табл.

13.2.

 

функционирования

системы хранящиеся

В процессе

в ней сведения выдаются человеку по запросам, задавае­ мым на формализованном русском языке. Ответы на запросы вырабатываются машиной также на формали­ зованном русском языке и включают в качестве своих элементов наименования объектов, наименования харак­ теристик и числовые или текстовые значения характеристик.ДПриведем пример запроса на поиск информации и ответа на запрос.

Запрос 1 (Иванов).

А л т а й с к и й к р ай , п р о и з в о д ст в о ст р о и т е л ь н ы х м а т е р и а л о в , о б ъ ­ е к т ы — (б ето н н ы е з а в о д ы ) , х а р а к т е р и с т и к и — (м е с т о п о л о ж е н и е или г о д о в а я п р о и з в о д и т е л ь н о с т ь ), ф о р м а в ы д а ч и — (т е к с т ) .

1

Ответ: *

 

бето н н ы й з а в о д

(м е ст о п о л о ж е н и е ) — (г. Б и й с к );

— (го д о в а я п р о и зв о д и т е л ь н о ст ь ) — (50 000 т ) ; 2 б ето н н ы й з а в о д

(м е ст о п о л о ж е н и е ) — (г. Б и й с к );

— (г о д о в а я п р о и зв о д и т е л ь н о ст ь ) — (150 000 т ) ; 25 б ето н н ы й з а в о д

(м е ст о п о л о ж е н и е ) — ( г .К а м е н ь ) ;

— (го д о в а я п р о и зв о д и т е л ь н о ст ь ) — (15 000 т ) ;

* В ответе на запрос приведены условные данные.

15—310

225

137 завод железобетонных конструкций

(местоположение) — (г. Барнаул);

(годовая производительность) — (500 000 т).

Взапросе указывается его порядковый номер, фамилия или

адрес заказчика, признаки массивов информации (если

они извест­

ны заказчику), наименования объектов и характеристик

(или клас­

сов объектов и характеристик), значения характеристик, операторы обработки информации и признак формы выдачи ответа на запрос. Обязательными элементами запроса являются его порядковый номер, фамилия или адрес заказчика, наименования объектов и характе­ ристик и признак формы выдачи, остальные элементы — факульта­ тивные.

Значения характеристик указываются после их на­ именований. Границы между наименованиями и значе­ ниями характеристик обозначаются разделительными знаками. Перед числовыми значениями характеристик могут проставляться признаки «больше» или «меньше», а перед наименованиями характеристик — признаки ло­ гических отношений между объектами, характеристика­ ми и значениями характеристик. Предполагается, что характеристики и их значения относятся ко всем объек­ там, указанным в запросе.

Признаки массивов могут быть связаны друг с дру­ гом дизъюнктивной или конъюнктивной логической

связью.

Первый вид связи обозначается сочинительным

союзом

«или»,

второй — запятой.

При

одновременном

использовании

обоих видов связи

более

«тесной» счи­

тается дизъюнктивная связь. В памяти машины каждо­ му номеру массива сообщений ставится в соответствие его поисковый образ — перечень номеров понятий, обо­ значающих признаки массива. Процесс поиска номеров массивов по заданным признакам аналогичен процессу поиска номепов документов в документальных системах.

Если требуется получить сведения о нескольких объ­ ектах (или классах объектов), то их наименования пере­ числяются в запросе и отделяются одно от другого со­ чинительным союзом «или». Аналогично поступают и в том случае, когда требуется получить сведения о ряде характеристик объектов (или классов характеристик), но здесь наряду с дизъюнктивной используется также и конъюнктивная логическая связь.

Наименования объектов и характеристик (последние вместе с их значениями и кодами логических отноше­ ний) заключаются в скобки и сопровождаются словес­ ными признаками «объекты» и «характеристики». В тех

случаях, когда надо получить сведения о всех объектах, обладающих заданными характеристиками, или о всех характеристиках объекта или группы объектов, вместо наименований объектов и характеристик в скобках про­ ставляются прочерки.

Ответы на запросы могут содержать следующие све­ дения:

—отдельные характеристики единичных объектов;

все характеристики одного объекта или группы 'объектов;

все объекты, имеющие заданную характеристику

или группу характеристик;

сведения об объектах указанного в запросе клас­ са, обладающих заданной характеристикой или группой характеристик;

обобщенные характеристики объектов и классов объектов, удовлетворяющих условиям запроса.

'Сведения могут выдаваться заказчику в трех фор­ мах: в текстовой форме, в нерегламентной табличной форме, в регламентной табличной форме. В текстовой форме выдачи под каждым наименованием объекта ука­ зывается перечень наименований характеристик и зна­ чений этих характеристик. В табличной форме по одному входу таблицы (левому) указывается перечень наимено­ ваний объектов, по другому (верхнему)— перечень на­ именований характеристик, а на пересечении строк и столбцов указываются значения характеристик. Наиме­ нования объектов и характеристик объединяются в груп­ пы по признаку их принадлежности к более широким понятиям. Наименования более широких понятий также

"указываются в таблице. Нерегламентная табличная форма создается и заполняется автоматически по ре­ зультатам поиска и обработки информации. Регламент­ ная табличная форма создается человеком, а ее запол­ нение происходит автоматически. Ручная подготовка форм выдачи информации в ряде случаев позволяет улучшить качество ее оформления.

В ИПС предусмотрены следующие операторы обра­ ботки информации:

1)пересчет количества объектов, удовлетворяющих заданным условиям;

2)суммирование однородных значений характери­ стик для всех объектов, удовлетворяющих заданным условиям;

1 5 ;

2 2 7

3)суммирование однородных значений характери­ стик, принадлежащих объектам заданных классов (от­ дельно для каждого класса объектов);

4)суммирование заданных классов значений харак­ теристик (отдельно для каждого объекта и каждого класса значений характеристик);

5)последовательное выполнение операций, указан­ ных в пп. 3, 4;

6)последовательное выполнение операций, указан­ ных в пп. 2, 3, 4.

В процессе работы системы используются следующие основные информационные массивы:

1)словарь основ слов;

2)словарь понятий;

3)классификационный словарь понятий;

4)массив сообщений;

5) массив буквенных кодов значений характеристик; I 6) массив буквенных кодов наименований понятий.

Первый словарь представляет собой упорядоченный перечень буквенных кодов основ слов, сопровождаемых грамматическими признаками, необходимыми для пра­ вильного распознавания различных форм слов. Каждой основе слова ставится в соответствие номер ее семан­ тического (смыслового) эквивалента. Одинаковые номе­ ра семантических эквивалентов присваиваются группам слов, элементы которых могут замещать друг друга при трансформациях словосочетаний (более подробно струк­ тура словаря основ описана в гл. 6, 7, 9).

Во втором словаре каждое наименование понятия представлено сочетанием номеров семантических экви­ валентов слов, входящих в его состав. При этом номер семантического эквивалента главного слова словосоче­ тания (первого слева существительного) ставится на первое место, а номера семантических эквивалентов остальных слов упорядочиваются по возрастанию их численных значений, причем в одной ячейке памяти за­ писывается по три номера. Пословные коды наименова­ ний понятий упорядочиваются по возрастанию их длины (по числу входящих в них слов), а в пределах участка словаря с кодами равной длины — по возрастанию чис­ ленных значений этих кодов. Каждый код словосочета­ ния сопровождается его номером (номером понятия) и адресной отсылкой к классификационному словарю по­ нятий.

2 2 8

В классификационном словаре каждому понятию ставится в соответствие перечень номеров эквивалентных ему по смыслу и подчиненных (более узких по объему) понятий. В одной ячейке памяти размещается по три но­

мера

понятия. При

этом помер

подчиняющего понятия

пишется

в начале

массива

подчиненных понятий,

а в

конце

массива

указывается разделительный при­

знак.

Четвертый массив состоит из последовательности эле­ ментарных сообщений. Каждое сообщение записывается в одной ячейке памяти и включает в свой состав номер наименования объекта, номер наименования характери­ стики, адресную отсылку к буквенному коду значения характеристики и код логической связи между объектом, характеристикой и значением характеристики (по табл. 13.2). Номера наименований объектов и характе­ ристик указываются по словарю понятий.

Пятый и шестой массивы, как это явствует из их на­ звания, содержат буквенные коды значений характери­ стик и наименований понятий, необходимые для декоди­ рования сообщений при их выдаче на печать. Перед буквенным кодом каждого значения характеристики ука­ зывается количество ячеек памяти, занимаемое этим зна­ чением (признак конца значения характеристики), а пе­ ред буквенным кодом каждого наименования понятия в отдельной ячейке записывается номер понятия. Ячей­ ка, отводимая под номер понятия, одновременно исполь­ зуется и для хранения признака начала записи его на­ именования (таким признаком служит нулевой код

встарших разрядах ячейки). . ПЙнформационно-поисковая система может работать

втрех режимах:

1)первоначальный ввод в машину основных инфор­ мационных массивов;

2)поиск сведений по запросам;

3)обновление основных информационных массивов.

Перед началом функционирования системы состав­ ляется словарь основ слов и словарь наименований по­ нятий, устанавливаются родо-видовые связи между по­ нятиями (для классификационного словаря) и заполня­ ются бланки сообщений (см. табл. 13.1). Родо-видовые связи фиксируются в классификационном словаре толь­ ко в тех случаях, когда они не выражены в словесных формулировках наименований понятий. Слозарь основ

2 2 9

Соседние файлы в папке книги из ГПНТБ