Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Левковиц, Д. Структуры информационных массивов оперативных систем

.pdf
Скачиваний:
3
Добавлен:
21.10.2023
Размер:
8.9 Mб
Скачать

Д . Л Е Ф К О В И Ц

СТРУКТУРЫ

ИНФОРМАЦИОННЫХ

МАССИВОВ

ОПЕРАТИВНЫХ

СИСТЕМ

Перевод с

английского"В.

А. Брудно,

Б.

И.

Кимельфсльда,

Я-

А. Когана под

редакцией

О.

И.

Авена

« Э Н Е Р Г И Я »

МОСКВА 1С;1'""'"

У

6Ф7

 

Л 53

 

УДК 681 .3:658.5.011 В6НАУЧНС

САГ;

БИБЛИОТіІ,

- С С Р

Лефковиц Д .

Л 53 Структуры информационных массивов . опера­ тивных систем. Пер . с англ. По д ред. О. И. Авена. М., «Энергия», 1973.

208с. с ил.

Вкниге рассматриваются способы формирования массивов инфор­ мации. Устанавливается связь между структурой массивов и требо­ ваниями автоматизированных информационных систем. Анализируются два основных типа информационных структур: ассоциативный п иерар­ хический. Излагаются методы формирования массивов, позволяющие удовлетворить ограничениям по объему памяти и времени поиска.

Книга предназначена для инженеров, разрабатывающих матема­ тическое обеспечение ЦВМ и участвующих в создании автоматизиро­ ванных систем управления.

Л

3313-267

168-73

6Ф7

О51(0І)-73

© Перевод на русский язык, «Энергия», 1973.

D. Lefkovitz

Eile structure for on-line systems

Spartan books, New York — Washington.

Давид Лефковиц

СТРУКТУРЫ ИНФОРМАЦИОННЫХ МАССИВОВ ОПЕРАТИВНЫХ СИСТЕМ

Редактор издательства £. Я. Сальников Технический редактор Т. Н. Хромова Обложка художника А. А. Иванова

Корректор А. Д. Халанская

Сдано в набор 28/II

1973 г.

Подписано к печати 23/Х 1973 г.

Формат 84ХЮ8'/эа

 

Бумага типографская № 2

Усл. печ. л. 10,92

 

Уч.-нзд. л. 11,57

Ті раж 8 ООО экз.

Зак. 88

Цена 76 ког>

Издательство «Энергия». Москва, М-114, Шлюзовая наб.. 10.

Московская типография № 10 Согозполнграфпрома

при Государственном комитете Совета Министров СССР

по делам издательств, полиграфии и книжной

торговли,

• '-'*-'" Шлюзовая наб., 10.

.

П Р Е Д И С Л О В И Е К Р У С С К О М У И З Д А Н И Ю

Одна из основных проблем при разработке любой авто­ матизированной системы урравлеі-шя заключается -в фор­ мировании и соответствующей организации информаци ­ онных массивов ( ф а й л о в ) . Качество организации фай ­ лов, т. е. .рациональность структуры и правильность .раз­ мещения на машинных носителях, решающим образом сказывается на эффективности использования вычисли­ тельной машины . Огромный объем разнородной 'инфор­ мации в организационных система;., с одной стороны, и ограниченные, как правило, машинные . ресурсы — с дру­ гой, обусловливают значительную сложность решения задачи организации файлов . Особенно это справедливо для олеративных систем, работающих в реальном масштабе времени.

Книга Д . Лефковица является одной из первых книг, целиком посвященных вопросам организации файлов в оперативных системах. Она рассчитана на квалифици ­ рованных специалистов по системам и программирова ­

нию и

имеет четкую практическую направленность. Наи ­

большую ценность в ней представляют

методологичес­

кие вопросы, связанные с проектированием

информаци ­

онных

систем.

 

 

Следует отметить, что книга написана трудным язы­

ком, с

несвойственными, вообще говоря,

английскому

языку длинными предложениями .

 

 

Трудности перевода усугублялись -также отсутствием

единой

общепринятой терминологии на

.русском языке

в области вычислительной техники вообще и по инфор­

мационным

системам в частности. Так, например,

нет

с т а н о в и в ш и х с я

терминов, эквивалентных

английским

• е, trailer,

item

и т. д. Поэтому в подобных

случаях

пе­

реводчики использовали термины, получившие распрост­ ранение среди специалистов. по вычислительной технике.

Доктор техн. наук О. И. Авен

П Р Е Д И С Л О В И Е А В Т О Р А

Постоянно растущий интерес к вопросам разработки структур файлов побудил автора выпустить настоящую

книгу.

В книге

в основном изложен материал лекций,

прочитанных специалистам, р а б о т а ю щ и м в области

обра­

ботки данных. Некоторые вопросы в ней

рассмотрены

глубже. Н а п р и м е р полнее исследованы системные

требо­

вания

к объему

памяти

Э В М и времени

отклика

на

за­

прос. Н а ч а л ь н ы е

главы

книги

содержат

изложение

ос­

новных

понятий,

позволяющих

выявить

соотношения

между функциональными требованиями системы и про­

ектными критериями структуры

ф а й л а .

З а д а н и е

структуры файлов

в

оперативных системах

определяет

возможности работы

программ пользовате­

лей (программируемые системы) и информационно-по­ исковых систем. Требования последних к структуре фай ­ ла обычно более жестки . Это объясняется значительно большим числом входных ключей, необходимостью до­

ступа к файлу по составному ключу

(т.

е.

логической

комбинации ключей)

и существенно

большим

объемом

данных по сравнению с системами

первого

типа.

 

Д л я

программируемых

систем

в а ж н о

время

отклика

на запрос. Возникающие при этом проблемы

з а д а н и я

структур

файлов

обычно

легко решаются при

упроще­

нии доступа к файлу .

Рассмотрим например,

к а к зада ­

ется структура

при

формировании

выходного

ф а й л а

в оперативных программируемых системах.

 

 

Поскольку объем выходных данных, генерируемый

данной программой

в

течение

некоторого

интервала

времени,

заранее неизвестен (за

исключением,

может

быть, его оценки сверху, указанной системой или про­ граммистом), р а з м е щ е н и е выходных данных в запоми ­ нающем устройстве памяти прямого доступа ( З У П Д ) эффективно осуществляется с помощью последователь­ ной списковой структуры. При помощи строки, состоя­ щей из 72 символов или нескольких таких строк, можно

4

по имени или ключу открыть в З У П Д файл, отнесенный к программе или терминалу . Если объем данных, гене­ рируемых программой, превышает емкость буферной па­ мяти, отведенной открытому файлу, то к ней с помощью

адреса связи м о ж н о присоединить другую буферную

па­

мять, поскольку прилегающий на диске

отрезок

памяти

мог

быть отведен тем временем другой

программе .

Та­

кая

списковая структура был'впервые

описана

в [Л.

8]

под названием последовательного списка. Такой список легко строится, экономичен по объему памяти и прост при выборке. Это объясняется тем, что в последующей

обработке участвует к а ж д а я затгись списка

(т. е.

 

к а ж ­

дое звено .в последовательности). Однако,

если

разре ­

шить вход в файл по составному ключу,

ситуация

не­

сколько усложняется >и возникает вопрос

об

эффектив ­

ности выборки из списка, так как теперь

нужной

ока­

зывается не к а ж д а я запись. Поясним этот случай.

Пусть

с каждой выходной буферной памятью связан дополни­

тельный

ключ,

указывающий выходное устройство

(в этом

случае

записи приобретают логическую значи­

мость, поскольку ф а й л больше не является единым пото­

ком д а н н ы х ) . Если возникает ситуация, когда

желатель ­

но получить доступ к «следующей

выходной записи д л я

П р о г р а м м ы X, п о д л е ж а щ е й

печати

на А Ц П У » ,

то

файл

можно организовать, например, следующими

разными

способами: 1) н а р а щ и в а т ь

список

записей

с

меткой

«Программа», помечая их после доступа меткой «Терми­

нал»; 2) составлять, список с меткой «Терминал»

и клас ­

сифицировать записи по метке « П р о г р а м м а » ; 3)

состав­

лять список по обеим меткам и выбирать записи из более короткого списка. Последнюю структуру файла обычно называют последовательным мультисписком или просто мультисписком [Л. 10]. Приведенный пример иллюстри­ рует различие м е ж д у записями с одним и несколькими ключами. Д л я генерирования и обслуживания входных, промежуточных, выходных и программных файлов про­ граммируемых систем обычно достаточно простого последовательного списка. Структура файлов информаци ­

онных систем,

с другой

стороны,

часто является миого-

ключевой, требующей

при проектировании

рассмотре­

ния: времени

отклика

системы в

различных

условиях,

скорости обновления, качества допоисковой статистики, простоты .программирования и экономичности списковой структуры по времени « пространству памяти.

5

В настоящей книге в качестве примера для

рассмот­

рения структур оперативных файлов в ы б р а н а

информа­

ционно-поисковая система. Это сделано в значительной мере потому, что алгоритмы управления файлом для программируемых систем можно легко получить из со­

ответствующих алгоритмов

д л я информационно-поиско­

вых

систем.

 

В

гл. 1 сопоставляются

функции структуры ф а й л а и

требования автоматизированной информационной систе­

мы. В

гл. 2 описываются устройства памяти

прямого до­

ступа,

которые подразделяются на три класса и вводятся

т а к ж е

понятия, связывающие эти устройства

с характе ­

ристиками проектируемого математического обеспечения. В гл. 3 у к а з ы в а ю т с я различия между понятиями инфор­ мационной структуры и структуры файла, причем первая определяется как внутреннее свойство информации, по­

рожденное

 

формируемое

человеком — пользователем

системы,

в

то в р е м я

как второе

понятие представляет

H

 

 

 

 

 

 

 

собой средство, с помощью которого

проектировщик

системы

программно

организует данные

в ф а й л ы

для

выборки

и

обновления этих

данных. Анализируются

два

основных

типа структуры файла — ассоцнатпвныиііерар -

хнческнй.

Процесс проектирования файла рассматри ­

вается в этой главе с точки

зрения

формирования

управ ­

ляющей

информации

для записей

и подзаписей

ф а й л а ,

соответствующей требованиям структуры. В гл. 4 описы­ вается структура файла с точки зрения языка запроса, который является посредником между пользователем

исистемой файлов . В гл. 5 классифицируются все

методы, описанные в оставшейся части книги. Р а с с м а т ­ риваются их общие характеристики и основные области применения. В этой главе, кроме того, сформулированы

две

ступени

процесса

выборки: справочное

декодирова­

ние

и поиск

файла.

В

гл. 6 представлены

различные

ме­

тоды проектирования и построения справочников

и

их

декодеров вместе с соответствующими оценками

по объе­

му памяти и времени отклика. В гл. 6 приводятся

методы

организации

ф а й л о в

искомых записей, при этом

даются

соответствующие оценки по объему памяти и времени отклика. В последней главе книги рассматриваются во­ просы оперативного обновления и обслуживания файлов различных структур, описанных в гл. 7.

Автор

 

ГЛАВА

ПЕРВАЯ

 

И Н Ф О Р М А Ц И О Н Н АЯ СИСТЕМА

 

1-1. МОДЕЛЬ ИНФОРМАЦИОННОЙ СИСТЕМЫ

И н ф о р м а ц и о н н ая

система

представляет собой

весьма

сложную особую

систему

связи, существенно

отличаю­

щуюся от других известных систем связи. Так, например, система телефонной связи предназначена для переклю ­ чения линий между различными абонентами; при этом все абоненты обладают равными .правами, являясь од­ новременно передатчиками и приемниками информации .

Л ю б а я обработка информации в

системе

телефонной

связи приводит « ее искажению .

 

 

В информационной ж е системе,

в отличие

от системы

телефонной связи, переключаются « е линии, а информа ­ ционные массивы — файлы J .

Пользователи этой системы эксплуатируют ее в соот­ ветствии с индивидуальными запросами . Кроме того, информационная система определенным образом обра­

батывает

информацию .

 

 

 

 

 

 

 

Всех пользователей информационной системы м о ж н о

поделить

на два класса. " Пользователи,

относящиеся

к первому

классу

(назовем

их

Генераторами),

заносят

информацию

в систему,

а

пользователи,

относящиеся

ко второму

классу

(назовем

их

Пользователями),

полу­

чают информацию из системы. Некоторые

пользователи

могут п р и н а д л е ж а т ь к обоим

классам .

 

 

 

Рассмотрим модель информационной системы, изо­

браженную на рис.

1-1.

И н ф о р м а ц и я хранится

в системе"'

в виде файлов . Генераторы

 

помещают

в систему Доку­

менты— монографии, периодические

издания,

отчеты,

различные

сообщения,

а

т а к ж е

графические

изображе ­

ния и звуко- и телевизионные

записи.

 

 

 

1 Файл (File)—это информационный массив, снабженный сим­ волическим именем, однозначно определяющим его в информацион­ ной системе. (Прим. пер.)

7

 

Д о к у м е н ты обрабатываются в системе двумя спосо­

бами . При

.первом

способе документы

заносятся

в т а к

называемый

Файл документов.

Представление докумен ­

тов

в файле зависит

от выбранной формы кодирования;

их

м о ж н о

хранить,

например,

.в виде

печатной

копии,

микрофильма -и т. д.

 

 

 

 

Сжатие

данных

Файл

"^документов!

Сопряжение

палъаооателя

(Польза А \ватель J

Рис. 1-1. Модель информационной системы.

При втором способе обработки производится «сжа ­ тие» информации в документах; это выполняется спе­

циальными

программами . Н а б о р

таких программ

 

будет

•в д а л ь н е й ш е м называться программами Сжатия

данных

или .просто

сжатием данных.

 

 

 

 

 

П р и с ж а т и и из

документа извлекается значимая ин­

формация,

которая

заносится

в

специальный

ф а й л , на­

зываемый

Файлом

ссылок. Этот

файл играет

р о л ь

спра­

вочника; объем его

меньше, чем

объем Файла

 

докумен­

тов. Файл

ссылок

содержит

конспекты, рефераты

или

далее некоторые разделы документов. В последнем слу­

чае его можно использовать .вместо Файла

документов.

Пользователь

вначале,

как

правило,

о б р а щ а е т с я

к Файлу

ссылок,

с помощью

которого

определяется тре ­

буемый

раздел Файла документов.

З а

т е м

при необхрди-

3

Мости пользователь обращается к полным документам,

содержащимся в Файле

документов.

Сжатие данных обычно выполняется с помощью од­

ного из двух известных методов. Эти методы называются

индексацией

и 'реферированием.

 

 

 

Индексация — это процесс назначения

документу дес­

крипторов (описателей), называемых

(ів

зависимости

от

используемой

терминологии) т а к ж е

терминами или

яр­

лыками . Дескрипторы кратко о т р а ж а ю т тематику доку­

мента. Они хранятся в Файле

ссылок

и д а ю т

возмож ­

ность найти нужный документ.

 

 

 

Индексация выполняется человеком и требует опре­

деленных з а т р а т умственного

труда. От

качества

ее вы ­

полнения зависит успех поиска документов. Проводимые исследования [Л. 1, 2] по назначению дескрипторов с по­

мощью Э В М не привели к положительным

результатам,

поэтому в б л и ж а й ш е м

будущем индексация,

как н

преж ­

де, будет выполняться

людьми .

 

 

Реферирование — это составление р е ф е р а т а ,

являю ­

щегося кратким изложением на естественном языке ос­ новного содержания документа. В настоящее время обычно используются рефераты двух видов: информаци ­ онные рефераты и указательные р е ф е р а т ы .

Информационный реферат содержит данные, извле ­

каемые -непосредственно из самого документа.

Поэтому

его иногда можно использовать в

качестве заменителя

документа.

 

 

 

 

 

 

 

 

 

 

 

 

Указательный

реферат,

используемый

в

основном

в 'библиотеках,

содержит название

документа

 

его

краткую характеристику. Этот реферат указывает

т а к ж е

местонахождение документа в библиотеке.

 

 

 

 

Итак,

мы

р а з о б р а л и

процесс

занесения

в

информа ­

цию систему

данных, поставляемых

Генератором.

 

Н а

рис. 1-1 этот

процесс

показан

широкими

стрелками.

Рассмотрим

теперь получение

Пользователем

 

информа ­

ции из системы.

 

 

 

 

 

 

 

 

 

 

 

•Пользователь

обращается

к информационной

системе

посредством

т а к

 

называемого

Сопряжения

пользователя.

Сопряжение

обеспечивает

пользователю

ввод — вывод

информации из

системы. В качестве Сопряжения

 

может

использоваться

человек

(например,

библиотекарь)

либо

телетайп, связанный с ЭВМ .

 

 

 

 

 

 

 

Поток

информации

от

Сопряжения

пользователя

к ф а й л а м

почти

 

полностью

проходит через

Файл

 

ссылок,

9

Соседние файлы в папке книги из ГПНТБ