
книги из ГПНТБ / Левковиц, Д. Структуры информационных массивов оперативных систем
.pdf
Д . Л Е Ф К О В И Ц
СТРУКТУРЫ
ИНФОРМАЦИОННЫХ
МАССИВОВ
ОПЕРАТИВНЫХ
СИСТЕМ
Перевод с |
английского"В. |
А. Брудно, |
Б. |
И. |
Кимельфсльда, |
Я- |
А. Когана под |
редакцией |
О. |
И. |
Авена |
« Э Н Е Р Г И Я »
МОСКВА 1С;1'""'"
У
6Ф7 |
|
Л 53 |
|
УДК 681 .3:658.5.011 В6НАУЧНС |
САГ; |
БИБЛИОТіІ, |
- С С Р |
Лефковиц Д .
Л 53 Структуры информационных массивов . опера тивных систем. Пер . с англ. По д ред. О. И. Авена. М., «Энергия», 1973.
208с. с ил.
Вкниге рассматриваются способы формирования массивов инфор мации. Устанавливается связь между структурой массивов и требо ваниями автоматизированных информационных систем. Анализируются два основных типа информационных структур: ассоциативный п иерар хический. Излагаются методы формирования массивов, позволяющие удовлетворить ограничениям по объему памяти и времени поиска.
Книга предназначена для инженеров, разрабатывающих матема тическое обеспечение ЦВМ и участвующих в создании автоматизиро ванных систем управления.
Л |
3313-267 |
168-73 |
6Ф7 |
О51(0І)-73 |
© Перевод на русский язык, «Энергия», 1973.
D. Lefkovitz
Eile structure for on-line systems
Spartan books, New York — Washington.
Давид Лефковиц
СТРУКТУРЫ ИНФОРМАЦИОННЫХ МАССИВОВ ОПЕРАТИВНЫХ СИСТЕМ
Редактор издательства £. Я. Сальников Технический редактор Т. Н. Хромова Обложка художника А. А. Иванова
Корректор А. Д. Халанская
Сдано в набор 28/II |
1973 г. |
Подписано к печати 23/Х 1973 г. |
Формат 84ХЮ8'/эа |
|
Бумага типографская № 2 |
Усл. печ. л. 10,92 |
|
Уч.-нзд. л. 11,57 |
Ті раж 8 ООО экз. |
Зак. 88 |
Цена 76 ког> |
Издательство «Энергия». Москва, М-114, Шлюзовая наб.. 10.
Московская типография № 10 Согозполнграфпрома |
|
при Государственном комитете Совета Министров СССР |
|
по делам издательств, полиграфии и книжной |
торговли, |
• '-'*-'" Шлюзовая наб., 10. |
. |
П Р Е Д И С Л О В И Е К Р У С С К О М У И З Д А Н И Ю
Одна из основных проблем при разработке любой авто матизированной системы урравлеі-шя заключается -в фор мировании и соответствующей организации информаци онных массивов ( ф а й л о в ) . Качество организации фай лов, т. е. .рациональность структуры и правильность .раз мещения на машинных носителях, решающим образом сказывается на эффективности использования вычисли тельной машины . Огромный объем разнородной 'инфор мации в организационных система;., с одной стороны, и ограниченные, как правило, машинные . ресурсы — с дру гой, обусловливают значительную сложность решения задачи организации файлов . Особенно это справедливо для олеративных систем, работающих в реальном масштабе времени.
Книга Д . Лефковица является одной из первых книг, целиком посвященных вопросам организации файлов в оперативных системах. Она рассчитана на квалифици рованных специалистов по системам и программирова
нию и |
имеет четкую практическую направленность. Наи |
||
большую ценность в ней представляют |
методологичес |
||
кие вопросы, связанные с проектированием |
информаци |
||
онных |
систем. |
|
|
Следует отметить, что книга написана трудным язы |
|||
ком, с |
несвойственными, вообще говоря, |
английскому |
|
языку длинными предложениями . |
|
|
|
Трудности перевода усугублялись -также отсутствием |
|||
единой |
общепринятой терминологии на |
.русском языке |
в области вычислительной техники вообще и по инфор
мационным |
системам в частности. Так, например, |
нет |
||
с т а н о в и в ш и х с я |
терминов, эквивалентных |
английским |
||
• е, trailer, |
item |
и т. д. Поэтому в подобных |
случаях |
пе |
реводчики использовали термины, получившие распрост ранение среди специалистов. по вычислительной технике.
Доктор техн. наук О. И. Авен
П Р Е Д И С Л О В И Е А В Т О Р А
Постоянно растущий интерес к вопросам разработки структур файлов побудил автора выпустить настоящую
книгу. |
В книге |
в основном изложен материал лекций, |
|||||
прочитанных специалистам, р а б о т а ю щ и м в области |
обра |
||||||
ботки данных. Некоторые вопросы в ней |
рассмотрены |
||||||
глубже. Н а п р и м е р полнее исследованы системные |
требо |
||||||
вания |
к объему |
памяти |
Э В М и времени |
отклика |
на |
за |
|
прос. Н а ч а л ь н ы е |
главы |
книги |
содержат |
изложение |
ос |
||
новных |
понятий, |
позволяющих |
выявить |
соотношения |
между функциональными требованиями системы и про
ектными критериями структуры |
ф а й л а . |
||
З а д а н и е |
структуры файлов |
в |
оперативных системах |
определяет |
возможности работы |
программ пользовате |
лей (программируемые системы) и информационно-по исковых систем. Требования последних к структуре фай ла обычно более жестки . Это объясняется значительно большим числом входных ключей, необходимостью до
ступа к файлу по составному ключу |
(т. |
е. |
логической |
|||||||
комбинации ключей) |
и существенно |
большим |
объемом |
|||||||
данных по сравнению с системами |
первого |
типа. |
|
|||||||
Д л я |
программируемых |
систем |
в а ж н о |
время |
отклика |
|||||
на запрос. Возникающие при этом проблемы |
з а д а н и я |
|||||||||
структур |
файлов |
обычно |
легко решаются при |
упроще |
||||||
нии доступа к файлу . |
Рассмотрим например, |
к а к зада |
||||||||
ется структура |
при |
формировании |
выходного |
ф а й л а |
||||||
в оперативных программируемых системах. |
|
|
||||||||
Поскольку объем выходных данных, генерируемый |
||||||||||
данной программой |
в |
течение |
некоторого |
интервала |
||||||
времени, |
заранее неизвестен (за |
исключением, |
может |
быть, его оценки сверху, указанной системой или про граммистом), р а з м е щ е н и е выходных данных в запоми нающем устройстве памяти прямого доступа ( З У П Д ) эффективно осуществляется с помощью последователь ной списковой структуры. При помощи строки, состоя щей из 72 символов или нескольких таких строк, можно
4
по имени или ключу открыть в З У П Д файл, отнесенный к программе или терминалу . Если объем данных, гене рируемых программой, превышает емкость буферной па мяти, отведенной открытому файлу, то к ней с помощью
адреса связи м о ж н о присоединить другую буферную |
па |
|||
мять, поскольку прилегающий на диске |
отрезок |
памяти |
||
мог |
быть отведен тем временем другой |
программе . |
Та |
|
кая |
списковая структура был'впервые |
описана |
в [Л. |
8] |
под названием последовательного списка. Такой список легко строится, экономичен по объему памяти и прост при выборке. Это объясняется тем, что в последующей
обработке участвует к а ж д а я затгись списка |
(т. е. |
|
к а ж |
|
дое звено .в последовательности). Однако, |
если |
разре |
||
шить вход в файл по составному ключу, |
ситуация |
не |
||
сколько усложняется >и возникает вопрос |
об |
эффектив |
||
ности выборки из списка, так как теперь |
нужной |
ока |
||
зывается не к а ж д а я запись. Поясним этот случай. |
Пусть |
с каждой выходной буферной памятью связан дополни
тельный |
ключ, |
указывающий выходное устройство |
(в этом |
случае |
записи приобретают логическую значи |
мость, поскольку ф а й л больше не является единым пото
ком д а н н ы х ) . Если возникает ситуация, когда |
желатель |
|||
но получить доступ к «следующей |
выходной записи д л я |
|||
П р о г р а м м ы X, п о д л е ж а щ е й |
печати |
на А Ц П У » , |
то |
файл |
можно организовать, например, следующими |
разными |
|||
способами: 1) н а р а щ и в а т ь |
список |
записей |
с |
меткой |
«Программа», помечая их после доступа меткой «Терми
нал»; 2) составлять, список с меткой «Терминал» |
и клас |
сифицировать записи по метке « П р о г р а м м а » ; 3) |
состав |
лять список по обеим меткам и выбирать записи из более короткого списка. Последнюю структуру файла обычно называют последовательным мультисписком или просто мультисписком [Л. 10]. Приведенный пример иллюстри рует различие м е ж д у записями с одним и несколькими ключами. Д л я генерирования и обслуживания входных, промежуточных, выходных и программных файлов про граммируемых систем обычно достаточно простого последовательного списка. Структура файлов информаци
онных систем, |
с другой |
стороны, |
часто является миого- |
|
ключевой, требующей |
при проектировании |
рассмотре |
||
ния: времени |
отклика |
системы в |
различных |
условиях, |
скорости обновления, качества допоисковой статистики, простоты .программирования и экономичности списковой структуры по времени « пространству памяти.
5
В настоящей книге в качестве примера для |
рассмот |
рения структур оперативных файлов в ы б р а н а |
информа |
ционно-поисковая система. Это сделано в значительной мере потому, что алгоритмы управления файлом для программируемых систем можно легко получить из со
ответствующих алгоритмов |
д л я информационно-поиско |
|
вых |
систем. |
|
В |
гл. 1 сопоставляются |
функции структуры ф а й л а и |
требования автоматизированной информационной систе
мы. В |
гл. 2 описываются устройства памяти |
прямого до |
ступа, |
которые подразделяются на три класса и вводятся |
|
т а к ж е |
понятия, связывающие эти устройства |
с характе |
ристиками проектируемого математического обеспечения. В гл. 3 у к а з ы в а ю т с я различия между понятиями инфор мационной структуры и структуры файла, причем первая определяется как внутреннее свойство информации, по
рожденное |
|
формируемое |
человеком — пользователем |
||||||
системы, |
в |
то в р е м я |
как второе |
понятие представляет |
|||||
H |
|
|
|
|
|
|
|
||
собой средство, с помощью которого |
проектировщик |
||||||||
системы |
программно |
организует данные |
в ф а й л ы |
для |
|||||
выборки |
и |
обновления этих |
данных. Анализируются |
два |
|||||
основных |
типа структуры файла — ассоцнатпвныиііерар - |
||||||||
хнческнй. |
Процесс проектирования файла рассматри |
||||||||
вается в этой главе с точки |
зрения |
формирования |
управ |
||||||
ляющей |
информации |
для записей |
и подзаписей |
ф а й л а , |
соответствующей требованиям структуры. В гл. 4 описы вается структура файла с точки зрения языка запроса, который является посредником между пользователем
исистемой файлов . В гл. 5 классифицируются все
методы, описанные в оставшейся части книги. Р а с с м а т риваются их общие характеристики и основные области применения. В этой главе, кроме того, сформулированы
две |
ступени |
процесса |
выборки: справочное |
декодирова |
|||
ние |
и поиск |
файла. |
В |
гл. 6 представлены |
различные |
ме |
|
тоды проектирования и построения справочников |
и |
их |
|||||
декодеров вместе с соответствующими оценками |
по объе |
||||||
му памяти и времени отклика. В гл. 6 приводятся |
методы |
||||||
организации |
ф а й л о в |
искомых записей, при этом |
даются |
соответствующие оценки по объему памяти и времени отклика. В последней главе книги рассматриваются во просы оперативного обновления и обслуживания файлов различных структур, описанных в гл. 7.
Автор
|
ГЛАВА |
ПЕРВАЯ |
|
И Н Ф О Р М А Ц И О Н Н АЯ СИСТЕМА |
|
||
1-1. МОДЕЛЬ ИНФОРМАЦИОННОЙ СИСТЕМЫ |
|||
И н ф о р м а ц и о н н ая |
система |
представляет собой |
весьма |
сложную особую |
систему |
связи, существенно |
отличаю |
щуюся от других известных систем связи. Так, например, система телефонной связи предназначена для переклю чения линий между различными абонентами; при этом все абоненты обладают равными .правами, являясь од новременно передатчиками и приемниками информации .
Л ю б а я обработка информации в |
системе |
телефонной |
связи приводит « ее искажению . |
|
|
В информационной ж е системе, |
в отличие |
от системы |
телефонной связи, переключаются « е линии, а информа ционные массивы — файлы J .
Пользователи этой системы эксплуатируют ее в соот ветствии с индивидуальными запросами . Кроме того, информационная система определенным образом обра
батывает |
информацию . |
|
|
|
|
|
|
|
||
Всех пользователей информационной системы м о ж н о |
||||||||||
поделить |
на два класса. " Пользователи, |
относящиеся |
||||||||
к первому |
классу |
(назовем |
их |
Генераторами), |
заносят |
|||||
информацию |
в систему, |
а |
пользователи, |
относящиеся |
||||||
ко второму |
классу |
(назовем |
их |
Пользователями), |
полу |
|||||
чают информацию из системы. Некоторые |
пользователи |
|||||||||
могут п р и н а д л е ж а т ь к обоим |
классам . |
|
|
|
||||||
Рассмотрим модель информационной системы, изо |
||||||||||
браженную на рис. |
1-1. |
И н ф о р м а ц и я хранится |
в системе"' |
|||||||
в виде файлов . Генераторы |
|
помещают |
в систему Доку |
|||||||
менты— монографии, периодические |
издания, |
отчеты, |
||||||||
различные |
сообщения, |
а |
т а к ж е |
графические |
изображе |
|||||
ния и звуко- и телевизионные |
записи. |
|
|
|
1 Файл (File)—это информационный массив, снабженный сим волическим именем, однозначно определяющим его в информацион ной системе. (Прим. пер.)
7
|
Д о к у м е н ты обрабатываются в системе двумя спосо |
|||||
бами . При |
.первом |
способе документы |
заносятся |
в т а к |
||
называемый |
Файл документов. |
Представление докумен |
||||
тов |
в файле зависит |
от выбранной формы кодирования; |
||||
их |
м о ж н о |
хранить, |
например, |
.в виде |
печатной |
копии, |
микрофильма -и т. д. |
|
|
|
|
Сжатие
данных
Файл
"^документов!
Сопряжение
палъаооателя
(Польза А \ватель J
Рис. 1-1. Модель информационной системы.
При втором способе обработки производится «сжа тие» информации в документах; это выполняется спе
циальными |
программами . Н а б о р |
таких программ |
|
будет |
|||
•в д а л ь н е й ш е м называться программами Сжатия |
данных |
||||||
или .просто |
сжатием данных. |
|
|
|
|
|
|
П р и с ж а т и и из |
документа извлекается значимая ин |
||||||
формация, |
которая |
заносится |
в |
специальный |
ф а й л , на |
||
зываемый |
Файлом |
ссылок. Этот |
файл играет |
р о л ь |
спра |
||
вочника; объем его |
меньше, чем |
объем Файла |
|
докумен |
|||
тов. Файл |
ссылок |
содержит |
конспекты, рефераты |
или |
далее некоторые разделы документов. В последнем слу
чае его можно использовать .вместо Файла |
документов. |
|||||
Пользователь |
вначале, |
как |
правило, |
о б р а щ а е т с я |
||
к Файлу |
ссылок, |
с помощью |
которого |
определяется тре |
||
буемый |
раздел Файла документов. |
З а |
т е м |
при необхрди- |
3
Мости пользователь обращается к полным документам,
содержащимся в Файле |
документов. |
Сжатие данных обычно выполняется с помощью од |
ного из двух известных методов. Эти методы называются
индексацией |
и 'реферированием. |
|
|
|
Индексация — это процесс назначения |
документу дес |
|||
крипторов (описателей), называемых |
(ів |
зависимости |
от |
|
используемой |
терминологии) т а к ж е |
терминами или |
яр |
лыками . Дескрипторы кратко о т р а ж а ю т тематику доку
мента. Они хранятся в Файле |
ссылок |
и д а ю т |
возмож |
ность найти нужный документ. |
|
|
|
Индексация выполняется человеком и требует опре |
|||
деленных з а т р а т умственного |
труда. От |
качества |
ее вы |
полнения зависит успех поиска документов. Проводимые исследования [Л. 1, 2] по назначению дескрипторов с по
мощью Э В М не привели к положительным |
результатам, |
||
поэтому в б л и ж а й ш е м |
будущем индексация, |
как н |
преж |
де, будет выполняться |
людьми . |
|
|
Реферирование — это составление р е ф е р а т а , |
являю |
щегося кратким изложением на естественном языке ос новного содержания документа. В настоящее время обычно используются рефераты двух видов: информаци онные рефераты и указательные р е ф е р а т ы .
Информационный реферат содержит данные, извле
каемые -непосредственно из самого документа. |
Поэтому |
||||||||||||
его иногда можно использовать в |
качестве заменителя |
||||||||||||
документа. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Указательный |
реферат, |
используемый |
в |
основном |
|||||||||
в 'библиотеках, |
содержит название |
документа |
|
-и |
его |
||||||||
краткую характеристику. Этот реферат указывает |
т а к ж е |
||||||||||||
местонахождение документа в библиотеке. |
|
|
|
|
|||||||||
Итак, |
мы |
р а з о б р а л и |
процесс |
занесения |
в |
информа |
|||||||
цию систему |
данных, поставляемых |
Генератором. |
|
Н а |
|||||||||
рис. 1-1 этот |
процесс |
показан |
широкими |
стрелками. |
|||||||||
Рассмотрим |
теперь получение |
Пользователем |
|
информа |
|||||||||
ции из системы. |
|
|
|
|
|
|
|
|
|
|
|
||
•Пользователь |
обращается |
к информационной |
системе |
||||||||||
посредством |
т а к |
|
называемого |
Сопряжения |
пользователя. |
||||||||
Сопряжение |
обеспечивает |
пользователю |
ввод — вывод |
||||||||||
информации из |
системы. В качестве Сопряжения |
|
может |
||||||||||
использоваться |
человек |
(например, |
библиотекарь) |
либо |
|||||||||
телетайп, связанный с ЭВМ . |
|
|
|
|
|
|
|
||||||
Поток |
информации |
от |
Сопряжения |
пользователя |
|||||||||
к ф а й л а м |
почти |
|
полностью |
проходит через |
Файл |
|
ссылок, |
9