 
        
        книги из ГПНТБ / Левковиц, Д. Структуры информационных массивов оперативных систем
.pdf 
Д . Л Е Ф К О В И Ц
СТРУКТУРЫ
ИНФОРМАЦИОННЫХ
МАССИВОВ
ОПЕРАТИВНЫХ
СИСТЕМ
| Перевод с | английского"В. | А. Брудно, | Б. | И. | Кимельфсльда, | 
| Я- | А. Когана под | редакцией | О. | И. | Авена | 
« Э Н Е Р Г И Я »
МОСКВА 1С;1'""'"
У
| 6Ф7 | 
 | 
| Л 53 | 
 | 
| УДК 681 .3:658.5.011 В6НАУЧНС | САГ; | 
| БИБЛИОТіІ, | - С С Р | 
Лефковиц Д .
Л 53 Структуры информационных массивов . опера тивных систем. Пер . с англ. По д ред. О. И. Авена. М., «Энергия», 1973.
208с. с ил.
Вкниге рассматриваются способы формирования массивов инфор мации. Устанавливается связь между структурой массивов и требо ваниями автоматизированных информационных систем. Анализируются два основных типа информационных структур: ассоциативный п иерар хический. Излагаются методы формирования массивов, позволяющие удовлетворить ограничениям по объему памяти и времени поиска.
Книга предназначена для инженеров, разрабатывающих матема тическое обеспечение ЦВМ и участвующих в создании автоматизиро ванных систем управления.
| Л | 3313-267 | 168-73 | 6Ф7 | 
| О51(0І)-73 | 
© Перевод на русский язык, «Энергия», 1973.
D. Lefkovitz
Eile structure for on-line systems
Spartan books, New York — Washington.
Давид Лефковиц
СТРУКТУРЫ ИНФОРМАЦИОННЫХ МАССИВОВ ОПЕРАТИВНЫХ СИСТЕМ
Редактор издательства £. Я. Сальников Технический редактор Т. Н. Хромова Обложка художника А. А. Иванова
Корректор А. Д. Халанская
| Сдано в набор 28/II | 1973 г. | Подписано к печати 23/Х 1973 г. | 
| Формат 84ХЮ8'/эа | 
 | Бумага типографская № 2 | 
| Усл. печ. л. 10,92 | 
 | Уч.-нзд. л. 11,57 | 
| Ті раж 8 ООО экз. | Зак. 88 | Цена 76 ког> | 
Издательство «Энергия». Москва, М-114, Шлюзовая наб.. 10.
| Московская типография № 10 Согозполнграфпрома | |
| при Государственном комитете Совета Министров СССР | |
| по делам издательств, полиграфии и книжной | торговли, | 
| • '-'*-'" Шлюзовая наб., 10. | . | 
П Р Е Д И С Л О В И Е К Р У С С К О М У И З Д А Н И Ю
Одна из основных проблем при разработке любой авто матизированной системы урравлеі-шя заключается -в фор мировании и соответствующей организации информаци  онных массивов ( ф а й л о в ) . Качество организации фай  лов, т. е. .рациональность структуры и правильность .раз мещения на машинных носителях, решающим образом сказывается на эффективности использования вычисли тельной машины . Огромный объем разнородной 'инфор мации в организационных система;., с одной стороны, и ограниченные, как правило, машинные . ресурсы — с дру гой, обусловливают значительную сложность решения задачи организации файлов . Особенно это справедливо для олеративных систем, работающих в реальном масштабе времени.
Книга Д . Лефковица является одной из первых книг, целиком посвященных вопросам организации файлов в оперативных системах. Она рассчитана на квалифици  рованных специалистов по системам и программирова 
| нию и | имеет четкую практическую направленность. Наи  | ||
| большую ценность в ней представляют | методологичес | ||
| кие вопросы, связанные с проектированием | информаци  | ||
| онных | систем. | 
 | 
 | 
| Следует отметить, что книга написана трудным язы | |||
| ком, с | несвойственными, вообще говоря, | английскому | |
| языку длинными предложениями . | 
 | 
 | |
| Трудности перевода усугублялись -также отсутствием | |||
| единой | общепринятой терминологии на | .русском языке | |
в области вычислительной техники вообще и по инфор
| мационным | системам в частности. Так, например, | нет | ||
| с т а н о в и в ш и х с я | терминов, эквивалентных | английским | ||
| • е, trailer, | item | и т. д. Поэтому в подобных | случаях | пе | 
реводчики использовали термины, получившие распрост ранение среди специалистов. по вычислительной технике.
Доктор техн. наук О. И. Авен
П Р Е Д И С Л О В И Е А В Т О Р А
Постоянно растущий интерес к вопросам разработки структур файлов побудил автора выпустить настоящую
| книгу. | В книге | в основном изложен материал лекций, | |||||
| прочитанных специалистам, р а б о т а ю щ и м в области | обра | ||||||
| ботки данных. Некоторые вопросы в ней | рассмотрены | ||||||
| глубже. Н а п р и м е р полнее исследованы системные | требо | ||||||
| вания | к объему | памяти | Э В М и времени | отклика | на | за | |
| прос. Н а ч а л ь н ы е | главы | книги | содержат | изложение | ос | ||
| новных | понятий, | позволяющих | выявить | соотношения | |||
между функциональными требованиями системы и про
| ектными критериями структуры | ф а й л а . | ||
| З а д а н и е | структуры файлов | в | оперативных системах | 
| определяет | возможности работы | программ пользовате | |
лей (программируемые системы) и информационно-по исковых систем. Требования последних к структуре фай  ла обычно более жестки . Это объясняется значительно большим числом входных ключей, необходимостью до
| ступа к файлу по составному ключу | (т. | е. | логической | |||||||
| комбинации ключей) | и существенно | большим | объемом | |||||||
| данных по сравнению с системами | первого | типа. | 
 | |||||||
| Д л я | программируемых | систем | в а ж н о | время | отклика | |||||
| на запрос. Возникающие при этом проблемы | з а д а н и я | |||||||||
| структур | файлов | обычно | легко решаются при | упроще | ||||||
| нии доступа к файлу . | Рассмотрим например, | к а к зада  | ||||||||
| ется структура | при | формировании | выходного | ф а й л а | ||||||
| в оперативных программируемых системах. | 
 | 
 | ||||||||
| Поскольку объем выходных данных, генерируемый | ||||||||||
| данной программой | в | течение | некоторого | интервала | ||||||
| времени, | заранее неизвестен (за | исключением, | может | |||||||
быть, его оценки сверху, указанной системой или про граммистом), р а з м е щ е н и е выходных данных в запоми  нающем устройстве памяти прямого доступа ( З У П Д ) эффективно осуществляется с помощью последователь ной списковой структуры. При помощи строки, состоя щей из 72 символов или нескольких таких строк, можно
4
по имени или ключу открыть в З У П Д файл, отнесенный к программе или терминалу . Если объем данных, гене рируемых программой, превышает емкость буферной па мяти, отведенной открытому файлу, то к ней с помощью
| адреса связи м о ж н о присоединить другую буферную | па | |||
| мять, поскольку прилегающий на диске | отрезок | памяти | ||
| мог | быть отведен тем временем другой | программе . | Та | |
| кая | списковая структура был'впервые | описана | в [Л. | 8] | 
под названием последовательного списка. Такой список легко строится, экономичен по объему памяти и прост при выборке. Это объясняется тем, что в последующей
| обработке участвует к а ж д а я затгись списка | (т. е. | 
 | к а ж  | |
| дое звено .в последовательности). Однако, | если | разре  | ||
| шить вход в файл по составному ключу, | ситуация | не | ||
| сколько усложняется >и возникает вопрос | об | эффектив  | ||
| ности выборки из списка, так как теперь | нужной | ока | ||
| зывается не к а ж д а я запись. Поясним этот случай. | Пусть | |||
с каждой выходной буферной памятью связан дополни
| тельный | ключ, | указывающий выходное устройство | 
| (в этом | случае | записи приобретают логическую значи | 
мость, поскольку ф а й л больше не является единым пото
| ком д а н н ы х ) . Если возникает ситуация, когда | желатель  | |||
| но получить доступ к «следующей | выходной записи д л я | |||
| П р о г р а м м ы X, п о д л е ж а щ е й | печати | на А Ц П У » , | то | файл | 
| можно организовать, например, следующими | разными | |||
| способами: 1) н а р а щ и в а т ь | список | записей | с | меткой | 
«Программа», помечая их после доступа меткой «Терми
| нал»; 2) составлять, список с меткой «Терминал» | и клас  | 
| сифицировать записи по метке « П р о г р а м м а » ; 3) | состав | 
лять список по обеим меткам и выбирать записи из более короткого списка. Последнюю структуру файла обычно называют последовательным мультисписком или просто мультисписком [Л. 10]. Приведенный пример иллюстри рует различие м е ж д у записями с одним и несколькими ключами. Д л я генерирования и обслуживания входных, промежуточных, выходных и программных файлов про граммируемых систем обычно достаточно простого последовательного списка. Структура файлов информаци 
| онных систем, | с другой | стороны, | часто является миого- | |
| ключевой, требующей | при проектировании | рассмотре | ||
| ния: времени | отклика | системы в | различных | условиях, | 
скорости обновления, качества допоисковой статистики, простоты .программирования и экономичности списковой структуры по времени « пространству памяти.
5
| В настоящей книге в качестве примера для | рассмот | 
| рения структур оперативных файлов в ы б р а н а | информа | 
ционно-поисковая система. Это сделано в значительной мере потому, что алгоритмы управления файлом для программируемых систем можно легко получить из со
| ответствующих алгоритмов | д л я информационно-поиско | |
| вых | систем. | 
 | 
| В | гл. 1 сопоставляются | функции структуры ф а й л а и | 
требования автоматизированной информационной систе
| мы. В | гл. 2 описываются устройства памяти | прямого до | 
| ступа, | которые подразделяются на три класса и вводятся | |
| т а к ж е | понятия, связывающие эти устройства | с характе  | 
ристиками проектируемого математического обеспечения. В гл. 3 у к а з ы в а ю т с я различия между понятиями инфор мационной структуры и структуры файла, причем первая определяется как внутреннее свойство информации, по
| рожденное | 
 | формируемое | человеком — пользователем | ||||||
| системы, | в | то в р е м я | как второе | понятие представляет | |||||
| H | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| собой средство, с помощью которого | проектировщик | ||||||||
| системы | программно | организует данные | в ф а й л ы | для | |||||
| выборки | и | обновления этих | данных. Анализируются | два | |||||
| основных | типа структуры файла — ассоцнатпвныиііерар - | ||||||||
| хнческнй. | Процесс проектирования файла рассматри  | ||||||||
| вается в этой главе с точки | зрения | формирования | управ  | ||||||
| ляющей | информации | для записей | и подзаписей | ф а й л а , | |||||
соответствующей требованиям структуры. В гл. 4 описы вается структура файла с точки зрения языка запроса, который является посредником между пользователем
исистемой файлов . В гл. 5 классифицируются все
методы, описанные в оставшейся части книги. Р а с с м а т  риваются их общие характеристики и основные области применения. В этой главе, кроме того, сформулированы
| две | ступени | процесса | выборки: справочное | декодирова | |||
| ние | и поиск | файла. | В | гл. 6 представлены | различные | ме | |
| тоды проектирования и построения справочников | и | их | |||||
| декодеров вместе с соответствующими оценками | по объе | ||||||
| му памяти и времени отклика. В гл. 6 приводятся | методы | ||||||
| организации | ф а й л о в | искомых записей, при этом | даются | ||||
соответствующие оценки по объему памяти и времени отклика. В последней главе книги рассматриваются во просы оперативного обновления и обслуживания файлов различных структур, описанных в гл. 7.
Автор
| 
 | ГЛАВА | ПЕРВАЯ | 
 | 
| И Н Ф О Р М А Ц И О Н Н АЯ СИСТЕМА | 
 | ||
| 1-1. МОДЕЛЬ ИНФОРМАЦИОННОЙ СИСТЕМЫ | |||
| И н ф о р м а ц и о н н ая | система | представляет собой | весьма | 
| сложную особую | систему | связи, существенно | отличаю | 
щуюся от других известных систем связи. Так, например, система телефонной связи предназначена для переклю  чения линий между различными абонентами; при этом все абоненты обладают равными .правами, являясь од новременно передатчиками и приемниками информации .
| Л ю б а я обработка информации в | системе | телефонной | 
| связи приводит « ее искажению . | 
 | 
 | 
| В информационной ж е системе, | в отличие | от системы | 
телефонной связи, переключаются « е линии, а информа  ционные массивы — файлы J .
Пользователи этой системы эксплуатируют ее в соот ветствии с индивидуальными запросами . Кроме того, информационная система определенным образом обра
| батывает | информацию . | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| Всех пользователей информационной системы м о ж н о | ||||||||||
| поделить | на два класса. " Пользователи, | относящиеся | ||||||||
| к первому | классу | (назовем | их | Генераторами), | заносят | |||||
| информацию | в систему, | а | пользователи, | относящиеся | ||||||
| ко второму | классу | (назовем | их | Пользователями), | полу | |||||
| чают информацию из системы. Некоторые | пользователи | |||||||||
| могут п р и н а д л е ж а т ь к обоим | классам . | 
 | 
 | 
 | ||||||
| Рассмотрим модель информационной системы, изо | ||||||||||
| браженную на рис. | 1-1. | И н ф о р м а ц и я хранится | в системе"' | |||||||
| в виде файлов . Генераторы | 
 | помещают | в систему Доку | |||||||
| менты— монографии, периодические | издания, | отчеты, | ||||||||
| различные | сообщения, | а | т а к ж е | графические | изображе  | |||||
| ния и звуко- и телевизионные | записи. | 
 | 
 | 
 | ||||||
1 Файл (File)—это информационный массив, снабженный сим волическим именем, однозначно определяющим его в информацион ной системе. (Прим. пер.)
7
| 
 | Д о к у м е н ты обрабатываются в системе двумя спосо | |||||
| бами . При | .первом | способе документы | заносятся | в т а к | ||
| называемый | Файл документов. | Представление докумен  | ||||
| тов | в файле зависит | от выбранной формы кодирования; | ||||
| их | м о ж н о | хранить, | например, | .в виде | печатной | копии, | 
| микрофильма -и т. д. | 
 | 
 | 
 | 
 | ||
Сжатие
данных
Файл
"^документов!
Сопряжение
палъаооателя
(Польза А \ватель J
Рис. 1-1. Модель информационной системы.
При втором способе обработки производится «сжа  тие» информации в документах; это выполняется спе
| циальными | программами . Н а б о р | таких программ | 
 | будет | |||
| •в д а л ь н е й ш е м называться программами Сжатия | данных | ||||||
| или .просто | сжатием данных. | 
 | 
 | 
 | 
 | 
 | |
| П р и с ж а т и и из | документа извлекается значимая ин | ||||||
| формация, | которая | заносится | в | специальный | ф а й л , на | ||
| зываемый | Файлом | ссылок. Этот | файл играет | р о л ь | спра | ||
| вочника; объем его | меньше, чем | объем Файла | 
 | докумен | |||
| тов. Файл | ссылок | содержит | конспекты, рефераты | или | |||
далее некоторые разделы документов. В последнем слу
| чае его можно использовать .вместо Файла | документов. | |||||
| Пользователь | вначале, | как | правило, | о б р а щ а е т с я | ||
| к Файлу | ссылок, | с помощью | которого | определяется тре  | ||
| буемый | раздел Файла документов. | З а | т е м | при необхрди- | ||
3
Мости пользователь обращается к полным документам,
| содержащимся в Файле | документов. | 
| Сжатие данных обычно выполняется с помощью од | |
ного из двух известных методов. Эти методы называются
| индексацией | и 'реферированием. | 
 | 
 | 
 | 
| Индексация — это процесс назначения | документу дес | |||
| крипторов (описателей), называемых | (ів | зависимости | от | |
| используемой | терминологии) т а к ж е | терминами или | яр | |
лыками . Дескрипторы кратко о т р а ж а ю т тематику доку
| мента. Они хранятся в Файле | ссылок | и д а ю т | возмож  | 
| ность найти нужный документ. | 
 | 
 | 
 | 
| Индексация выполняется человеком и требует опре | |||
| деленных з а т р а т умственного | труда. От | качества | ее вы  | 
полнения зависит успех поиска документов. Проводимые исследования [Л. 1, 2] по назначению дескрипторов с по
| мощью Э В М не привели к положительным | результатам, | ||
| поэтому в б л и ж а й ш е м | будущем индексация, | как н | преж  | 
| де, будет выполняться | людьми . | 
 | 
 | 
| Реферирование — это составление р е ф е р а т а , | являю  | ||
щегося кратким изложением на естественном языке ос новного содержания документа. В настоящее время обычно используются рефераты двух видов: информаци  онные рефераты и указательные р е ф е р а т ы .
Информационный реферат содержит данные, извле 
| каемые -непосредственно из самого документа. | Поэтому | ||||||||||||
| его иногда можно использовать в | качестве заменителя | ||||||||||||
| документа. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| Указательный | реферат, | используемый | в | основном | |||||||||
| в 'библиотеках, | содержит название | документа | 
 | -и | его | ||||||||
| краткую характеристику. Этот реферат указывает | т а к ж е | ||||||||||||
| местонахождение документа в библиотеке. | 
 | 
 | 
 | 
 | |||||||||
| Итак, | мы | р а з о б р а л и | процесс | занесения | в | информа  | |||||||
| цию систему | данных, поставляемых | Генератором. | 
 | Н а | |||||||||
| рис. 1-1 этот | процесс | показан | широкими | стрелками. | |||||||||
| Рассмотрим | теперь получение | Пользователем | 
 | информа  | |||||||||
| ции из системы. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| •Пользователь | обращается | к информационной | системе | ||||||||||
| посредством | т а к | 
 | называемого | Сопряжения | пользователя. | ||||||||
| Сопряжение | обеспечивает | пользователю | ввод — вывод | ||||||||||
| информации из | системы. В качестве Сопряжения | 
 | может | ||||||||||
| использоваться | человек | (например, | библиотекарь) | либо | |||||||||
| телетайп, связанный с ЭВМ . | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| Поток | информации | от | Сопряжения | пользователя | |||||||||
| к ф а й л а м | почти | 
 | полностью | проходит через | Файл | 
 | ссылок, | ||||||
9
