Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Левковиц, Д. Структуры информационных массивов оперативных систем

.pdf

Скачиваний:

Добавлен:

21.10.2023

Размер:

8.9 Mб

Скачать

☆

1 / 211 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 > Следующая >>>

Д . Л Е Ф К О В И Ц

СТРУКТУРЫ

ИНФОРМАЦИОННЫХ

МАССИВОВ

ОПЕРАТИВНЫХ

СИСТЕМ

Перевод с	английского"В.	А. Брудно,	Б.	И.	Кимельфсльда,
Я-	А. Когана под	редакцией	О.	И.	Авена

« Э Н Е Р Г И Я »

МОСКВА 1С;1'""'"

6Ф7
Л 53
УДК 681 .3:658.5.011 В6НАУЧНС	САГ;
БИБЛИОТіІ,	- С С Р

Лефковиц Д .

Л 53 Структуры информационных массивов . опера тивных систем. Пер . с англ. По д ред. О. И. Авена. М., «Энергия», 1973.

208с. с ил.

Вкниге рассматриваются способы формирования массивов инфор мации. Устанавливается связь между структурой массивов и требо ваниями автоматизированных информационных систем. Анализируются два основных типа информационных структур: ассоциативный п иерар хический. Излагаются методы формирования массивов, позволяющие удовлетворить ограничениям по объему памяти и времени поиска.

Книга предназначена для инженеров, разрабатывающих матема тическое обеспечение ЦВМ и участвующих в создании автоматизиро ванных систем управления.

Л	3313-267	168-73	6Ф7
	О51(0І)-73

D. Lefkovitz

Eile structure for on-line systems

Spartan books, New York — Washington.

Давид Лефковиц

СТРУКТУРЫ ИНФОРМАЦИОННЫХ МАССИВОВ ОПЕРАТИВНЫХ СИСТЕМ

Редактор издательства £. Я. Сальников Технический редактор Т. Н. Хромова Обложка художника А. А. Иванова

Корректор А. Д. Халанская

Сдано в набор 28/II	1973 г.	Подписано к печати 23/Х 1973 г.
Формат 84ХЮ8'/эа		Бумага типографская № 2
Усл. печ. л. 10,92		Уч.-нзд. л. 11,57
Ті раж 8 ООО экз.	Зак. 88	Цена 76 ког>

Издательство «Энергия». Москва, М-114, Шлюзовая наб.. 10.

Московская типография № 10 Согозполнграфпрома
при Государственном комитете Совета Министров СССР
по делам издательств, полиграфии и книжной	торговли,
• '-'*-'" Шлюзовая наб., 10.	.

П Р Е Д И С Л О В И Е К Р У С С К О М У И З Д А Н И Ю

Одна из основных проблем при разработке любой авто матизированной системы урравлеі-шя заключается -в фор мировании и соответствующей организации информаци онных массивов ( ф а й л о в ) . Качество организации фай лов, т. е. .рациональность структуры и правильность .раз мещения на машинных носителях, решающим образом сказывается на эффективности использования вычисли тельной машины . Огромный объем разнородной 'инфор мации в организационных система;., с одной стороны, и ограниченные, как правило, машинные . ресурсы — с дру гой, обусловливают значительную сложность решения задачи организации файлов . Особенно это справедливо для олеративных систем, работающих в реальном масштабе времени.

Книга Д . Лефковица является одной из первых книг, целиком посвященных вопросам организации файлов в оперативных системах. Она рассчитана на квалифици рованных специалистов по системам и программирова

нию и	имеет четкую практическую направленность. Наи
большую ценность в ней представляют		методологичес
кие вопросы, связанные с проектированием			информаци
онных	систем.
Следует отметить, что книга написана трудным язы
ком, с	несвойственными, вообще говоря,		английскому
языку длинными предложениями .
Трудности перевода усугублялись -также отсутствием
единой	общепринятой терминологии на	.русском языке

в области вычислительной техники вообще и по инфор

мационным	системам в частности. Так, например,			нет
с т а н о в и в ш и х с я		терминов, эквивалентных	английским
• е, trailer,	item	и т. д. Поэтому в подобных	случаях	пе

реводчики использовали термины, получившие распрост ранение среди специалистов. по вычислительной технике.

Доктор техн. наук О. И. Авен

П Р Е Д И С Л О В И Е А В Т О Р А

Постоянно растущий интерес к вопросам разработки структур файлов побудил автора выпустить настоящую

книгу.	В книге	в основном изложен материал лекций,
прочитанных специалистам, р а б о т а ю щ и м в области						обра
ботки данных. Некоторые вопросы в ней					рассмотрены
глубже. Н а п р и м е р полнее исследованы системные						требо
вания	к объему	памяти	Э В М и времени		отклика	на	за
прос. Н а ч а л ь н ы е		главы	книги	содержат	изложение		ос
новных	понятий,	позволяющих		выявить	соотношения

между функциональными требованиями системы и про

ектными критериями структуры		ф а й л а .
З а д а н и е	структуры файлов	в	оперативных системах
определяет	возможности работы		программ пользовате

лей (программируемые системы) и информационно-по исковых систем. Требования последних к структуре фай ла обычно более жестки . Это объясняется значительно большим числом входных ключей, необходимостью до


ступа к файлу по составному ключу							(т.	е.	логической
комбинации ключей)			и существенно				большим			объемом
данных по сравнению с системами						первого		типа.
Д л я	программируемых				систем	в а ж н о		время		отклика
на запрос. Возникающие при этом проблемы										з а д а н и я
структур	файлов	обычно			легко решаются при					упроще
нии доступа к файлу .				Рассмотрим например,					к а к зада
ется структура		при	формировании				выходного			ф а й л а
в оперативных программируемых системах.
Поскольку объем выходных данных, генерируемый
данной программой			в	течение		некоторого			интервала
времени,	заранее неизвестен (за					исключением,				может

быть, его оценки сверху, указанной системой или про граммистом), р а з м е щ е н и е выходных данных в запоми нающем устройстве памяти прямого доступа ( З У П Д ) эффективно осуществляется с помощью последователь ной списковой структуры. При помощи строки, состоя щей из 72 символов или нескольких таких строк, можно

по имени или ключу открыть в З У П Д файл, отнесенный к программе или терминалу . Если объем данных, гене рируемых программой, превышает емкость буферной па мяти, отведенной открытому файлу, то к ней с помощью

адреса связи м о ж н о присоединить другую буферную				па
мять, поскольку прилегающий на диске		отрезок	памяти
мог	быть отведен тем временем другой	программе .		Та
кая	списковая структура был'впервые	описана	в [Л.	8]

под названием последовательного списка. Такой список легко строится, экономичен по объему памяти и прост при выборке. Это объясняется тем, что в последующей

обработке участвует к а ж д а я затгись списка		(т. е.		к а ж
дое звено .в последовательности). Однако,	если		разре
шить вход в файл по составному ключу,	ситуация			не
сколько усложняется >и возникает вопрос	об	эффектив
ности выборки из списка, так как теперь	нужной			ока
зывается не к а ж д а я запись. Поясним этот случай.			Пусть

с каждой выходной буферной памятью связан дополни

тельный	ключ,	указывающий выходное устройство
(в этом	случае	записи приобретают логическую значи

мость, поскольку ф а й л больше не является единым пото

ком д а н н ы х ) . Если возникает ситуация, когда			желатель
но получить доступ к «следующей		выходной записи д л я
П р о г р а м м ы X, п о д л е ж а щ е й	печати	на А Ц П У » ,	то	файл
можно организовать, например, следующими			разными
способами: 1) н а р а щ и в а т ь	список	записей	с	меткой

«Программа», помечая их после доступа меткой «Терми

нал»; 2) составлять, список с меткой «Терминал»	и клас
сифицировать записи по метке « П р о г р а м м а » ; 3)	состав

лять список по обеим меткам и выбирать записи из более короткого списка. Последнюю структуру файла обычно называют последовательным мультисписком или просто мультисписком [Л. 10]. Приведенный пример иллюстри рует различие м е ж д у записями с одним и несколькими ключами. Д л я генерирования и обслуживания входных, промежуточных, выходных и программных файлов про граммируемых систем обычно достаточно простого последовательного списка. Структура файлов информаци

онных систем,	с другой	стороны,	часто является миого-
ключевой, требующей		при проектировании		рассмотре
ния: времени	отклика	системы в	различных	условиях,

скорости обновления, качества допоисковой статистики, простоты .программирования и экономичности списковой структуры по времени « пространству памяти.

В настоящей книге в качестве примера для	рассмот
рения структур оперативных файлов в ы б р а н а	информа

ционно-поисковая система. Это сделано в значительной мере потому, что алгоритмы управления файлом для программируемых систем можно легко получить из со

ответствующих алгоритмов		д л я информационно-поиско
вых	систем.
В	гл. 1 сопоставляются	функции структуры ф а й л а и

требования автоматизированной информационной систе

мы. В	гл. 2 описываются устройства памяти	прямого до
ступа,	которые подразделяются на три класса и вводятся
т а к ж е	понятия, связывающие эти устройства	с характе

ристиками проектируемого математического обеспечения. В гл. 3 у к а з ы в а ю т с я различия между понятиями инфор мационной структуры и структуры файла, причем первая определяется как внутреннее свойство информации, по

рожденное			формируемое		человеком — пользователем
системы,	в	то в р е м я		как второе		понятие представляет
		H
собой средство, с помощью которого							проектировщик
системы	программно			организует данные			в ф а й л ы		для
выборки	и	обновления этих			данных. Анализируются				два
основных	типа структуры файла — ассоцнатпвныиііерар -
хнческнй.		Процесс проектирования файла рассматри
вается в этой главе с точки					зрения	формирования		управ
ляющей	информации			для записей		и подзаписей		ф а й л а ,

соответствующей требованиям структуры. В гл. 4 описы вается структура файла с точки зрения языка запроса, который является посредником между пользователем

исистемой файлов . В гл. 5 классифицируются все

методы, описанные в оставшейся части книги. Р а с с м а т риваются их общие характеристики и основные области применения. В этой главе, кроме того, сформулированы


две	ступени	процесса		выборки: справочное	декодирова
ние	и поиск	файла.	В	гл. 6 представлены	различные		ме
тоды проектирования и построения справочников						и	их
декодеров вместе с соответствующими оценками						по объе
му памяти и времени отклика. В гл. 6 приводятся						методы
организации		ф а й л о в	искомых записей, при этом			даются

соответствующие оценки по объему памяти и времени отклика. В последней главе книги рассматриваются во просы оперативного обновления и обслуживания файлов различных структур, описанных в гл. 7.

Автор

	ГЛАВА	ПЕРВАЯ
И Н Ф О Р М А Ц И О Н Н АЯ СИСТЕМА
1-1. МОДЕЛЬ ИНФОРМАЦИОННОЙ СИСТЕМЫ
И н ф о р м а ц и о н н ая	система	представляет собой	весьма
сложную особую	систему	связи, существенно	отличаю

щуюся от других известных систем связи. Так, например, система телефонной связи предназначена для переклю чения линий между различными абонентами; при этом все абоненты обладают равными .правами, являясь од новременно передатчиками и приемниками информации .

Л ю б а я обработка информации в	системе	телефонной
связи приводит « ее искажению .
В информационной ж е системе,	в отличие	от системы

телефонной связи, переключаются « е линии, а информа ционные массивы — файлы J .

Пользователи этой системы эксплуатируют ее в соот ветствии с индивидуальными запросами . Кроме того, информационная система определенным образом обра


батывает	информацию .
Всех пользователей информационной системы м о ж н о
поделить	на два класса. " Пользователи,								относящиеся
к первому	классу		(назовем			их	Генераторами),			заносят
информацию		в систему,			а	пользователи,			относящиеся
ко второму		классу	(назовем			их	Пользователями),			полу
чают информацию из системы. Некоторые									пользователи
могут п р и н а д л е ж а т ь к обоим						классам .
Рассмотрим модель информационной системы, изо
браженную на рис.			1-1.	И н ф о р м а ц и я хранится						в системе"'
в виде файлов . Генераторы						помещают		в систему Доку
менты— монографии, периодические								издания,		отчеты,
различные	сообщения,			а	т а к ж е		графические			изображе
ния и звуко- и телевизионные						записи.

1 Файл (File)—это информационный массив, снабженный сим волическим именем, однозначно определяющим его в информацион ной системе. (Прим. пер.)

	Д о к у м е н ты обрабатываются в системе двумя спосо
бами . При		.первом	способе документы		заносятся	в т а к
называемый		Файл документов.		Представление докумен
тов	в файле зависит		от выбранной формы кодирования;
их	м о ж н о	хранить,	например,	.в виде	печатной	копии,
микрофильма -и т. д.

Сжатие

данных

Файл

"^документов!

Сопряжение

палъаооателя

(Польза А \ватель J

Рис. 1-1. Модель информационной системы.

При втором способе обработки производится «сжа тие» информации в документах; это выполняется спе

циальными	программами . Н а б о р			таких программ			будет
•в д а л ь н е й ш е м называться программами Сжатия						данных
или .просто	сжатием данных.
П р и с ж а т и и из		документа извлекается значимая ин
формация,	которая	заносится	в	специальный	ф а й л , на
зываемый	Файлом	ссылок. Этот		файл играет	р о л ь		спра
вочника; объем его		меньше, чем		объем Файла		докумен
тов. Файл	ссылок	содержит	конспекты, рефераты				или

далее некоторые разделы документов. В последнем слу

чае его можно использовать .вместо Файла						документов.
Пользователь		вначале,	как	правило,		о б р а щ а е т с я
к Файлу	ссылок,	с помощью	которого		определяется тре
буемый	раздел Файла документов.			З а	т е м	при необхрди-

Мости пользователь обращается к полным документам,

содержащимся в Файле	документов.
Сжатие данных обычно выполняется с помощью од

ного из двух известных методов. Эти методы называются

индексацией	и 'реферированием.
Индексация — это процесс назначения			документу дес
крипторов (описателей), называемых		(ів	зависимости	от
используемой	терминологии) т а к ж е	терминами или		яр

лыками . Дескрипторы кратко о т р а ж а ю т тематику доку

мента. Они хранятся в Файле	ссылок	и д а ю т	возмож
ность найти нужный документ.
Индексация выполняется человеком и требует опре
деленных з а т р а т умственного	труда. От	качества	ее вы

полнения зависит успех поиска документов. Проводимые исследования [Л. 1, 2] по назначению дескрипторов с по

мощью Э В М не привели к положительным		результатам,
поэтому в б л и ж а й ш е м	будущем индексация,	как н	преж
де, будет выполняться	людьми .
Реферирование — это составление р е ф е р а т а ,			являю

щегося кратким изложением на естественном языке ос новного содержания документа. В настоящее время обычно используются рефераты двух видов: информаци онные рефераты и указательные р е ф е р а т ы .

Информационный реферат содержит данные, извле

каемые -непосредственно из самого документа.

Поэтому

его иногда можно использовать в

качестве заменителя

документа.

Указательный

реферат,

используемый

основном

в 'библиотеках,

содержит название

документа

-и

его

краткую характеристику. Этот реферат указывает

т а к ж е

местонахождение документа в библиотеке.

Итак,

мы

р а з о б р а л и

процесс

занесения

информа

цию систему

данных, поставляемых

Генератором.

Н а

рис. 1-1 этот

процесс

показан

широкими

стрелками.

Рассмотрим

теперь получение

Пользователем

информа

ции из системы.

•Пользователь

обращается

к информационной

системе

посредством

т а к

называемого

Сопряжения

пользователя.

Сопряжение

обеспечивает

пользователю

ввод — вывод

информации из

системы. В качестве Сопряжения

может

использоваться

человек

(например,

библиотекарь)

либо

телетайп, связанный с ЭВМ .

Поток

информации

от

Сопряжения

пользователя

к ф а й л а м

почти

полностью

проходит через

Файл

ссылок,

1 / 211 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ