Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Левковиц, Д. Структуры информационных массивов оперативных систем

.pdf
Скачиваний:
3
Добавлен:
21.10.2023
Размер:
8.9 Mб
Скачать

предназначенный д л я упрощения и ускорения

доступа

к Файлу

документов.

Обычно Пользователь

не

обладает

прямым

доступом

к Файлу документов

(исключая слу­

чай, когда внутри самого хранилища документов исполь­

зуется система классификации) . Если

информационной

системой является библиотека, где документы

р а з л о ж е ­

ны по полкам в соответствии с системой

классификации,

то в результате обращения

к Файлу

ссылок

определяется

массив полок, в котором производится дальнейший

поиск.

 

Вывод информации д л я

пользователя

можно

выпол ­

нять к а к

из Файла

 

ссылок,

 

так и из Файла

документов.

Н а п р и м е р , библиотекарь может выдать эту

информацию

как в устной, так

и

в

письменной

форме

(например,

.в виде микрофильма

или

 

печатной

іколии

д о к у м е н т а ) .

В

автоматизированной

ж е

 

системе

информация

выдает ­

ся

в виде

печатной

копии

 

или в виде

изображения

на

экране .

 

 

 

 

 

 

 

 

 

 

 

 

 

Эта книга в основном посвящена

методам разработки

структуры

Файла

ссылок

дл.я автоматизированных

сис­

тем, .в которых д л я

хранения больших объемов

информа ­

ции используется

память

с

произвольным

(прямым) до--

ступом типа пакета магнитных дисков. Связанные с фай ­

лом

ссылок

компоненты

системы — Сжатие

данных,

Файл

документов

и

Сопряжение

пользователя

— будут

рассмотрены

с

точки

зрения

их

влияния на

р а з р а б о т к у

фа й л а ссылок.

Информационные системы в широком смысле можно поделить на системы хранения и поиска и системы управ­ ления. Первые, по существу, р а с ш и р я ю т функции суще ­ ствующих механизированных библиотек. Они х р а н я т и

обновляют набор данных

и его каталоги, а т а к ж е выпол ­

няют поиск хранимых данных. Использование

получен­

ной из

Файла

документов

информации л е ж и т вне облас­

ти работы этих систем.

 

 

 

 

 

П р и м е р а м и

систем хранения и поиска являются:

1)

системы

хранения

документов

(библиотеки);

2)

простые

перечни,

с о д е р ж а щ и е

описания

докумен­

тов и сведения

об их отдельных

частях;

 

3)

системы

поиска

фактов

(справочники);

 

4)

систематические

перечни, в которых д л я

связи от­

дельных

элементов используется определенная

систе­

матизация .

 

 

Систематические перечни применяются не только

д л я

ввода и

учета отдельных элементов данных, но

т

а к ж е

10

для установления смысловых взаимосвязей м е ж д у эле­ ментами. Следовательно, эти перечим д о л ж н ы быть сос­ тавлены на основе некоторой систематизации либо д о л ж н а существовать процедура, с помощью которой м о ж н о формально устанавливать взаимосвязи между отдельны­ ми элементами.

П р и м е р о м такого перечня является структурная ф о р ­ мула химического состава, которую можно хранить в яв­

ном виде

как Файл документов. Структурная

формула

является,

по сути, графом: к а ж д ы й ее элемент

опреде­

ленным образом связан с другими элементами. С по­ мощью этого графа можно найти классы взаимосвязан ­

ных химических веществ. Аналогичным

примером явля ­

ются электронные

схемы.

 

 

 

 

 

 

 

Другой

пример

относится

к

м а р ш р у т а м

доставки.

К а ж д ы й маршрут

м о ж н о рассматривать

как

 

элемент

перечня,

а

взаимосвязь

между,

м а р ш р у т а м и — как

об-

< щую

сеть. Следовательно, маршруты

можно

классифи ­

цировать

на

основе расстояния, стоимости

использования

и т . д . Э т о

обеспечивает

упорядоченную выборку

м а р ш ­

рутов. Сюда

ж е

относятся

различные

системы

пла­

нирования,

резервирования

и

контроля,

а

в

некото­

рых

случаях — с и с т е м ы

распределения

трудовых

ре­

сурсов.

 

 

 

 

 

 

 

 

 

 

 

 

Информационные системы

управления

включают

в себя систему хранения и поиска. Они выполняют даль ­ нейшую целенаправленную обработку информации и ока­ зывают помощь в принятии решений. Обработка за­

ключается

в

автоматическом

поиске

и

сопоставлении

элементов

файлов, а т а к ж е

в подготовке

графиков,

ре­

шающих таблиц и обзоров.

 

 

 

 

К наиболее известным системам этого класса отно­

сятся Системы

командования

и управления,

а т а к ж е

Ин­

формационные

системы управления.

Так,

военная систе­

ма управления тылом обязательно содержит обе указан ­ ные системы, а т а к ж е систематические перечниЭто вызвано необходимостью определять имеющиеся в рас­

поряжении возможности, маршруты

и т. д. Д л я

обраще ­

ния к таким системам необходимы

объединенные

усилия

человека-оператора и автоматизированных средств по­ иска. Кроме того, можно автоматизировать выдачу ре­ шений или наиболее существенных данных, необходимых для принятия решений. Подобные военные системы, осо­ бенно стратегического назначения, являются весьма

П

с л о ж н ы м и вследствие различных невоенных аспектов (.политических, экономических, социальных и юридичес­

ких),

которые надо учесть при разработке и эксплуата ­

ции

таких систем. П р и теперешнем состоянии дел подоб­

ные системы, по-видимому, лишь частично поддаются

автоматизации .

 

Система

управления

 

 

 

И н ф о р м а ц и о н н а я

является

вари ­

антом Системы

командования

и управления.

Она

предо­

ставляет основные

данные

для

принятия

решений,

а иногда с а м а

принимает их.

 

 

 

 

 

Один из наиболее критических

аспектов

при

разработ ­

ке информационной системы состоит в правильном вы ­

делении

функций, относящихся к человеку и

машине,

а т а к ж е

в определении необходимого уровня

автомати­

зации. Производительность системы хранения и поиска информации в сильной степени зависит от качества ин­

дексирования, а т а к ж е

от

объемов файлов

и

от времен

доступа и обновления.

К а к

у ж е отмечалось,

в

настоящее

время индексирование, определяющее качество системы, лучше выполняется человеком, т а к « а к требует з а т р а т умственного труда. С другой стороны, этапы обработки

информации, определяющие количественные

характерно

тики системы,

можно

автоматизировать .

 

 

 

 

Степень автоматизации зависит от требуемой произ­

водительности

системы.

 

 

 

 

 

 

О б р а щ а я с ь

снова

к рис. 1-1,

отметим,

 

что функции

сжатия

данных

в

основном выполняются

людьми,

в то

время

как

процедуры

генерации

и поиска

файлов требу­

ют

совместной

работы

человека

и машины . Со време ­

нем

будут

разработаны

методы

применения

Э В М

к вы ­

полнению

работ

по

индексации

и реферированию .

Эти

работы будут автоматизированы за счет использования

памяти

большого объема и быстродействующих устройств

поиска

информацииПрименение

Э В М

позволит лучше

использовать накопленный опыт

и . усовершенствовать

процедуры принятия решений. Поэтому

в дальнейшем

р я д препятствий, ограничивающих

применение ЭВМ, бу­

дет полностью устранен и доля человеческого труда по обработке информации существенно снизится.

Методы,

описанные в

этой «миге,

относятся только

к тем этапам обработки

информации,

которые в настоя­

щее время

м о ж н о

автоматизировать . Этапы, требующие

з а т р а т умственного

труда, такие как

индексирование и

реферирование, здесь не

рассматриваются .

12

П е р е д тем, как подойти к основному с о д е р ж а н и ю книги, необходимо ближе познакомиться с информацион­ ной системой и ее моделью. Это необходимо для того, чтобы четко сформулировать требования к программному обеспечению и создать необходимую основу д л я разви ­ тия самих методов.

Т а б л и ц а 1-1 Функциональные компоненты информационной системы

Устройство ввода

Перо

Пишущая машинка Копировальное устройство Печатающее устройство Перфолента и перфокарта Оптическое читающее устройство Магнитофон

Электронно-лучевая трубка-, световое перо Электрическое пишущее устройство

Устройство хранения файлов

Бланки

Перфокарты

Микрофильмы Магнитные носители (аналоговые и цифровые)

Устройство вывода

Пишущая машинка Печатающее устройство ЭВМ

Устройство чтения с микрофильмов Магнитофон Электронно-лучевая трубка Проектор слайдов или пленок

Механизмы поиска

Карты каталога Перфокарты

Координатные индексные карты Электронные системы последовательной обработки данных

Электронные системы произвольной обработки данных

Автоматизированная система хранения и поиска ин­ формации состоит из четырех основных частей: устройств ввода, средств хранения файлов, устройств вывода и ме­ ханизмов поиска. Эти четыре части и примеры их испол­ нения представлены в табл . 1-1. Из этой таблицы непос­ редственно вытекает диапазон сложности указанных частей.

13

Все 'рассматриваемые компоненты системы основаны на трех известных средствах хранения информации: бу­

маге и

чернилах, фотопленке и магнитной поверхности.

Д р у г а я

классификация, известная специалистам в облас ­

ти обработки информации, может подразделять все эти средства на аналоговые и цифровые. Указанные средства хранения информации в зависимости от способа испол­ нения могут быть как аналоговыми, т а к и цифровыми . Н а п р и м е р , использование .позиционных символов, печа­ таемых на бумаге, трактуется как цифровое представле ­ ние информации, а графическое изображение в в и д е не­ прерывных линий — как аналоговое. В свою очередь, на фотопленке можно хранить: 1) микроизображение тек­ ста, написанного на бумаге; 2) фильм, представляющий

собой д в и ж у щ у ю с я картинку, и, наконец,

3) двоично

закодированную цифровую информацию,

декодируемую

с помощью логических устройств.

На магнитном носителе можно хранить как анало ­ говую информацию (примером является обычный или

видеомагнитофон),

так и

цифровую информацию

(на­

пример,

память

на магнитных

лентах,

применяемая

в Э В М ) .

 

 

 

 

 

 

К устройствам

ввода,

в х о д я щ и м в состав и н ф о р м а ­

ционных

систем, относятся

перо,

п и ш у щ а я

м а ш и н к а ,

ко ­

пировальное и печатающее устройства, использующие

способ нанесения

красящего

вещества на

бумагу. Д л я

цифровой записи

на бумагу

применяется

т а к ж е перфо -

ленточное и перфокарточное оборудование. Кроме того, существует оптическое читающее устройство, являющее ­

ся

средством ввода в Э В М данных, написанных

непосред­

ственно

на бумаге (с

использованием

.в качестве

посред­

ника фотопленки или устройства с магнитной

поверх­

ностью) . Магнитофон

используется д л я

ввода

 

только

звуковой или видеоинформации, записанной на

магнит­

ной

ленте. Электронно-лучевая трубка,

клавиатура и

световое перо т а к ж е

применяются

д л я

ввода

цифровых

или

аналоговых данных.

 

 

 

 

 

 

 

 

 

В состав средств хранения файлов входят: 1)

блан­

ки,

обычно хранимые

на

полках

или

в ш к а ф а х ;

2)

фай ­

лы

на

перфокартах,

которые

т а к ж е

 

можно

 

хранить

в специальных стальных

ш к а ф а х ;

3)

ф а й л ы

на

микро­

фильмах; 4) магнитные

носители

информации

 

в

виде

магнитных лент, карт, магнитных полосок, дисков, бара ­ банов и др.

14

Скорость

доступа

к информации,

содержащейся

•в файлах, в

большой

степени зависит от

физических ха­

рактеристик устройств хранения файлов . Стоимость этих

устройств связана с емкостью памяти, видом

доступа

к ней с быстродействием устройства.

 

В отличие от устройства ввода основная

функция

устройства вывода состоит в выдаче пользователю ин­ формации, представленной в удобной форме. Отдельные сообщения из автоматизированной системы обычно по­

ступают

на пишущую машинку, А Ц П У

или электронно­

лучевую

трубку ( Э Л Т ) . Сообщения из

Файла

докумен­

тов, не представленные в печатном виде, .могут отобра­ жаться на устройстве чтения с микрофильмов или на проекторе слайдов или фотопленок. В случае хранения

звуковой информации ее

можно выдать пользователю

с помощью стандартного магнитофона.

При анализе систем классификации и поисковых сис­

тем становится

ясно, что

существует сравнительно м а л о

принципиально

различных

механизмов поиска. Н а и б о л ь ­

шее распространение получили следующие два метода организации файлов . Это иерархический (классификаци ­ онный) метод и координатно-индексный метод- В рас­ сматриваемой информационной системе применяются оба метода организации файлов и соответствующие им

механизмы поиска.

 

Н а п р и м е р , в большинстве библиотек

расставляют

книги в соответствии с некоторым планом

классифика ­

ции, известным как классификация Дэви, или Универ­ сальная десятичная система *. П р и таком способе -книга схематично помещается в вершину классификационного дерева; в принципе эту книгу можно найти ветвлением универсальной вершины на пути и подпути большей де­ тализации. Это происходит до тех пор, пока не будет

достигнута вершина

дерева, определяющая ж е л а е м ы й

предмет (например,

электротехника в классификации

Дэви представляется

как [621], автоматика как [621.8] и

системотехника как [621.81]). В этом случае, поскольку назначения полок о т р а ж а ю т классификационные коды, связанные с к а ж д о й из вершин дерева, поиск з а в е р ш а ­ ется физическим просмотром указанной полки, которая

внутренне

упорядочена

по фамилиям авторов докумен­

тов.

Недостаток

этой

системы состоит в трудности на-

*

В СССР называется

Универсальная десятичная классифика­

ция — УДК.

(Прим.

пер.)

 

15

х о ж д е н ия документа, содержание которого

лежит

на

стыке различных областей. Н а п р и м е р , книгу,

к а с а ю щ у ю ­

ся .влияния парового двигателя на

британскую экономи­

ку X I X в., нельзя найти с помощью системы

Дэви, т а к

как предметная область паровых двигателей

находится,

по-видимому, в другой вершине дерева,

нежели британс­

кая экономика X I X в. Поиск отдельно

по .паровому

дви­

гателю

или британской экономике

X I X в. з а н я л бы

весь ­

ма 'много времени . П о э т о м у в эту систему в виде

Файла

ссылок

переносится алфавитный

предметный

каталог.

К а ж д о м у документу назначаются новые предметные за­

головки

 

создается

несколько

карт

с

названием доку­

мента,

фамилией автора, библиографией

и предметными

H

 

 

 

 

 

заголовками . З а т е м

создается

каталог

путем упорядочи­

в а н и я всех карт в алфавитном порядке по предметному заголовку, названию книги и фамилии автора. К с о ж а л е ­ нию, в 'большинстве библиотек не назначают более трех или четырех предметных заголовков на документ, поэтому глубина индексации невелика; она является, как правило, слишком общей. Однако, если разыскиваемые документы снабжены определяющими дескрипторами, требуемый пе ­ рекрестный поиск м о ж н о провести как коордпнатно-ин- декснын поиск с помощью карточного каталога- В этом случае необходимо обратиться к картам, озаглавленным

«Паровой двигатель»,

и просмотреть

карты, относящиеся

к этим

документам

с

предметными

заголовками

«Бри­

танская

экономика

X I X века»

или «Британская экономи­

ка». Расположение

полки с

каж;;ым

подходящим

доку­

ментом указывается на карте в виде определяемого при­ меняемой системой классификации кода. Таким образом, начальное предназначение системы классификации час­ тично устанавливается в результате использования ал­ фавитного предметного каталога . Этот каталог полезен

при перекрестном

поиске, так 'как некоторые координат­

ные «попадания» м о ж н о классифицировать

«паровым

двигателем»

(или

кодом ближайшего

к л а с с а ) ,

а

дру­

г и е — «британской

экономикой». Поиск

можно

затем

за­

вершить в Файле

документов

(в библиотечных

книгохра­

н и л и щ а х ) ,

где либо будет

найдено

точное

название,

либо потребуется просмотр на полке. Все существующие механизированные системы поиска основаны на принци­ пе координатного индексирования или на использовании

координатного

индексирования

совместно

с системой

классификации .

П я т ь наиболее

часто

встречающихся

16

С С С Р * '

•реализаций этого принципа перечислены в табл . 1-І в разделе «Механизмы поиска». В большинстве неавто­ матических поисковых систем используется форма -кар­

точного каталога, описанного выше. Д л я более

быстрой

обработки карт данные .можно соответствующим

образом

закодировать, пробить

на перфокартах и просмотреть со

скоростью около 200

карт/мин.

 

Другим видом является коордипатно-ипдексная кар ­

точная система. Существуют два варианта этой

системы.

При первом в а р и а н т е .производится выборка карт, содер­

ж а щ и х интересующие записи. Эти карты

индексируются

отверстиями или в ы е м к а м и

по краю *. П р и втором спосо­

бе производится выборка

дескрипторных

карт, позволя­

ющих обнаружить записиили документы ф а й л а с по­ мощью нанесенных на них координат. Эти последние системы принято называть оптическими системами сов­ падения, или системами «пикэбу» ** [Л. 3].

Пусть надо найти документы, определяемые задан ­ ным набором дескрипторов. Составив пакет из соответ­ ствующего набора дескрипторных карт, его помещают перед источником света. Если какой-то документ отве­ чает заданному набору дескрипторов, то в координате этого документа окажется сквозное отверстие, проходя­ щее через весь пакет дескрипторных карт. Следователь ­ но, свет пройдет через это отверстие и даст возможность

найти документ по соответствующей

координате. В [Л. 4]

описана коммерческая система, д о п у с к а ю щ а я

.плотность

до 10 000 документов на карту.

 

 

Все системы, использующие ЭВМ, можно 'Классифиро-

в а т ь на электронные системы последовательной

обработ­

ки данных и электронные системы

произвольной обра­

ботки данных. В этой книге будут рассматриваться толь­ ко системы произвольной обработки данных.

И з перечисленных в табл . 1-1 системных компонентов и механизмов поиска е этой книге особое внимание уде­ ляется дискретным устройствам хранения файлов на маг ­ нитной .поверхности с произвольным доступом (т. е. маг«

нитным

дискам и б а р а б а н а м ,

а т а к ж е устройствам на

магнитных полосках) . Такие

устройства

обычно

назы ­

в а ю т с я

запоминающими устройствами

прямого

досту-

* Это так называемые карты с краевой перфорацией. (Прим.

пер.)

** Английский термин ipeek-a-boo.

Так называется

вид игры

в прятки, распространенный в США. (fp7imrfifqpj)-j-~

 

2—88

НЛУЧ;;0-ѵ.:

: .-"v ji?=r

БИБ/і:-іи'і iillA

па а У П Д . Там, где не применимы устройства, создан­ ные для сметем произвольной обработки данных, исполь­ зуются устройства хранения информации на магнитных лентах (созданные для систем последовательной обра­ ботки данных) . В этих случаях применяются т а к ж е сис­ темы (Классификации. Соответствующие примеры npi-Iße-

flcwffjMH/

источник данных

1

Отбор

 

 

 

 

 

 

 

 

Редактирование,

Редактор

 

 

 

 

 

индексирование

 

 

Изменение

иреферированЪе

отобранных

^Перфорация

данных

 

данных

 

данных

 

 

 

 

 

 

 

 

 

 

 

\согдани( Файла

Отобранные

 

 

 

 

(пакетУое

 

 

 

 

 

обновление)

данные

 

 

 

 

 

 

 

 

 

 

 

 

 

Файл

 

Файлы

 

 

 

 

 

I—*\ микрофильмов\

 

 

 

 

Файл

дОкумен-\

 

 

Поисковые

 

и печатных

 

 

 

тов

 

копий

 

 

адреса

 

 

 

 

 

 

 

файлов

 

 

 

 

 

 

 

шш _

— Л>

 

 

 

А _ _

. J

Процессор

•Процессор

 

 

запросов

файлов

 

 

[

Предварительная'^

Janpoc/

/ Ответы

 

 

 

информация ^

^обновления ив файлов

 

 

 

 

 

Исполнитель

 

- Занесение

 

 

 

 

системы

 

 

данных

 

 

 

 

с многими

 

 

• Поиск

 

 

 

 

терминалани\

 

данных

 

 

 

 

 

 

 

 

 

 

Рис.

1-2. Поток данных в системе.

дены только дл я иллюстрации и подробно не анализи ­ руются.

В начале этой главы р а с с м а т р и в а л с я рис. 1-1, на ко­ тором была представлена модель информационной систе­

мы. Д л я того чтобы

сконцентрировать внимание на ме­

тодах,

и з л а г а е м ы х в

этой

книге, рассмотрим

рис. 1-2 и

1-3. Н а

них показаны

поток

данных в системе

(рис. 1-2)

и компоненты программного обеспечения (рис.

1-3).

Основным источником данных, т. е. документов, яв­ ляется генератор информации (см. рис. 1-1). Документы вначале подвергаются процессу отбора; в результате некоторые несущественные документы отвергаются. З а ­ тем проводится редактирование отобранных документов. После этого документы индексируются (т. е. составля-

18

ются списки дескрипторов) и (или) реферируются. По ­ лученные таким образом материалы передаются в виде файла .микрофильмов или печатных копий в хранилище для последующего хранения. Этот файл можно в даль ­ нейшем редактировать с целью уплотнения « повышения качества и затем передавать на изготовление ф а й л а перфокарт и, возможно, файла .микрофильмов и печат-

Печать

Терминалы

 

 

 

Операционная

 

 

 

 

састена (ОС)

 

 

 

 

г т

 

с

 

Туг

1.2

 

 

 

О

 

 

 

 

TT

 

 

2.1- 2.3

 

I

 

 

 

 

 

 

 

î _ i

исполнительной]

X

 

области

Г1

kl

4/

запросов в

 

 

- г -

оперативной

 

 

и диеновой

 

памяти

Рис. 1-3. Механизмы программного обеспечения информационнопоисковой системы, работающей в реальном масштабе времени.

ных копий. Иногда

эти ф а й л ы

используются

совместно

с автоматизированными' Файлами

ссылок.

 

 

Д а н н ы е , занесенные на перфокарты,

проверяются и

при необходимости

корректируются.

Они

используются

для пакетного обновления системы файлов .

 

Сейчас д л я в в о д а данных все

чаще

применяются опе­

ративные методы *; тем с а м ы м

цикл

перфорация — про­

верка — пакетное

обновление

становится

ненужным.

Вместо этого отредактированные по ф о р м а т а м данные вводятся непосредственно в ф а й л с клавиатуры опера-

* Американский термин «оперативный метод» (on-line) подразу­ мевает работу в режиме непосредственной связи с ЭВМ. (Прим. пер.)

2*

19

Соседние файлы в папке книги из ГПНТБ