Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Электронная информация и электронные ресурсы

..pdf
Скачиваний:
3
Добавлен:
20.11.2023
Размер:
20.88 Mб
Скачать

Поисковые машины, порталы и электронные библиотеки

ЭБ, базирующийся на определениях А. Б. Антопольского и Концепции РГБ.

Итак, завершая эту главу, мы напомним еще раз, что фунда­ ментом, основой, объединяющей традиционные и электронные библиотеки, является принцип обслуживания пользователей профессиональным, специально подготовленным библиотеч­ ным персоналом, который заботится о выборе ресурса, его со­ хранности, обеспечивает его доступность и готов оказать по­ мощь неискушенному читателю/пользователю. По-видимому, можно проследить глубинные связи двойственности определе­ ний электронной библиотеки со столь же ясной двойственно­ стью функций Интернета. С одной стороны, Интернет — это гигантское хранилище электронных ресурсов, а с другой — те­ лекоммуникационная среда, обеспечивающая поиск и доставку этих ресурсов пользователю.

Поскольку незавершенное многообразие терминов может оставить читателя в недоумении, мы в данной книге будем при­ держиваться краткого и емкого определения электронных биб­ лиотек, ранее предложенного также одним из автором данного учебника — профессором Я. Л. Шрайбергом [1]:

«Электронная библиотека — это совокупность локальных или распределенных электронных ресурсов, объединенных единой идеологией структуризации и доступа».

Усвоив это определение, читатель будет в состоянии понять все дальнейшее изложение. И в заключение еще одно, финаль­ ное, замечание по поводу имеющихся различий в определении электронной библиотеки. Не исключено, что речь идет о наме­ чающейся диверсификации различных типов электронных биб­ лиотек, в которых тот или иной функциональный элемент будет играть существенную роль.

8.2.Поисковые машины, порталы

иэлектронные библиотеки

Отдельного исследования заслуживает проблема взаимоот­ ношений понятий «портал» и «электронная библиотека». Пор­ тал — отправная точка систематического поиска в Сети, средст­ во систематизации электронных ресурсов и навигации между

351

Глава 8. Электронные библиотеки

ресурсами. Внешние различия достаточно заметны: у портала нет и никогда не было своего специального помещения, в кото­ рое могли бы зайти физические пользователи; на сервере порта­ ла, как правило, нет постоянного дежурного помощника (биб­ лиотекаря); доля собственных электронных ресурсов на портале невелика по сравнению с внешними, удаленными ресурсами. Есть и ряд общих черт, читатель их легко перечислит самостоя­ тельно. Быть может, в портале реализована концепция доступа к электронным ресурсам так, как она воспринимается специа­ листами по информатике, а в электронной библиотеке реализу­ ется концепция доступа к электронным ресурсам, разработан­ ная непосредственно или при участии библиотечных работни­ ков.

Далее рассмотрим такие две категории, как конструкция хранилища данных и интерфейс пользователя.

Идеология поисковой машины заключается в том, чтобы обеспечить доступ к наибольшему числу электронных ресурсов; поддерживаются самые разнообразные структуры данных, в том числе указатели, директории, каталоги. Поисковые возможно­ сти поддерживаются мощным интерфейсом пользователя. При­ меняются также самые разнообразные типы роботов (крауле­ ров) для организации постоянного поиска ресурсов в Интерне­ те и для динамичного обновления материалов. Если взглянуть на пользовательскую часть поисковой машины, то мы увидим, что чаще всего при выполнении задания пользователя машина опирается на случайным образом составленный запрос на осно­ ве ряда ключевых слов (может быть, так или иначе скомбиниро­ ванных). Результатом поиска будет огромное количество мате­ риалов, не всегда релевантных. Этот массив обрушится на поль­ зователя, и ему придется самым утомительным образом осуществлять вручную фильтрацию выданного материала. Най­ денная информация затем будет либо немедленно применена, либо передана на относительно краткосрочное хранение. По­ этому хорошо, если поисковая машина является частью навига­ ционной системы, и тогда для ЭБ может быть обеспечена эф ­ фективная навигация.

Электронная библиотека работает несколько другим обра­ зом. Информационный специалист создает хорошо продуман­ ную систему качественных, тщательно подобранных материа-

352

Поисковые машины, порталы и электронные библиотеки

лов. Система отбора и соответствующие запросы определены самым четким образом, а эффективная работа с системой клю­ чевых слов обеспечивает точность поиска и отбора информа­ ции. Содержимое библиотеки раскрывается через хорошо структурированную базу данных. Содержание (материалы) электронной библиотеки постоянно обновляется и аннотирует­ ся специалистами, что обеспечивает релевантность извлечен­ ных ресурсов.

Пользователь получит сравнительно небольшой, компакт­ ный массив информации, который можно сгруппировать по трем уровням детализации:

а) метаданные и обобщения; б) дополнительные рефераты материалов;

в) отреферированный документ.

Никакого дополнительного отсеивания не потребуется. При необходимости пользователь может сам прореферировать еще раз полученный материал для удобства последующих поисков.

Итак, поисковая машина снабжает пользователя большим количеством нефильтрованной информации и вынуждает его активно поработать по доводке полученного материала. Этот метод подходит для однократной и быстрой отгрузки информа­ ции.

Электронная библиотека не требует больших затрат труда, предоставляя пользователю более сконцентрированную высо­ кокачественную информацию, которая была заранее прорабо­ тана и размечена специалистами.

Эти два способа поиска информации не конфликтуют, а до­ полняют друг друга, и не зря в уже упомянутой работе [4) нахо­ дим: «Основное соотношение между электронной информаци­ ей (ЭИ) и электронными библиотеками: если ЭИ выпускается как законченный продукт, то в ЭБ должны быть предусмотрены возможности ввода и удаления информационных объектов, их интеграции, реструктуризации и другие подобные операции».

Исследование некоммерческой компании Libri показыва­ ет, что в течение последнего времени объемы книговыдачи в 20 крупнейших библиотеках Великобритании неуклонно уменьшаются, в сумме на 21% за 5 лет. В целом по публичным библиотекам также наблюдается спад, но сравнительно неболь­

353

Глава 8. Электронные библиотеки

шой. Отметим, что онлайновая национальная система «Народ­ ная Сеть» (People's Network) взяла на себя часть справочного об­ служивания населения, ранее выполнявшегося в библиотеках.

Дистанционная удаленность хранилища ресурсов и многих мест обслуживания от библиотечного здания, использование Интернета — это неотъемлемые характеристики электронной библиотеки. Они касаются и телекоммуникационной состав­ ляющей (сейчас трудно представить большую электронную библиотеку, не использующую интернет-технологий и ресурс­ ного компонента Интернета).

Об исчезновении со временем специальных и научно-техни­ ческих библиотек нужно сказать особо. Этот процесс, как пока­ зывает опыт фармацевтической компании Glaxo Smith Kline по созданию виртуальной библиотеки и ликвидации обычной спе­ циальной библиотеки, вполне возможен. В компании, выпус­ кающей более 7% мирового объема лекарств, работает более 100 тыс. служащих, из них 15 тыс. — в научно-исследователь­ ских подразделениях. Вице-президент по информатике, препо­ даватель университета г-жа Мелани О'Нил (Melanie O'Neil) ру­ ководит коллективом в 300 человек, работающих в 14 специали­ зированных библиотеках. Для фармацевтики процесс узкой специализации особенно заметен, и, возможно, поэтому фирме нужны не специальные библиотеки, а специалисты, работаю­ щие с информацией в очень узкой области знания. В своем но­ вом здании общей площадью 140 тыс. кв. метров фирма создала крупнейшую в Европе химическую лабораторию и не преду­ смотрела помещения для специальной библиотеки. Быть мо­ жет, такой подход окажется принципиально очень интересным. Напомним, что компания также закрывает и остальные 14 тра­ диционных специальных библиотек и переводит сотрудников непосредственно в исследовательские подразделения. По сути, речь идет о доведении до абсолюта идеи переноса библиотечно­ го обслуживания ближе к пользователю, о непрерывной и опе­ режающей доставке информации и документов на рабочий стол или в персональный компьютер исследователя.

Пугаться здесь нечего, ибо процесс внедрения специальных библиотекарей в состав исследовательских групп в чем-то схож с произошедшими изменениями в мире вычислительной техни­ ки: вместо главных вычислительных центров и больших машин

354

Программное обеспечение...

(мэйнфрэймов), использования выделенной команды специа­ листов по вычислительной технике, — вместо этого выделенно­ го отдельного комплекса достаточно широко распространились персональные компьютеры, непосредственно расположенные на рабочем столе исследователя. Обсуждение опыта компании «Глаксо» — это полезный повод понять соотношение справоч­ ных функций библиотекарей по сравнению с общеобразова­ тельной и вообще общественно значимой функцией.

Не случайно и компания «Эльзевир» в своих рекламных пла­ катах использует примерно такую же идею (на их картинке изо­ бражены четыре человека в кабине космического корабля: пи­ лот, астрофизик, инженер и библиотекарь).

В этом же ряду стоит формирование публичных микробиб­ лиотек (около 700 томов в каждой) в микрорайонах городков и сельских поселков Великобритании, все это элементы огром­ ной по значимости программы «Народная сеть» (People's Network).

8.3. Программное обеспечение процесса формирования электронной библиотеки: программа «Гринстон»

Электронные библиотеки с ресурсной точки зрения пред­ ставляют собой большие, хорошо организованные и тематиче­ ски сконцентрированные коллекции информации. Существует множество программных решений по организации и поддержке ЭБ. Чаще всего — это комплекс программ, программная систе­ ма, так как надо уметь автоматически генерировать, структури­ ровать, если надо, распознавать, хранить, использовать, преоб­ разовывать и передавать текстовые и графические файлы. Мы остановимся в этом разделе на представлении общедоступной системы «Гринстон» (Greenstone). Программный продукт «Гринстон» задумывался в целях оказания помоши в конструи­ ровании, простом и быстром создании такого рода коллекций. Коллекции могут быть очень большими, например включать гигабайты текстового материала; другие могут состоять из мил­ лионов (всего лишь!) документов. Кроме того, намного боль­ шие объемы информации могут быть ассоциированы с ука­

355

Глава 8. Электронные библиотеки

занной коллекцией, например аудио-, видеоматериалы, изобра­ жения.

«Гринстон» является по сути своей международной и много­ язычной программой, она широко используется во многих странах. Эта программа работает со многими языками по видам как интерфейсов, так и языка коллекций. Распространяется данный программный продукт ЮНЕСКО в рамках известной программы «Информация для всех». «Гринстон» — многоплат­ форменная программа (лучше сказать — независимая от плат­ формы), работающая с операционными системами Windows всех типов, Unix, Macintosh OS/Х. Распространяется она через Интернет или как самоустанавливаюшийся продукт на оптиче­ ском диске CD-ROM.

Основную работу по установке программы «Гринстон» и формированию стандартной коллекции из новых материалов со стандартным интерфейсом можно выполнить буквально за не­ сколько минут. После этого нужно будет провести достаточно трудоемкую механическую работу по непосредственному вводу полнотекстовых документов в созданную оболочку, что соста­ вит от нескольких минут, если у вас небольшая коллекция, и до нескольких часов, ежели коллекция большая, объемом во много гигабайтов. Такая работа может занять целый день, если вам приходится вводить множество полнотекстовых указателей.

Электронную коллекцию можно построить в самом различ­ ном оформлении в соответствии с вашими желаниями и пред­ ставлениями об удобном и прекрасном. При этом, конечно, нужно учитывать, что коллекции некоторых типов, например большие коллекции, имеют свои неповторимые черты, особен­ ности и требования. Окончательный выбор оформления и от­ ладка могут занять несколько дней, а может быть и более, если вы будете неоднократно каждый раз переделывать оформление интерфейса по ходу практических испытаний.

По мере роста общей электронной коллекции и увеличения количества отдельных собраний внутри нее может оказаться по­ лезным переиначить весь фонд по образу и подобию какого-то определенного собрания внутри фонда или повторить какой-то понравившийся вам тип оформления из уже существующих фондов. «Гринстон» легко позволяет проводить такого рода мо­ дернизации. И кроме того, с программой «Гринстон» вы очень

356

Программное обеспечение...

легко сможете повторить (или перенести на другой сайт) оформление вашего интерфейса в другой библиотеке.

Предоставляемые данной программой сервисы и разнообра­ зие видов интерфейса при осуществлении поиска и просмотра могут адаптироваться под ваши нужды на многих уровнях. Пользователи могут легко настроиться на различные операци­ онные системы и различные форматы документов (например, HTML, Word, PDF, PostScript, Power Point, Excel). При наличии готовых метаданных (например, в составе файлов XML, откры­ того архива OAI, библиографии в формате Latex) они включа­ ются в состав записи. Если существует необходимость добавить поисковые индексы (например, специально выделить значи­ мость языка для полнотекстовых документов или какие-то метаданные, допустим, заглавия), — все это возможно в «Гринстон». Пользователь может формировать элементы структурно­ го поиска и просмотра, в том числе список авторов, наименова­ ний, классификационные иерархии и т. п.

Электронные библиотеки, по сравнению с другими интер­ активными системами, обладают тем преимуществом, что соот­ ветствующие интерфейсы опираются на использование мета­ данных. Метаданные — это «клей», с помощью которого новые документы включаются в состав электронной коллекции и не­ медленно становятся полноправными элементами этой коллек­ ции. Метаданные — это ключ к обеспечению поиска и просмот­ ра. В программу «Гринстон» заложено несколько различных ме­ ханизмов, позволяющих в полной мере воспользоваться этими инструментами.

Конструирование коллекций (формирование фонда). С помо­ щью программы «Гринстон» вы индивидуально конструируе­ те коллекции, чаще всего взяв за основу образ какой-то из су­ ществующих у вас коллекций, которая в наибольшей степени соответствует вашим (и ваших пользователей) потребностям, и повторив структуру понравившегося вам образца. Подготовлен­ ный таким образом короткий файл записывается как конфигу­ рационный. В нем специфицируются следующие параметры: название коллекции, адрес электронной почты создателя кол­ лекции (ответственного лица), цели и принципы создания кол­ лекции, форматы файлов ввода данных, источники метадан­ ных, форматы записи метаданных, характеристики пользова­

3 5 7

Глава 8. Электронные библиотеки

тельского интерфейса. Значительная часть информации, связанной с подстройкой программы «Гринстон» и не относя­ щейся к профессиональному перепрограммированию, будет храниться в этом файле. Его формирование самым существен­ ным образом зависит от наличия метаданных и определенной структуры.

Поиск по полному тексту всей коллекции является основ­ ной особенностью этой программы, который по умолчанию включается во все формируемые части коллекции. Конструкто­ ры коллекции сами должны определиться, нужен ли им поиск по параграфу (абзацу), разделу документа или по всему тексту документа (этот параметр потом скажется при выдаче результа­ тов поиска). Конструктор может также сделать, чтобы индексы полнотекстового поиска были встроены в систему метаданных (например, заглавия, авторы и т. п.). Допускается разбиение це­ лого фонда на какие-то части, внутри которых по отдельно взя­ той подчасти можно проводить полнотекстовый поиск. Можно также проставить языковые метаданные, так что поиск будет при необходимости проводиться в пределах заранее выбранного языка.

Возможности просмотра коллекций достаточно существен­ но различаются в зависимости от имеющихся метаданных и тех видов обслуживания, которые конструктор системы заложил в нее. В программу «Гринстон» входят заранее определенные структуры, основанные на том или ином виде метаданных. Лю­ бые текстовые метаданные можно представить в виде алфавит­ ного списка, автоматически подключаемого в разумных преде­ лах для того, чтобы в каждой демонстрируемой части оказалось приемлемое количество документов. Данные, касающиеся вре­ мени (например, год публикации), также формируются в спи­ сок, позволяющий выбрать нужный интервал, осуществить выборку по годам или по месяцам. Метаданные, имеющие ие­ рархическую структуру, например библиотечные классифика­ ционные системы, могут быть реализованы в виде дерева с воз­ можностью переходить по нужным уровням обобщения. В этом случае пользователь должен сформировать дополнительный файл с указанием соответствия (например, предметные рубри­ ки сопоставлены с классификационными номерами).

358

Программное обеспечение...

Указания по форматированию необходимы для того, чтобы пользователь мог настроить под свои требования каждую кар­ тинку, которую система генерирует. В этом документе указыва­ ется, в каком порядке осуществляется демонстрация — идет ли сначала заголовок отдельной картинкой, или просто заголовок с отступом предваряет текст и т. п. Формулируется общее рас­ положение результатов поиска, определяется, какие метадан­ ные будут показаны в качестве повтора или разъяснения запро­ са, нужно ли показывать общий вид документа, нужно ли давать гиперссылки и к какому документу. В коллекции, состоящей из документов различного формата (например, Word или HTML), полезно будет указывать в результатах поиска возможные фор­ маты выгрузки, с тем чтобы пользователь смог сам определить­ ся, что ему нужно. Указания по форматированию добавляются к вышеупомянутому документу по условиям просмотра.

Другие особенности. «Гринстон» является многоязычной системой. В настоящее время созданы интерфейсы на следую­ щих языках: английском, арабском, китайском, чешском, гол­ ландском, французском, галисийском, немецком, иврите, ин­ донезийском, итальянском, японском, казахском, маори, пор­ тугальском, русском, испанском, тайском и турецком. Для того чтобы эффективно использовать это языковое богатство и для обеспечения подстройки соответствующего языка интерфейса при пополнении коллекции, все сетевые страницы до их демон­ страции пропускаются через макрокоманду расширения языко­ вой базы, опирающуюся на контрольную фразу. Это значит, что новый язык может быть добавлен путем включения нескольких типовых текстовых фрагментов и этим способом легко и неод­ нократно сможет пользоваться человек, не очень-то искушен­ ный в тонкостях программы «Гринстон».

Инсталляция программы и формирование коллекции дос­ тупны человеку с весьма средними компьютерными способно­ стями. Однако при наличии определенных навыков вы сможете сделать намного больше. При знании языка HTML вы сумеете включить утилиты «Гринстона», например механизм полнотек­ стового поиска или просмотровые подпрограммы, в ваши соб­ ственные страницы. Если вы владеете JavaScript, то вам удастся добавить себе механизм просмотра изображений, а при знании Perl можно будет существенно обновить процесс просмотра, на­

359

Глава 8. Электронные библиотеки

пример добавив в него программу PinYin для работы с китай­ скими текстами. «Гринстон» спроектирован на базе глубокой философии: простые вещи должны быть простыми, а слож­ ные — доступными.

Некоторые более «продвинутые» возможности также можно включить в работу с коллекцией, добавив совсем немного в конфигурационный файл:

создать для пользователя режим, близкий к режиму рабо­ ты с печатными предметными рубриками или тезауруса­ ми: программа может автоматически извлекать из полного текста фразы и строить иерархические отношения между ними;

автоматически извлекать из текста акронимы и их рас­ шифровку;

автоматически распознавать язык каждого документа и использовать для создания индексов на каждом языке.

Как это обычно бывает при работе со столь высокоразвитой системой, как «Гринстон», самые жесткие требования предъяв­ ляются к оформлению документов, входящих в коллекцию. Можно сказать, что именно документация является самым уз­ ким местом. Естественно, что создатели коллекции зачастую нуждаются в оказании помощи и консультациях, с тем чтобы подстроить программу под какие-то вновь возникающие зада­ чи. Существует дискуссионная группа, объединяющая участни­ ков из 40 стран и работающая в электронной почте. Она оказы­ вает любую помощь участникам группы. Имеется обширная до­ кументация на английском, французском, испанском и русском языках. ЮНЕСКО организует серию региональных программ переподготовки по использованию «Гринстон», и эта программа включается в пакеты по управлению информацией.

8.4. Оценки эффективности работы электронной библиотеки

Улучшение качества работы библиотек и информационных центров может оказать позитивное воздействие на окружающий мир, помогая созданию общества 2020 г., в котором правитель­

360

Соседние файлы в папке книги