![](/user_photo/_userpic.png)
книги / Электронная информация и электронные ресурсы
..pdfПоисковые машины, порталы и электронные библиотеки
ЭБ, базирующийся на определениях А. Б. Антопольского и Концепции РГБ.
Итак, завершая эту главу, мы напомним еще раз, что фунда ментом, основой, объединяющей традиционные и электронные библиотеки, является принцип обслуживания пользователей профессиональным, специально подготовленным библиотеч ным персоналом, который заботится о выборе ресурса, его со хранности, обеспечивает его доступность и готов оказать по мощь неискушенному читателю/пользователю. По-видимому, можно проследить глубинные связи двойственности определе ний электронной библиотеки со столь же ясной двойственно стью функций Интернета. С одной стороны, Интернет — это гигантское хранилище электронных ресурсов, а с другой — те лекоммуникационная среда, обеспечивающая поиск и доставку этих ресурсов пользователю.
Поскольку незавершенное многообразие терминов может оставить читателя в недоумении, мы в данной книге будем при держиваться краткого и емкого определения электронных биб лиотек, ранее предложенного также одним из автором данного учебника — профессором Я. Л. Шрайбергом [1]:
«Электронная библиотека — это совокупность локальных или распределенных электронных ресурсов, объединенных единой идеологией структуризации и доступа».
Усвоив это определение, читатель будет в состоянии понять все дальнейшее изложение. И в заключение еще одно, финаль ное, замечание по поводу имеющихся различий в определении электронной библиотеки. Не исключено, что речь идет о наме чающейся диверсификации различных типов электронных биб лиотек, в которых тот или иной функциональный элемент будет играть существенную роль.
8.2.Поисковые машины, порталы
иэлектронные библиотеки
Отдельного исследования заслуживает проблема взаимоот ношений понятий «портал» и «электронная библиотека». Пор тал — отправная точка систематического поиска в Сети, средст во систематизации электронных ресурсов и навигации между
351
Глава 8. Электронные библиотеки
ресурсами. Внешние различия достаточно заметны: у портала нет и никогда не было своего специального помещения, в кото рое могли бы зайти физические пользователи; на сервере порта ла, как правило, нет постоянного дежурного помощника (биб лиотекаря); доля собственных электронных ресурсов на портале невелика по сравнению с внешними, удаленными ресурсами. Есть и ряд общих черт, читатель их легко перечислит самостоя тельно. Быть может, в портале реализована концепция доступа к электронным ресурсам так, как она воспринимается специа листами по информатике, а в электронной библиотеке реализу ется концепция доступа к электронным ресурсам, разработан ная непосредственно или при участии библиотечных работни ков.
Далее рассмотрим такие две категории, как конструкция хранилища данных и интерфейс пользователя.
Идеология поисковой машины заключается в том, чтобы обеспечить доступ к наибольшему числу электронных ресурсов; поддерживаются самые разнообразные структуры данных, в том числе указатели, директории, каталоги. Поисковые возможно сти поддерживаются мощным интерфейсом пользователя. При меняются также самые разнообразные типы роботов (крауле ров) для организации постоянного поиска ресурсов в Интерне те и для динамичного обновления материалов. Если взглянуть на пользовательскую часть поисковой машины, то мы увидим, что чаще всего при выполнении задания пользователя машина опирается на случайным образом составленный запрос на осно ве ряда ключевых слов (может быть, так или иначе скомбиниро ванных). Результатом поиска будет огромное количество мате риалов, не всегда релевантных. Этот массив обрушится на поль зователя, и ему придется самым утомительным образом осуществлять вручную фильтрацию выданного материала. Най денная информация затем будет либо немедленно применена, либо передана на относительно краткосрочное хранение. По этому хорошо, если поисковая машина является частью навига ционной системы, и тогда для ЭБ может быть обеспечена эф фективная навигация.
Электронная библиотека работает несколько другим обра зом. Информационный специалист создает хорошо продуман ную систему качественных, тщательно подобранных материа-
352
Поисковые машины, порталы и электронные библиотеки
лов. Система отбора и соответствующие запросы определены самым четким образом, а эффективная работа с системой клю чевых слов обеспечивает точность поиска и отбора информа ции. Содержимое библиотеки раскрывается через хорошо структурированную базу данных. Содержание (материалы) электронной библиотеки постоянно обновляется и аннотирует ся специалистами, что обеспечивает релевантность извлечен ных ресурсов.
Пользователь получит сравнительно небольшой, компакт ный массив информации, который можно сгруппировать по трем уровням детализации:
а) метаданные и обобщения; б) дополнительные рефераты материалов;
в) отреферированный документ.
Никакого дополнительного отсеивания не потребуется. При необходимости пользователь может сам прореферировать еще раз полученный материал для удобства последующих поисков.
Итак, поисковая машина снабжает пользователя большим количеством нефильтрованной информации и вынуждает его активно поработать по доводке полученного материала. Этот метод подходит для однократной и быстрой отгрузки информа ции.
Электронная библиотека не требует больших затрат труда, предоставляя пользователю более сконцентрированную высо кокачественную информацию, которая была заранее прорабо тана и размечена специалистами.
Эти два способа поиска информации не конфликтуют, а до полняют друг друга, и не зря в уже упомянутой работе [4) нахо дим: «Основное соотношение между электронной информаци ей (ЭИ) и электронными библиотеками: если ЭИ выпускается как законченный продукт, то в ЭБ должны быть предусмотрены возможности ввода и удаления информационных объектов, их интеграции, реструктуризации и другие подобные операции».
Исследование некоммерческой компании Libri показыва ет, что в течение последнего времени объемы книговыдачи в 20 крупнейших библиотеках Великобритании неуклонно уменьшаются, в сумме на 21% за 5 лет. В целом по публичным библиотекам также наблюдается спад, но сравнительно неболь
353
Глава 8. Электронные библиотеки
шой. Отметим, что онлайновая национальная система «Народ ная Сеть» (People's Network) взяла на себя часть справочного об служивания населения, ранее выполнявшегося в библиотеках.
Дистанционная удаленность хранилища ресурсов и многих мест обслуживания от библиотечного здания, использование Интернета — это неотъемлемые характеристики электронной библиотеки. Они касаются и телекоммуникационной состав ляющей (сейчас трудно представить большую электронную библиотеку, не использующую интернет-технологий и ресурс ного компонента Интернета).
Об исчезновении со временем специальных и научно-техни ческих библиотек нужно сказать особо. Этот процесс, как пока зывает опыт фармацевтической компании Glaxo Smith Kline по созданию виртуальной библиотеки и ликвидации обычной спе циальной библиотеки, вполне возможен. В компании, выпус кающей более 7% мирового объема лекарств, работает более 100 тыс. служащих, из них 15 тыс. — в научно-исследователь ских подразделениях. Вице-президент по информатике, препо даватель университета г-жа Мелани О'Нил (Melanie O'Neil) ру ководит коллективом в 300 человек, работающих в 14 специали зированных библиотеках. Для фармацевтики процесс узкой специализации особенно заметен, и, возможно, поэтому фирме нужны не специальные библиотеки, а специалисты, работаю щие с информацией в очень узкой области знания. В своем но вом здании общей площадью 140 тыс. кв. метров фирма создала крупнейшую в Европе химическую лабораторию и не преду смотрела помещения для специальной библиотеки. Быть мо жет, такой подход окажется принципиально очень интересным. Напомним, что компания также закрывает и остальные 14 тра диционных специальных библиотек и переводит сотрудников непосредственно в исследовательские подразделения. По сути, речь идет о доведении до абсолюта идеи переноса библиотечно го обслуживания ближе к пользователю, о непрерывной и опе режающей доставке информации и документов на рабочий стол или в персональный компьютер исследователя.
Пугаться здесь нечего, ибо процесс внедрения специальных библиотекарей в состав исследовательских групп в чем-то схож с произошедшими изменениями в мире вычислительной техни ки: вместо главных вычислительных центров и больших машин
354
Программное обеспечение...
(мэйнфрэймов), использования выделенной команды специа листов по вычислительной технике, — вместо этого выделенно го отдельного комплекса достаточно широко распространились персональные компьютеры, непосредственно расположенные на рабочем столе исследователя. Обсуждение опыта компании «Глаксо» — это полезный повод понять соотношение справоч ных функций библиотекарей по сравнению с общеобразова тельной и вообще общественно значимой функцией.
Не случайно и компания «Эльзевир» в своих рекламных пла катах использует примерно такую же идею (на их картинке изо бражены четыре человека в кабине космического корабля: пи лот, астрофизик, инженер и библиотекарь).
В этом же ряду стоит формирование публичных микробиб лиотек (около 700 томов в каждой) в микрорайонах городков и сельских поселков Великобритании, все это элементы огром ной по значимости программы «Народная сеть» (People's Network).
8.3. Программное обеспечение процесса формирования электронной библиотеки: программа «Гринстон»
Электронные библиотеки с ресурсной точки зрения пред ставляют собой большие, хорошо организованные и тематиче ски сконцентрированные коллекции информации. Существует множество программных решений по организации и поддержке ЭБ. Чаще всего — это комплекс программ, программная систе ма, так как надо уметь автоматически генерировать, структури ровать, если надо, распознавать, хранить, использовать, преоб разовывать и передавать текстовые и графические файлы. Мы остановимся в этом разделе на представлении общедоступной системы «Гринстон» (Greenstone). Программный продукт «Гринстон» задумывался в целях оказания помоши в конструи ровании, простом и быстром создании такого рода коллекций. Коллекции могут быть очень большими, например включать гигабайты текстового материала; другие могут состоять из мил лионов (всего лишь!) документов. Кроме того, намного боль шие объемы информации могут быть ассоциированы с ука
355
Глава 8. Электронные библиотеки
занной коллекцией, например аудио-, видеоматериалы, изобра жения.
«Гринстон» является по сути своей международной и много язычной программой, она широко используется во многих странах. Эта программа работает со многими языками по видам как интерфейсов, так и языка коллекций. Распространяется данный программный продукт ЮНЕСКО в рамках известной программы «Информация для всех». «Гринстон» — многоплат форменная программа (лучше сказать — независимая от плат формы), работающая с операционными системами Windows всех типов, Unix, Macintosh OS/Х. Распространяется она через Интернет или как самоустанавливаюшийся продукт на оптиче ском диске CD-ROM.
Основную работу по установке программы «Гринстон» и формированию стандартной коллекции из новых материалов со стандартным интерфейсом можно выполнить буквально за не сколько минут. После этого нужно будет провести достаточно трудоемкую механическую работу по непосредственному вводу полнотекстовых документов в созданную оболочку, что соста вит от нескольких минут, если у вас небольшая коллекция, и до нескольких часов, ежели коллекция большая, объемом во много гигабайтов. Такая работа может занять целый день, если вам приходится вводить множество полнотекстовых указателей.
Электронную коллекцию можно построить в самом различ ном оформлении в соответствии с вашими желаниями и пред ставлениями об удобном и прекрасном. При этом, конечно, нужно учитывать, что коллекции некоторых типов, например большие коллекции, имеют свои неповторимые черты, особен ности и требования. Окончательный выбор оформления и от ладка могут занять несколько дней, а может быть и более, если вы будете неоднократно каждый раз переделывать оформление интерфейса по ходу практических испытаний.
По мере роста общей электронной коллекции и увеличения количества отдельных собраний внутри нее может оказаться по лезным переиначить весь фонд по образу и подобию какого-то определенного собрания внутри фонда или повторить какой-то понравившийся вам тип оформления из уже существующих фондов. «Гринстон» легко позволяет проводить такого рода мо дернизации. И кроме того, с программой «Гринстон» вы очень
356
Программное обеспечение...
легко сможете повторить (или перенести на другой сайт) оформление вашего интерфейса в другой библиотеке.
Предоставляемые данной программой сервисы и разнообра зие видов интерфейса при осуществлении поиска и просмотра могут адаптироваться под ваши нужды на многих уровнях. Пользователи могут легко настроиться на различные операци онные системы и различные форматы документов (например, HTML, Word, PDF, PostScript, Power Point, Excel). При наличии готовых метаданных (например, в составе файлов XML, откры того архива OAI, библиографии в формате Latex) они включа ются в состав записи. Если существует необходимость добавить поисковые индексы (например, специально выделить значи мость языка для полнотекстовых документов или какие-то метаданные, допустим, заглавия), — все это возможно в «Гринстон». Пользователь может формировать элементы структурно го поиска и просмотра, в том числе список авторов, наименова ний, классификационные иерархии и т. п.
Электронные библиотеки, по сравнению с другими интер активными системами, обладают тем преимуществом, что соот ветствующие интерфейсы опираются на использование мета данных. Метаданные — это «клей», с помощью которого новые документы включаются в состав электронной коллекции и не медленно становятся полноправными элементами этой коллек ции. Метаданные — это ключ к обеспечению поиска и просмот ра. В программу «Гринстон» заложено несколько различных ме ханизмов, позволяющих в полной мере воспользоваться этими инструментами.
Конструирование коллекций (формирование фонда). С помо щью программы «Гринстон» вы индивидуально конструируе те коллекции, чаще всего взяв за основу образ какой-то из су ществующих у вас коллекций, которая в наибольшей степени соответствует вашим (и ваших пользователей) потребностям, и повторив структуру понравившегося вам образца. Подготовлен ный таким образом короткий файл записывается как конфигу рационный. В нем специфицируются следующие параметры: название коллекции, адрес электронной почты создателя кол лекции (ответственного лица), цели и принципы создания кол лекции, форматы файлов ввода данных, источники метадан ных, форматы записи метаданных, характеристики пользова
3 5 7
Глава 8. Электронные библиотеки
тельского интерфейса. Значительная часть информации, связанной с подстройкой программы «Гринстон» и не относя щейся к профессиональному перепрограммированию, будет храниться в этом файле. Его формирование самым существен ным образом зависит от наличия метаданных и определенной структуры.
Поиск по полному тексту всей коллекции является основ ной особенностью этой программы, который по умолчанию включается во все формируемые части коллекции. Конструкто ры коллекции сами должны определиться, нужен ли им поиск по параграфу (абзацу), разделу документа или по всему тексту документа (этот параметр потом скажется при выдаче результа тов поиска). Конструктор может также сделать, чтобы индексы полнотекстового поиска были встроены в систему метаданных (например, заглавия, авторы и т. п.). Допускается разбиение це лого фонда на какие-то части, внутри которых по отдельно взя той подчасти можно проводить полнотекстовый поиск. Можно также проставить языковые метаданные, так что поиск будет при необходимости проводиться в пределах заранее выбранного языка.
Возможности просмотра коллекций достаточно существен но различаются в зависимости от имеющихся метаданных и тех видов обслуживания, которые конструктор системы заложил в нее. В программу «Гринстон» входят заранее определенные структуры, основанные на том или ином виде метаданных. Лю бые текстовые метаданные можно представить в виде алфавит ного списка, автоматически подключаемого в разумных преде лах для того, чтобы в каждой демонстрируемой части оказалось приемлемое количество документов. Данные, касающиеся вре мени (например, год публикации), также формируются в спи сок, позволяющий выбрать нужный интервал, осуществить выборку по годам или по месяцам. Метаданные, имеющие ие рархическую структуру, например библиотечные классифика ционные системы, могут быть реализованы в виде дерева с воз можностью переходить по нужным уровням обобщения. В этом случае пользователь должен сформировать дополнительный файл с указанием соответствия (например, предметные рубри ки сопоставлены с классификационными номерами).
358
Программное обеспечение...
Указания по форматированию необходимы для того, чтобы пользователь мог настроить под свои требования каждую кар тинку, которую система генерирует. В этом документе указыва ется, в каком порядке осуществляется демонстрация — идет ли сначала заголовок отдельной картинкой, или просто заголовок с отступом предваряет текст и т. п. Формулируется общее рас положение результатов поиска, определяется, какие метадан ные будут показаны в качестве повтора или разъяснения запро са, нужно ли показывать общий вид документа, нужно ли давать гиперссылки и к какому документу. В коллекции, состоящей из документов различного формата (например, Word или HTML), полезно будет указывать в результатах поиска возможные фор маты выгрузки, с тем чтобы пользователь смог сам определить ся, что ему нужно. Указания по форматированию добавляются к вышеупомянутому документу по условиям просмотра.
Другие особенности. «Гринстон» является многоязычной системой. В настоящее время созданы интерфейсы на следую щих языках: английском, арабском, китайском, чешском, гол ландском, французском, галисийском, немецком, иврите, ин донезийском, итальянском, японском, казахском, маори, пор тугальском, русском, испанском, тайском и турецком. Для того чтобы эффективно использовать это языковое богатство и для обеспечения подстройки соответствующего языка интерфейса при пополнении коллекции, все сетевые страницы до их демон страции пропускаются через макрокоманду расширения языко вой базы, опирающуюся на контрольную фразу. Это значит, что новый язык может быть добавлен путем включения нескольких типовых текстовых фрагментов и этим способом легко и неод нократно сможет пользоваться человек, не очень-то искушен ный в тонкостях программы «Гринстон».
Инсталляция программы и формирование коллекции дос тупны человеку с весьма средними компьютерными способно стями. Однако при наличии определенных навыков вы сможете сделать намного больше. При знании языка HTML вы сумеете включить утилиты «Гринстона», например механизм полнотек стового поиска или просмотровые подпрограммы, в ваши соб ственные страницы. Если вы владеете JavaScript, то вам удастся добавить себе механизм просмотра изображений, а при знании Perl можно будет существенно обновить процесс просмотра, на
359
Глава 8. Электронные библиотеки
пример добавив в него программу PinYin для работы с китай скими текстами. «Гринстон» спроектирован на базе глубокой философии: простые вещи должны быть простыми, а слож ные — доступными.
Некоторые более «продвинутые» возможности также можно включить в работу с коллекцией, добавив совсем немного в конфигурационный файл:
•создать для пользователя режим, близкий к режиму рабо ты с печатными предметными рубриками или тезауруса ми: программа может автоматически извлекать из полного текста фразы и строить иерархические отношения между ними;
•автоматически извлекать из текста акронимы и их рас шифровку;
•автоматически распознавать язык каждого документа и использовать для создания индексов на каждом языке.
Как это обычно бывает при работе со столь высокоразвитой системой, как «Гринстон», самые жесткие требования предъяв ляются к оформлению документов, входящих в коллекцию. Можно сказать, что именно документация является самым уз ким местом. Естественно, что создатели коллекции зачастую нуждаются в оказании помощи и консультациях, с тем чтобы подстроить программу под какие-то вновь возникающие зада чи. Существует дискуссионная группа, объединяющая участни ков из 40 стран и работающая в электронной почте. Она оказы вает любую помощь участникам группы. Имеется обширная до кументация на английском, французском, испанском и русском языках. ЮНЕСКО организует серию региональных программ переподготовки по использованию «Гринстон», и эта программа включается в пакеты по управлению информацией.
8.4. Оценки эффективности работы электронной библиотеки
Улучшение качества работы библиотек и информационных центров может оказать позитивное воздействие на окружающий мир, помогая созданию общества 2020 г., в котором правитель
360