книги / Электронная информация и электронные ресурсы
..pdfБазовые определения
•электронные фонды — совокупность тематически одно родных или разнородных коллекций, объединенных по заданному признаку и расположению, как правило, на од ном сайте (портале).
Одним из наиболее распространенных признаков является принадлежность фонда к библиотеке; именно библиотека под своей крышей (обычной или электронной) объединяет разные тематические коллекции, образуя библиотечный фонд. Иногда говорят «фонды библиотек» — это все равно означает один биб лиотечный фонд, который может размещаться на разных пло щадях, в разных географических местах, в том числе (редко) на разных сайтах.
В следующей главе мы приведем свои определения элек тронной библиотеки и электронного ресурса, которые уже из вестны тем, кто читал наш основной учебник по электронным библиотекам [1J. Однако следует иметь в виду, что на практике очень часто трудно уловить разницу в практической интерпре тации определений, и это видно из нижеследующего примера.
Так, очень поучительным и полезным для понимания раз ницы между электронным ресурсом и электронной библиоте кой может оказаться изучение состава «Сети обнаружения ре сурсов» (Resource Discovery Network, RDN), существующей как часть программы создания электронных библиотек Великобри тании (eLib). Это фактически бесплатный национальный пор тал Великобритании по 8 крупным разделам:
1.Искусство и творческие инициативы.
2.Математика, машиностроение, компьютерные науки.
3.География и окружающая среда.
4.Здравоохранение, медицина, науки о жизни.
5.Гостеприимство, отдых, спорт, туризм.
6.Гуманитарные проблемы.
7.Физические науки.
8.Общественные науки, бизнес, право.
Это набор ресурсов сформирован и поддерживается корпо ративными усилиями 70 университетов и научных институтов страны. В отличие от обычных поисковых машин ресурсы тща тельно отобраны (сейчас это более 120 тыс. сайтов). А часть это
291
Глава 7. Электронные коллекции и электронные фонды
го портала, если угодно, субпортал — Edinburg Engineering Virtual Library (EEVL) — портал бесплатного доступа к темати ческим ресурсам, создан в 1996 г. в Эдинбурге как часть систе мы RDN (себя они называют путеводителем по высококачест венным ресурсам Интернета) по машиностроению, математи ке, компьютерным наукам с акцентом на работы, выполненные в Великобритании. Созданный в ведущем шотландском техни ческом университете Хериот—Ватт ресурс содержит 10 тыс. описаний сайтов, которые каталогизированы высококлассны ми специалистами английских университетов и гиперсвязи к которым регулярно проверяются.
7.2. Типология коллекций. Базы данных
Свойства и типология коллекций для целей нашей книги во многом определяются видом продукции, доминирующим для данной компании, данного поставщика. С этой точки зрения можно классифицировать имеющиеся коллекции по типу ос новного продукта:
•полнотекстовые электронные журналы;
•полнотекстовая справочная литература;
•полнотекстовые официальные документы;
•патенты и стандарты;
•мультимедийные и полнотекстовые учебно-методические материалы;
•электронные книги разной направленности;
•базы данных различного рода.
В этом списке все ясно, как и ясна условность классифика ции. В предыдущих главах мы почти ничего не говорили о базах данных, поэтому остановимся на этом подробнее. Конечно, изучению баз данных посвящено большое число публикаций, есть ряд монографий и учебников, основополагающие моменты излагаются в курсах информатики. Тем не менее некоторая де тализация нужна в рамках настоящей главы. Мы не будем изу чать типологию баз данных, имея в виду реляционные, сетевые и иерархические типы; не будем рассматривать особенности ме
292
Типология коллекций. Базы данных
ханизмов СУБД (система управления базами данных) и целый ряд других специальных и узкопрофессиональных моментов. Наша задача — подчеркнуть, что базы данных являются своего рода электронной коллекцией (то есть можно говорить не толь ко о документальных или музейных электронных коллекциях) и что базы данных — самостоятельный вид электронных ресур сов, исторически, может быть, самый первый.
Базы данных. Первыми видами электронных ресурсов, пред назначенных для пользования широкой публики были библио графические, фактографические и реферативные базы данных. И в наше время использование баз данных составляет один из ключевых компонентов работы научных библиотек. К сожале нию, в российских библиотеках обслуживание внешними база ми данных ведется не очень активно по сравнению с зарубеж ными библиотеками; может, дело в том, что центры научно-тех нической информации, действующие в 69 регионах России, взяли на себя эту ношу. Однако сегодня и эта ниша практически закрывается.
Формальное определение базы данных представлено в ГОСТ 20886 «Организация данных в системах обработки дан ных. Термины и определения» и повторено в ГОСТ 7.70—96 «Описание баз данных и машиночитаемых информационных массивов. Состав и обозначение характеристик»: «База данных — совокупность данных, организованных по определенным пра вилам, предусматривающим общие принципы описания, хра нения данных и манипулирования данными, независимо от прикладных программ». Там же «банк данных» определяется как автоматизированная информационная система, состоящая из одной или нескольких баз данных и системы хранения, обра ботки и поиска». Эти определения не раскрывают основные особенности баз данных. Мы предлагаем несколько иное опре деление: «База данных (БД) — структурированный тематический отобранный массив информации, состоящий из большого набора однотипных элементов».
Число элементов («записей») в БД от сотен до нескольких миллионов, хотя база данных может состоять и из нескольких записей. Каждый из элементов БД имеет одинаковую структуру (состоит из одинакового набора «полей» или «областей»). Число
293
Глава 7. Электронные коллекции и электронные фонды
полей — от 2 до сотни, в зависимости от характера использова ния базы данных заполнение некоторых полей может быть обя зательным, а некоторых — факультативным; поля могут делить ся на подполя. Размер отдельной записи может быть ограничен каким-то количеством знаков или слов. Основное свойство БД — возможность проводить поиск информации и другие дей ствия по любым выбранным полям или по их произвольной комбинации, а также по некоторым заранее определенным под полям (в английской литературе их называют иногда «access points» — «точки доступа») во всем массиве базы данных. Если сравнить с поиском данных, занесенных в таблицы, то есть на двумерном или многомерном пространстве, то наличие полей в базе данных позволяет проводить поиск необходимой инфор мации намного точнее и быстрее. Если представить себе некие образы, то поиск данных идет в искусственно суженной и зара нее заданной области параметров, «в коридоре», а не на «широ кой поляне».
Нужно заметить, что все еще существует определенная несо гласованность в понимании того, какие базы данных использу ются в библиотеках, каковы их объем и параметры. Из-за этого могут одинаково учитываться и крошечные, в десятки записей базы данных, и гигантские, состоящие из миллионов записей. Столь же существенно, идет ли речь о базах данных собственно го производства либо это имеющиеся на серверах библиотеки чужие материалы или закупленные библиотекой материалы (на пользование которыми получена лицензия)? Или вообще упо минаются бесплатные базы данных, размещенные в Интернете, адреса которых были включены в библиотечный каталог или ре комендательные списки. Дело в том, что генерация баз дан ных — сложный процесс, требующий участия библиотекарей, библиографов, программистов и технологов; для предоставле ния доступа к созданной «на стороне» базе данных нужны дру гие специалисты. Каждая из поименованных позиций отражает возможности и одновременно амбиции библиотеки, и наведе ние минимального порядка в определениях поможет проводить обоснованные сравнения и анализ.
В контексте данной главы нам следует также обратить вни мание читателя, что очень часто в профессиональной литерату
294
Типология коллекций. Базы данных
ре (особенно в англоязычной по библиотечно-информацион ным проблемам) фактически любая коллекция электронных документов, так или иначе связанная с поисковой системой, именуется базой данных. Например, обращение к коллекции текущих поступлений полнотекстового электронного журнала называется обращением к базе данных. Так же будет звучать и обращение к ретроспективной коллекции и т. д.
В конечном счете электронный каталог библиотеки — это тоже база данных, снабженная специальными поисковыми средствами для работы с библиографической информацией. Одной из первых в мире специализированных систем, условно скажем СУБД (хотя для данного случая это действительно ус ловно), была известная разработка ЮНЕСКО CDS/ISIS, по ко торой, кстати, все еще работают сотни библиотек в Италии, Ис пании, Аргентине (включая национальную), странах бывшего
СССР. Даже столь популярная в России и странах СНГ система автоматизации библиотек ИРБИС (разработка ГПНТБ России) во многом использовала идеи CDS/ISIS, и только последние, новые версии ИРБИ С 64 уже полностью переписаны другими программными средствами. Огромным преимуществом CDS/ISIS было то, что система специально проектировалась как ИПС для библиотечно-информационных массивов и по скорости и результативности поиска превосходила многие ком мерческие разработки СУБД универсального плана. CDS/ISIS всегда бесплатно поставлялась библиотекам всего мира и сыг рала огромную роль в развитии и становлении библиотечной автоматизации и создании библиографических баз данных.
Систем управления базами данных (СУБД, DBMS — Data Base Management System) существует очень много, назовем лишь некоторые, самые популярные: ORACLE, SQLbase, Adabas, SYBASE и др.
В настоящее время трудно найти производителя любой мас совой или многотиражной продукции, который не имел бы соб ственной базы данных — касается ли это описаний самой про дукции, поставщиков материалов и услуг, потребителей и, ко нечно, каталогов всех видов и т. п. Как некий пример такого рода — базы данных книготорговых организаций, посредников, поставщиков. В этом случае содержание базы данных играет в
295
Глава 7. Электронные коллекции и электронные фонды
общем-то вспомогательную роль, помогая быстрее найти необ ходимый документ или услугу. Однако существует множество организаций, для которых основным поставляемым на рынок товаром является само содержание баз данных, и это в первую очередь — поставщики информационной и, естественно, биб лиографической продукции.
7.3. Зарубежные некоммерческие поставщики информации
Мы достаточно подробно анализировали этот вопрос в на шем учебнике [1], но решились на некоторый повтор здесь, во-первых, потому что уверены, что не все читали указанный учебник; во-вторых, потому что многие данные обновились; и, в-третьих, любая актуальная информация о поставщиках элек тронных коллекций, особенно в Интернете, позволяет более де тально и адекватно раскрыть тему настоящей главы.
Представленные нами зарубежные и отечественные постав щики информации в определенной мере выбраны произвольно, поскольку отвечают нашим познаниям в области научно-техни ческой информации, и со временем их список может быть до полнен. Основной мотив его публикации — стремление рас крыть на нескольких примерах огромный мир совершенно но вой индустрии — производства электронной информации в промышленных масштабах. Столь же намеренно мы не сообща ем о крупнейших инвестиционных компаниях, которые факти чески являются владельцами хорошо известных книготорговых
ииздательских домов.
Опроблемах, связанных с использованием электронных ре сурсов, в частности, электронных коллекций, зачастую абсо лютно новых по подходам, мы рассказываем подробнее, по скольку наши библиотечные работники уже начинают сталки ваться с ними в своей практике.
Из общего объема продаж научно-технических и медицин ских публикаций в Европе в 2002—2005 гг. почти 50% приходит ся на сетевые продукты; лидируют известные компании Elsevier, Kluwer и Thomson (табл. 46).
296
Зарубежные некоммерческие поставщики информации
Таблица 46
Изменения доли традиционных и сетевых продуктов на европейском рынке научно-технической и медицинской информации (по данным исследовательской компании IRN), % объема продаж
Формат |
|
|
Годы |
|
|
2000 |
2001 |
2002 |
2003 |
Сетевые продукты (онлайн) |
31 |
32 |
42 |
48 |
Традиционные продукты (hard сору) |
69 |
68 |
58 |
52 |
В 2004—2006 гг. онлайновые продукты резко продвинулись на рынке, их доля по разным оценкам составляет 60—70%. Не смотря на устаревшие сведения, весьма познавательны данные табл. 47; примерно такие же пропорции по основным игрокам рынка сохранились и сейчас.
Таблица 47
Основные поставщики сетевых продуктов на европейском рынке научно-технической и медицинской информации в 2002 г.
(результаты анкетирования 110 специалистов Великобритании, Германии, Франции, проценты пользователей данного продукта)
Н а и м е н о в а н и е с е т е в о г о п р о д у к т а , к о м п а н и я |
П р о ц ен т п ользую щ ихся |
|
д ан н ы м продуктом |
Science Direct, Elsevier |
56 |
Web o f Knowledge, Thomson |
43 |
Springer Verlag |
34 |
Wiley Interscience |
30 |
Ovid/Silver Platter |
25 |
Kluwer Online |
24 |
Cambridge Scientific Abstracts, CSA |
21 |
STN |
17 |
|
IN IS T -C N R S |
17 |
|
297
Глава 7. Электронные коллекции и электронные фонды
Основная часть пользователей STN находится в Германии, а пользователей INIST-CNRS — во Франции. Для Elsevier прода жи Science Direct приносят 75% дохода от подписки, для компа ний Thomson и Wiley сетевые продукты приносят более 60% до хода. 90% опрошенных начальные этапы работы в Сети прово дят с бесплатными источниками и только на завершающей стадии обращаются к поставщикам платной информации.
К рассматриваемой в настоящем разделе группе организа ций в первую очередь относятся научные общества, государст венные учреждения и бесприбыльные организации
Американское химическое общество (American Chemical Society, www.acs.org) выпускает наиболее авторитетные и широ ко цитируемые журналы по химии, сельскому хозяйству, эко логии.
Американский институт физики (American Institute of Physics, www.aip.org). Его издания «Журнал химической физи ки» (The Journal of Chemical Physics), «Письма прикладной фи зики» (Applied Physics Letters) и т. п. дают в придачу пятилетний архив: за 65—95 долларов годовой дополнительной подписки дается архив до 1975 г. (с 2004 г. подписки — архив до 1968 г.).
Британская (национальная) библиотека (British Library, www.bl.uk), хорошо известна своим электронным каталогом и системами баз данных Blaise, Inside. Доступ к некоторым базам данных осуществляется на платной основе и входит в огромную систему доставки документов на основе коллекций Британской библиотеки (Центр доставки документов в Бостон-Спа, BLDSC). Среди новых разработок Центра — электронная сис тема, повторяющая физически (тактильно) для вас процесс лис тания страниц виртуальной книги: прикосновение к экрану и начало движения пальцем по экрану влево вызовет появление следующей страницы на дисплее.
EduServ (www.edusev.org.uk) — некоммерческая организа ция, поставляющая материалы по образованию (служба Niss), оказывающая информационные услуги в сфере образования (служба Chest) и предлагающая единую систему поставки ин формации (служба Athens), которой сейчас пользуются 750 тыс. клиентов в 400 организациях.
Центр научно-технической информации в Карлсруэ (F1Z Karlsruhe, www.fiz-karlsruhe.de) — бесприбыльная организация,
298
Зарубежные некоммерческие поставщики информации
создана в 1977 г., штат 340 человек. Совместно с американской химической службой Chemical Absrtract Services и японским центром НТИ создал систему научно-технической информации STN (www.stn-international.de), которая в настоящее время со стоит из 220 полнотекстовых и библиографических баз данных (более 40 млн документов),по таким специальностям, как орга ническая химия (Beilstein), медицина (Medline)*, фармацевти ка, биотехнология, машиностроение (Compendex), физика, электроника и компьютерные науки (библиографическая база данных INSPEC), нефтехимия (база данных TULSA), резины, пластики и клеи (RAPRA), бумаги, картона, целлюлозы (PIRA) и база данных 35 млн описаний патентов (Derwent, INPADOC). Утверждается, что система STN обеспечивает доступ к 400 млн полнотекстовых документов. Центр в Карлсруэ также генериру ет собственные базы данных, в том числе по математике (Math, MathDI), энергетике (Energy), полимерам (APOLLIT), «серой литературе» (SIGLE) и т. п.
Институт инженеров по электротехнике и электронике (IEEE, Institute of Electrical and Electronics Engineers, www.iee.org) — крупнейший в мире конгломерат из 39 профессиональных бес прибыльных обществ (около 400 тыс. членов в 150 странах), вы пускающий 30% мировой литературы по электротехнике, элект ронике, компьютерам, системам управления, прикладной фи зике и организующий 300 конференций ежегодно, создал 800 дей ствующих стандартов. Стоимость подписки на полный набор публикаций IEEE/1EE, состоящий из журналов, трудов конфе ренций, стандартов и т. п., около 500 тыс. долларов. Научные ис следования библиотеки Университета штата Висконсин и «Биб лиотечного журнала» (Library Journal) показывают, что журналы IEEE/I ЕЕ по машиностроению в среднем существенно дешевле других по данной же тематике (по состоянию на 2001 г. 375 дол ларов против 1142 долларов); такого же рода соотношение на блюдается и по другим тематикам. В электронной библиотеке 1ЕЕЕ/1ЕЕ Electronic Library (IEL, www.ieee.oig/products/online/iel) более 4 тыс. наименований журналов, выпушенных за послед
ние годы, |
775 тыс. статей, 2,3 млн страниц в формате .pdf от |
|
* |
Базы |
данны х Н ациональной медицинской библиотеки С Ш А — |
один |
из главных мировых м едицинских информационных продуктов. |
299
Глава 7. Электронные коллекции и электронные фонды
475 тысяч авторов; все это, по данным «Отчетов о журнальном цитировании» (Journal Citation Report, 2000)* — высококачест венные, наиболее часто цитируемые журналы.
Институт научно-технической информации (IN 1ST — CNRS, www.inist.fr) также известен как производитель многих библио графических БД, в том числе Pascale (политематическая, много язычная база данных, содержащая около 14 млн библиографи ческих записей по науке, технике, технологии, медицине с 1973 г.); Francis (база данных по общественным и социальным наукам содержит 3 млн библиографических записей с 1972 г.). Коллекции: 26 тыс. наименований журналов, в том числе 8500 — текущая подписка; 60 тыс. научных отчетов; 62 тыс. тру дов конференций; ПО тыс. докторских диссертаций; 10 тыс. книг. Ведется пополнение БД (600 тыс. записей в год), доставка документов (700 тыс. в год), в том числе и через электронную систему Ariel; среди 6000 коллективных пользователей крупней шие НИИ, университеты, инновационные центры; нагрузка на веб-сайт www.inist.fr — 2 тыс. посещений в день.
OCLC (www.oclc.org; европейское отделение после слияния с голландско-немецким консорциумом PICA называется OCLC PICA) — крупнейшее библиографическое предприятие мира, создано в 1975 г. По форме собственности — это некоммерче ская кооперативная бесприбыльная организация, членами ко торой являются около 9500 библиотек. Совместно со служащи ми OCLC библиотеки-участницы составляют гигантскую базу высококачественных каталогизационных описаний — Сводный каталог WorldCat. Пользователями системы являются более 60 тыс. библиотек (из них более 10 тыс. — за пределами США в 102 странах, в том числе крупнейшие библиотеки наиболее раз витых стран). В компании — 1200 сотрудников, годовой доход — 200 млн долларов; за все время существования было выдано по системе МБА 150 млн документов. Система FirstSearch объеди няет более чем 75 БД с переходом к полным текстам документов (например, к системе депозитарного хранения JSTOR). Компа ния поддержала инициативу по открытым архивам (Open Archive Initiative), в том числе по метаданным. Компания ведет
* Данны е были опубликованы в 2001 г.
300