Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Электронная информация и электронные ресурсы

..pdf
Скачиваний:
3
Добавлен:
20.11.2023
Размер:
20.88 Mб
Скачать

Базовые определения

электронные фонды — совокупность тематически одно­ родных или разнородных коллекций, объединенных по заданному признаку и расположению, как правило, на од­ ном сайте (портале).

Одним из наиболее распространенных признаков является принадлежность фонда к библиотеке; именно библиотека под своей крышей (обычной или электронной) объединяет разные тематические коллекции, образуя библиотечный фонд. Иногда говорят «фонды библиотек» — это все равно означает один биб­ лиотечный фонд, который может размещаться на разных пло­ щадях, в разных географических местах, в том числе (редко) на разных сайтах.

В следующей главе мы приведем свои определения элек­ тронной библиотеки и электронного ресурса, которые уже из­ вестны тем, кто читал наш основной учебник по электронным библиотекам [1J. Однако следует иметь в виду, что на практике очень часто трудно уловить разницу в практической интерпре­ тации определений, и это видно из нижеследующего примера.

Так, очень поучительным и полезным для понимания раз­ ницы между электронным ресурсом и электронной библиоте­ кой может оказаться изучение состава «Сети обнаружения ре­ сурсов» (Resource Discovery Network, RDN), существующей как часть программы создания электронных библиотек Великобри­ тании (eLib). Это фактически бесплатный национальный пор­ тал Великобритании по 8 крупным разделам:

1.Искусство и творческие инициативы.

2.Математика, машиностроение, компьютерные науки.

3.География и окружающая среда.

4.Здравоохранение, медицина, науки о жизни.

5.Гостеприимство, отдых, спорт, туризм.

6.Гуманитарные проблемы.

7.Физические науки.

8.Общественные науки, бизнес, право.

Это набор ресурсов сформирован и поддерживается корпо­ ративными усилиями 70 университетов и научных институтов страны. В отличие от обычных поисковых машин ресурсы тща­ тельно отобраны (сейчас это более 120 тыс. сайтов). А часть это­

291

Глава 7. Электронные коллекции и электронные фонды

го портала, если угодно, субпортал — Edinburg Engineering Virtual Library (EEVL) — портал бесплатного доступа к темати­ ческим ресурсам, создан в 1996 г. в Эдинбурге как часть систе­ мы RDN (себя они называют путеводителем по высококачест­ венным ресурсам Интернета) по машиностроению, математи­ ке, компьютерным наукам с акцентом на работы, выполненные в Великобритании. Созданный в ведущем шотландском техни­ ческом университете Хериот—Ватт ресурс содержит 10 тыс. описаний сайтов, которые каталогизированы высококлассны­ ми специалистами английских университетов и гиперсвязи к которым регулярно проверяются.

7.2. Типология коллекций. Базы данных

Свойства и типология коллекций для целей нашей книги во многом определяются видом продукции, доминирующим для данной компании, данного поставщика. С этой точки зрения можно классифицировать имеющиеся коллекции по типу ос­ новного продукта:

полнотекстовые электронные журналы;

полнотекстовая справочная литература;

полнотекстовые официальные документы;

патенты и стандарты;

мультимедийные и полнотекстовые учебно-методические материалы;

электронные книги разной направленности;

базы данных различного рода.

В этом списке все ясно, как и ясна условность классифика­ ции. В предыдущих главах мы почти ничего не говорили о базах данных, поэтому остановимся на этом подробнее. Конечно, изучению баз данных посвящено большое число публикаций, есть ряд монографий и учебников, основополагающие моменты излагаются в курсах информатики. Тем не менее некоторая де­ тализация нужна в рамках настоящей главы. Мы не будем изу­ чать типологию баз данных, имея в виду реляционные, сетевые и иерархические типы; не будем рассматривать особенности ме­

292

Типология коллекций. Базы данных

ханизмов СУБД (система управления базами данных) и целый ряд других специальных и узкопрофессиональных моментов. Наша задача — подчеркнуть, что базы данных являются своего рода электронной коллекцией (то есть можно говорить не толь­ ко о документальных или музейных электронных коллекциях) и что базы данных — самостоятельный вид электронных ресур­ сов, исторически, может быть, самый первый.

Базы данных. Первыми видами электронных ресурсов, пред­ назначенных для пользования широкой публики были библио­ графические, фактографические и реферативные базы данных. И в наше время использование баз данных составляет один из ключевых компонентов работы научных библиотек. К сожале­ нию, в российских библиотеках обслуживание внешними база­ ми данных ведется не очень активно по сравнению с зарубеж­ ными библиотеками; может, дело в том, что центры научно-тех­ нической информации, действующие в 69 регионах России, взяли на себя эту ношу. Однако сегодня и эта ниша практически закрывается.

Формальное определение базы данных представлено в ГОСТ 20886 «Организация данных в системах обработки дан­ ных. Термины и определения» и повторено в ГОСТ 7.70—96 «Описание баз данных и машиночитаемых информационных массивов. Состав и обозначение характеристик»: «База данных — совокупность данных, организованных по определенным пра­ вилам, предусматривающим общие принципы описания, хра­ нения данных и манипулирования данными, независимо от прикладных программ». Там же «банк данных» определяется как автоматизированная информационная система, состоящая из одной или нескольких баз данных и системы хранения, обра­ ботки и поиска». Эти определения не раскрывают основные особенности баз данных. Мы предлагаем несколько иное опре­ деление: «База данных (БД) — структурированный тематический отобранный массив информации, состоящий из большого набора однотипных элементов».

Число элементов («записей») в БД от сотен до нескольких миллионов, хотя база данных может состоять и из нескольких записей. Каждый из элементов БД имеет одинаковую структуру (состоит из одинакового набора «полей» или «областей»). Число

293

Глава 7. Электронные коллекции и электронные фонды

полей — от 2 до сотни, в зависимости от характера использова­ ния базы данных заполнение некоторых полей может быть обя­ зательным, а некоторых — факультативным; поля могут делить­ ся на подполя. Размер отдельной записи может быть ограничен каким-то количеством знаков или слов. Основное свойство БД — возможность проводить поиск информации и другие дей­ ствия по любым выбранным полям или по их произвольной комбинации, а также по некоторым заранее определенным под­ полям (в английской литературе их называют иногда «access points» — «точки доступа») во всем массиве базы данных. Если сравнить с поиском данных, занесенных в таблицы, то есть на двумерном или многомерном пространстве, то наличие полей в базе данных позволяет проводить поиск необходимой инфор­ мации намного точнее и быстрее. Если представить себе некие образы, то поиск данных идет в искусственно суженной и зара­ нее заданной области параметров, «в коридоре», а не на «широ­ кой поляне».

Нужно заметить, что все еще существует определенная несо­ гласованность в понимании того, какие базы данных использу­ ются в библиотеках, каковы их объем и параметры. Из-за этого могут одинаково учитываться и крошечные, в десятки записей базы данных, и гигантские, состоящие из миллионов записей. Столь же существенно, идет ли речь о базах данных собственно­ го производства либо это имеющиеся на серверах библиотеки чужие материалы или закупленные библиотекой материалы (на пользование которыми получена лицензия)? Или вообще упо­ минаются бесплатные базы данных, размещенные в Интернете, адреса которых были включены в библиотечный каталог или ре­ комендательные списки. Дело в том, что генерация баз дан­ ных — сложный процесс, требующий участия библиотекарей, библиографов, программистов и технологов; для предоставле­ ния доступа к созданной «на стороне» базе данных нужны дру­ гие специалисты. Каждая из поименованных позиций отражает возможности и одновременно амбиции библиотеки, и наведе­ ние минимального порядка в определениях поможет проводить обоснованные сравнения и анализ.

В контексте данной главы нам следует также обратить вни­ мание читателя, что очень часто в профессиональной литерату­

294

Типология коллекций. Базы данных

ре (особенно в англоязычной по библиотечно-информацион­ ным проблемам) фактически любая коллекция электронных документов, так или иначе связанная с поисковой системой, именуется базой данных. Например, обращение к коллекции текущих поступлений полнотекстового электронного журнала называется обращением к базе данных. Так же будет звучать и обращение к ретроспективной коллекции и т. д.

В конечном счете электронный каталог библиотеки — это тоже база данных, снабженная специальными поисковыми средствами для работы с библиографической информацией. Одной из первых в мире специализированных систем, условно скажем СУБД (хотя для данного случая это действительно ус­ ловно), была известная разработка ЮНЕСКО CDS/ISIS, по ко­ торой, кстати, все еще работают сотни библиотек в Италии, Ис­ пании, Аргентине (включая национальную), странах бывшего

СССР. Даже столь популярная в России и странах СНГ система автоматизации библиотек ИРБИС (разработка ГПНТБ России) во многом использовала идеи CDS/ISIS, и только последние, новые версии ИРБИ С 64 уже полностью переписаны другими программными средствами. Огромным преимуществом CDS/ISIS было то, что система специально проектировалась как ИПС для библиотечно-информационных массивов и по скорости и результативности поиска превосходила многие ком­ мерческие разработки СУБД универсального плана. CDS/ISIS всегда бесплатно поставлялась библиотекам всего мира и сыг­ рала огромную роль в развитии и становлении библиотечной автоматизации и создании библиографических баз данных.

Систем управления базами данных (СУБД, DBMS — Data Base Management System) существует очень много, назовем лишь некоторые, самые популярные: ORACLE, SQLbase, Adabas, SYBASE и др.

В настоящее время трудно найти производителя любой мас­ совой или многотиражной продукции, который не имел бы соб­ ственной базы данных — касается ли это описаний самой про­ дукции, поставщиков материалов и услуг, потребителей и, ко­ нечно, каталогов всех видов и т. п. Как некий пример такого рода — базы данных книготорговых организаций, посредников, поставщиков. В этом случае содержание базы данных играет в

295

Глава 7. Электронные коллекции и электронные фонды

общем-то вспомогательную роль, помогая быстрее найти необ­ ходимый документ или услугу. Однако существует множество организаций, для которых основным поставляемым на рынок товаром является само содержание баз данных, и это в первую очередь — поставщики информационной и, естественно, биб­ лиографической продукции.

7.3. Зарубежные некоммерческие поставщики информации

Мы достаточно подробно анализировали этот вопрос в на­ шем учебнике [1], но решились на некоторый повтор здесь, во-первых, потому что уверены, что не все читали указанный учебник; во-вторых, потому что многие данные обновились; и, в-третьих, любая актуальная информация о поставщиках элек­ тронных коллекций, особенно в Интернете, позволяет более де­ тально и адекватно раскрыть тему настоящей главы.

Представленные нами зарубежные и отечественные постав­ щики информации в определенной мере выбраны произвольно, поскольку отвечают нашим познаниям в области научно-техни­ ческой информации, и со временем их список может быть до­ полнен. Основной мотив его публикации — стремление рас­ крыть на нескольких примерах огромный мир совершенно но­ вой индустрии — производства электронной информации в промышленных масштабах. Столь же намеренно мы не сообща­ ем о крупнейших инвестиционных компаниях, которые факти­ чески являются владельцами хорошо известных книготорговых

ииздательских домов.

Опроблемах, связанных с использованием электронных ре­ сурсов, в частности, электронных коллекций, зачастую абсо­ лютно новых по подходам, мы рассказываем подробнее, по­ скольку наши библиотечные работники уже начинают сталки­ ваться с ними в своей практике.

Из общего объема продаж научно-технических и медицин­ ских публикаций в Европе в 2002—2005 гг. почти 50% приходит­ ся на сетевые продукты; лидируют известные компании Elsevier, Kluwer и Thomson (табл. 46).

296

Зарубежные некоммерческие поставщики информации

Таблица 46

Изменения доли традиционных и сетевых продуктов на европейском рынке научно-технической и медицинской информации (по данным исследовательской компании IRN), % объема продаж

Формат

 

 

Годы

 

 

2000

2001

2002

2003

Сетевые продукты (онлайн)

31

32

42

48

Традиционные продукты (hard сору)

69

68

58

52

В 2004—2006 гг. онлайновые продукты резко продвинулись на рынке, их доля по разным оценкам составляет 60—70%. Не­ смотря на устаревшие сведения, весьма познавательны данные табл. 47; примерно такие же пропорции по основным игрокам рынка сохранились и сейчас.

Таблица 47

Основные поставщики сетевых продуктов на европейском рынке научно-технической и медицинской информации в 2002 г.

(результаты анкетирования 110 специалистов Великобритании, Германии, Франции, проценты пользователей данного продукта)

Н а и м е н о в а н и е с е т е в о г о п р о д у к т а , к о м п а н и я

П р о ц ен т п ользую щ ихся

 

д ан н ы м продуктом

Science Direct, Elsevier

56

Web o f Knowledge, Thomson

43

Springer Verlag

34

Wiley Interscience

30

Ovid/Silver Platter

25

Kluwer Online

24

Cambridge Scientific Abstracts, CSA

21

STN

17

 

IN IS T -C N R S

17

 

297

Глава 7. Электронные коллекции и электронные фонды

Основная часть пользователей STN находится в Германии, а пользователей INIST-CNRS — во Франции. Для Elsevier прода­ жи Science Direct приносят 75% дохода от подписки, для компа­ ний Thomson и Wiley сетевые продукты приносят более 60% до­ хода. 90% опрошенных начальные этапы работы в Сети прово­ дят с бесплатными источниками и только на завершающей стадии обращаются к поставщикам платной информации.

К рассматриваемой в настоящем разделе группе организа­ ций в первую очередь относятся научные общества, государст­ венные учреждения и бесприбыльные организации

Американское химическое общество (American Chemical Society, www.acs.org) выпускает наиболее авторитетные и широ­ ко цитируемые журналы по химии, сельскому хозяйству, эко­ логии.

Американский институт физики (American Institute of Physics, www.aip.org). Его издания «Журнал химической физи­ ки» (The Journal of Chemical Physics), «Письма прикладной фи­ зики» (Applied Physics Letters) и т. п. дают в придачу пятилетний архив: за 65—95 долларов годовой дополнительной подписки дается архив до 1975 г. (с 2004 г. подписки — архив до 1968 г.).

Британская (национальная) библиотека (British Library, www.bl.uk), хорошо известна своим электронным каталогом и системами баз данных Blaise, Inside. Доступ к некоторым базам данных осуществляется на платной основе и входит в огромную систему доставки документов на основе коллекций Британской библиотеки (Центр доставки документов в Бостон-Спа, BLDSC). Среди новых разработок Центра — электронная сис­ тема, повторяющая физически (тактильно) для вас процесс лис­ тания страниц виртуальной книги: прикосновение к экрану и начало движения пальцем по экрану влево вызовет появление следующей страницы на дисплее.

EduServ (www.edusev.org.uk) — некоммерческая организа­ ция, поставляющая материалы по образованию (служба Niss), оказывающая информационные услуги в сфере образования (служба Chest) и предлагающая единую систему поставки ин­ формации (служба Athens), которой сейчас пользуются 750 тыс. клиентов в 400 организациях.

Центр научно-технической информации в Карлсруэ (F1Z Karlsruhe, www.fiz-karlsruhe.de) — бесприбыльная организация,

298

Зарубежные некоммерческие поставщики информации

создана в 1977 г., штат 340 человек. Совместно с американской химической службой Chemical Absrtract Services и японским центром НТИ создал систему научно-технической информации STN (www.stn-international.de), которая в настоящее время со­ стоит из 220 полнотекстовых и библиографических баз данных (более 40 млн документов),по таким специальностям, как орга­ ническая химия (Beilstein), медицина (Medline)*, фармацевти­ ка, биотехнология, машиностроение (Compendex), физика, электроника и компьютерные науки (библиографическая база данных INSPEC), нефтехимия (база данных TULSA), резины, пластики и клеи (RAPRA), бумаги, картона, целлюлозы (PIRA) и база данных 35 млн описаний патентов (Derwent, INPADOC). Утверждается, что система STN обеспечивает доступ к 400 млн полнотекстовых документов. Центр в Карлсруэ также генериру­ ет собственные базы данных, в том числе по математике (Math, MathDI), энергетике (Energy), полимерам (APOLLIT), «серой литературе» (SIGLE) и т. п.

Институт инженеров по электротехнике и электронике (IEEE, Institute of Electrical and Electronics Engineers, www.iee.org) — крупнейший в мире конгломерат из 39 профессиональных бес­ прибыльных обществ (около 400 тыс. членов в 150 странах), вы­ пускающий 30% мировой литературы по электротехнике, элект­ ронике, компьютерам, системам управления, прикладной фи­ зике и организующий 300 конференций ежегодно, создал 800 дей­ ствующих стандартов. Стоимость подписки на полный набор публикаций IEEE/1EE, состоящий из журналов, трудов конфе­ ренций, стандартов и т. п., около 500 тыс. долларов. Научные ис­ следования библиотеки Университета штата Висконсин и «Биб­ лиотечного журнала» (Library Journal) показывают, что журналы IEEE/I ЕЕ по машиностроению в среднем существенно дешевле других по данной же тематике (по состоянию на 2001 г. 375 дол­ ларов против 1142 долларов); такого же рода соотношение на­ блюдается и по другим тематикам. В электронной библиотеке 1ЕЕЕ/1ЕЕ Electronic Library (IEL, www.ieee.oig/products/online/iel) более 4 тыс. наименований журналов, выпушенных за послед­

ние годы,

775 тыс. статей, 2,3 млн страниц в формате .pdf от

*

Базы

данны х Н ациональной медицинской библиотеки С Ш А —

один

из главных мировых м едицинских информационных продуктов.

299

Глава 7. Электронные коллекции и электронные фонды

475 тысяч авторов; все это, по данным «Отчетов о журнальном цитировании» (Journal Citation Report, 2000)* — высококачест­ венные, наиболее часто цитируемые журналы.

Институт научно-технической информации (IN 1ST — CNRS, www.inist.fr) также известен как производитель многих библио­ графических БД, в том числе Pascale (политематическая, много­ язычная база данных, содержащая около 14 млн библиографи­ ческих записей по науке, технике, технологии, медицине с 1973 г.); Francis (база данных по общественным и социальным наукам содержит 3 млн библиографических записей с 1972 г.). Коллекции: 26 тыс. наименований журналов, в том числе 8500 — текущая подписка; 60 тыс. научных отчетов; 62 тыс. тру­ дов конференций; ПО тыс. докторских диссертаций; 10 тыс. книг. Ведется пополнение БД (600 тыс. записей в год), доставка документов (700 тыс. в год), в том числе и через электронную систему Ariel; среди 6000 коллективных пользователей крупней­ шие НИИ, университеты, инновационные центры; нагрузка на веб-сайт www.inist.fr — 2 тыс. посещений в день.

OCLC (www.oclc.org; европейское отделение после слияния с голландско-немецким консорциумом PICA называется OCLC PICA) — крупнейшее библиографическое предприятие мира, создано в 1975 г. По форме собственности — это некоммерче­ ская кооперативная бесприбыльная организация, членами ко­ торой являются около 9500 библиотек. Совместно со служащи­ ми OCLC библиотеки-участницы составляют гигантскую базу высококачественных каталогизационных описаний — Сводный каталог WorldCat. Пользователями системы являются более 60 тыс. библиотек (из них более 10 тыс. — за пределами США в 102 странах, в том числе крупнейшие библиотеки наиболее раз­ витых стран). В компании — 1200 сотрудников, годовой доход — 200 млн долларов; за все время существования было выдано по системе МБА 150 млн документов. Система FirstSearch объеди­ няет более чем 75 БД с переходом к полным текстам документов (например, к системе депозитарного хранения JSTOR). Компа­ ния поддержала инициативу по открытым архивам (Open Archive Initiative), в том числе по метаданным. Компания ведет

* Данны е были опубликованы в 2001 г.

300

Соседние файлы в папке книги