Максимов Информационные ресурсы и поисковые системы 2008
.pdfных входов, но выход не указан – его должен определять пользователь индивидуально в зависимости от собственных целей, наличных ресурсов и способностей.
Контрольные вопросы к разделу
1.Охарактеризуйте соотношение понятий «информация», «данные», «знания».
2.Приведите примеры, которые отражают цикличность информационного обмена.
3.Определите свойства информации.
4.Охарактеризуйте свойство рассеяния информации.
5.Дайте определение понятия «информационная система», «информационная технология»
6.Определите понятие «информационная деятельность».
7.Определите назначение и организацию инвертированно-
го списка.
8.Перечислите типы простых запросов.
9.Охарактеризуйте основные этапы процесса информационного поиска.
10.Перечислите основные и технологические объекты, используемые при поиске.
11.Определите назначение «обратной связи» в процессе информационного поиска.
12.Охарактеризуйте основные интерфейсные средства подготовки и модификации поисковых запросов.
13.Охарактеризуйте основные интерфейсные средства развития поисковых запросов.
14.Приведите типологию сценариев формирования выражения поискового запроса на ИПЯ.
15.Дайте характеристику интерфейсным средствам использования тезаурусных связей при модификации поисковых запросов.
16.Охарактеризуйте интерфейсные средства использования терминологических структур при подготовке запросов.
17.Перечислите информационные объекты, используемые для реализации технологии «обратной связи».
18.Охарактеризуйте влияние интерфейсных средств на адаптацию пользователя.
81
РАЗДЕЛ 2. ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИС И АВТОМАТИЧЕСКАЯ ОБРАБОТКА ДОКУМЕНТАЛЬНОЙ ИНФОРМАЦИИ
Лингвистическое обеспечение рассматривается как совокупность языковых средств, обеспечивающих гибкость представления и обработки информации. К таким средствам относятся коммуникативные форматы, схемы документов и баз данных, языки отчетов, а также информационно-поисковые языки, тезаурусы, классификации, рубрикаторы, кодификаторы и т.п.
Основное назначение лингвистического обеспечения, рассматриваемое в рамках настоящего пособия, – предоставить поставщику и потребителю информации возможность строить в рамках информационного ресурса общее лексическое (и инструментальное) пространство, позволяющее с общих позиций, более или менее адекватно отображать как содержание ресурса, так и содержание информационной потребности.
ГЛАВА 3. КЛАССИФИКАЦИИ В ЗАДАЧАХ ИНФОРМАЦИОННОГО ПОИСКА
Классификация в том виде, в каком она используется в формальной логике, близка к процессу описания предмета, его спецификации. Под спецификацией в данном случае понимается точное, однозначное и непротиворечивое обозначение предмета без указания его относительного положения в классификационной схеме.
Рассмотрим далее содержательный аспект классификации как семантической системы, предназначенной для смысловой идентификации и поиска документов.
В основе любой иерархической классификации лежит пред-
ставление о том, что вся совокупность накопленных человечеством знаний может быть разделена на взаимоисключающие классы и подклассы, где каждый класс делится лишь по одному основанию (признаку), порождая одну серию подклассов. Классификационное дерево, получающееся в результате такого деления, отличается большой жесткостью.
82
Фасетные классификации в этом смысле существенно отличаются от иерархических. Если при составлении иерархических классификаций в некотором систематическом порядке дается перечень всех предметных комплексов, которые уже описаны в литературе, то при построении фасетной классификации дается некоторое множество элементарных термов («строительных кирпичей»), из которых можно построить большое число тематических классов.
Развитие науки, как известно, характеризуется наличием двух противоположных тенденций: во-первых, дифференциацией, в результате которой каждая наука разделяется на все новые и новые ветви; во-вторых, взаимопроникновением не только смежных, но иногда очень далеких одна от другой наук, в результате чего появляются новые, ранее не существовавшие науки. Отсюда следует, что любая претендующая на научность и перспективность классификация должна учитывать особенности развития науки и иметь такую схему, которая бы позволяла адекватно отражать в классификации новые ветви уже сложившихся наук, новые науки и возникающие в результате дифференциации последних ветви новых наук.
Классификации обычно строятся на базе классификации наук с ее делением на отдельные отрасли, хотя имеется множество объектов, особенно в области естествознания, медицины и техники, изучение которых не является задачей какой-либо одной науки (например, одна и та же машина или аппарат может применяться в различных отраслях техники).
Рассматривая классификацию как систематическое распределение объектов множества по классам, возникающее в результате последовательного многоступенчатого деления, можно выделить следующие два вида классификаций:
-естественные классификации — классификации, в осно-
вание которых кладутся существенные для выделяемых классов признаки.
-вспомогательные классификации — классификации, в
основание которых кладутся несущественные для выделяемых классов признаки.
Впрактических задачах информационного обслуживания наиболее широко и устойчиво используются следующие системы классификации:
83
-библиотечно-библиографические, специально предназна-
ченные для систематизации книг и других документов;
-патентные, служащие для индексирования объектов промышленной собственности, заявленных или признанных изобретениями;
-классификации наук, призванные систематизировать научную информацию (Государственный рубрикатор НТИ и локальные (или отраслевые) рубрикаторы, построенные на его основе, используемые при формировании всех видов информационных изданий).
Вто же время необходимо отметить, что использование в классификаторах и современной научно-технической терминологии в значительной степени ограничено, поскольку в качестве содержания классификационных индексов-рубрик выбраны достаточно общие родовые понятия, являющиеся, кроме того, по сути своей номинальными определениями индексируемых объектов, где
вкачестве терминов используются искусственные конструкции. Такая атерминологичность объясняется, прежде всего, тем, что выбор лексических единиц искусственного типа обеспечивает единообразную трактовку содержания рубрик, независимо от особенностей употребления специальной научно-технической терминологии для различных научных школ и языков.
Основными достоинствами классификаций являются следующие:
- весь поток научной информации индексируется в соответствии с классификациями;
- классификации отражают практически все направления в науке и технике, систематизируя объекты по основным существенным признакам;
- использование единой классификации не только облегчает поиск, но и обеспечивает платформу для единого понимания предмета рассмотрения.
Вышеперечисленное позволяет:
- повысить эффективность информационного обслуживания в традиционном и автоматизированном режимах;
- унифицировать структуру локальных рубрикаторов и обеспечить их совместимость;
- обеспечить совместимость тематического описания ИР;
84
-вести статистический анализ информационных массивов
ипотоков и т. д.
3.1.Библиотечно-библиографические классификации
Различают три основные функции библиотечнобиблиографической классификации:
-библиотечная – организация фондов;
-библиографическая – организация знаний и информации
офондах;
-когнитивная – организация тематических описаний для поиска в фондах.
Библиотечная функция предназначена для ответа на один вопрос – где находится нужная книга.
Библиографическая функция обеспечивает систематический подход ко всему объему фондов. Необходимо, однако, отметить, что систематичность здесь определяется, в том числе, уровнем образования пользователей, их информационными потребностями, культурной подготовкой.
Когнитивная функция направлена на установление связей, ассоциаций, приближений и соответствий между элементами тематической области.
Из рассмотренных ранее свойств классификаций следует, что одна классификация не может полностью обеспечить все три перечисленные функции. В идеальной ситуации должно быть две классификации: одна для поиска самих документов, другая для выполнения библиографической и когнитивой функций.
Вотличие от естественных классификаций, основной целью которых является установление и обозначение существенных связей между предметами, задача библиотечно-библиографической классификации совершенно иная: она должна обеспечить такую систематизацию множества документов, при которой документы (или их описания) по одному и тому же предмету будут физически собираться в одном, и только в одном, месте. Таким образом, для библиотечно-библиографической классификации исключительно большое значение имеет ясное обозначение относительного расположения классов в схеме.
85
Вотличие от формально-логической классификации, для которой прежде всего важно образование классов предметов и установление родо-видовых отношений (иерархии) между этими классами, в библиотечно-библиографической классификации требуется установление порядка подклассов в общем ряду и определение их пространственного расположения относительно друг друга. Логическое отношение включения лишь определяет, что подклассы необходимо расположить таким образом, чтобы было показано их подчинение классу. Но формальная логика не дает универсального метода установления, в каком порядке следует располагать элементы деления. Например, если мы разделим класс «информационные системы» на подклассы «техническое обеспечение», «программное обеспечение», «лингвистическое обеспечение» и т. д., то порядок этих подклассов в ряду определяется содержательно, а не по фор- мально-логическим правилам. Таким образом, библиотечнобиблиографическая классификация отличается от формальнологической классификации своим принципом упорядоченного раз-
мещения классов в пространстве.
Существуют два подхода к построению библиотечнобиблиографической классификации. Реалистический подход предполагает, что структура классификации должна отражать структуру взятой за основу теоретической классификации. Прагматический подход предполагает, что классификации изобретаются, а не открываются, и что годится любая организация тематики предметной области, соответствующая поставленной задаче [38].
Внастоящее время сложились две группы библиотечнобиблиографических классификаций:
-перечислительные классификации;
-аналитико-синтетические классификации.
К перечислительным библиотечно-библиографическим клас-
сификациям относят иерархические и алфавитно-предметные классификации; к аналитико-синтетическим – фасетные классификации.
Наиболее известными иерархическими классификациями на сегодняшний день являются Десятичная классификация Дьюи, Библиографическая классификация Блисса, Классификация Библиотеки Конгресса США, библиотечно-библиографическая клас-
86
сификация ББК, назначение, состав и использование которой рассмотрим ниже.
Иерархические библиотечно-библиографические классификации. ББК
Отечественная иерархическая библиотечно-библиографи- ческая классификация (ББК) предназначена для организации библиотечных фондов, систематических каталогов и картотек. Ее основная задача – раскрыть содержание произведений печати, представить их в виде стройной научно обоснованной системы знаний и этим максимально облегчить читателю использование библиотечных фондов.
Методологической основой ББК является классификация наук и явлений действительности. Она выражается в определенной субординации наук, в соответствии с классификацией видов материи и форм ее движения, переходом от простого к сложному, от низшего к высшему.
В основу членения классификационных таблиц положены многообразные критерии: объект изучения, метод исследования, цель познания, структура объекта, его свойства, процессы, отношения, территория, исторический период и т.д. На более глубоких ступенях деления иногда применяется расположение понятий по алфавиту наименований (алфавит стран в пределах части света и др.). В то же время в ББК предусмотрена возможность характеризовать одно и то же понятие на основе разных признаков, что дает возможность более глубоко раскрыть содержание произведений печати.
Структура ББК. ББК имеет синтетическую структуру, позволяющую многоаспектно отражать содержание произведений печати. Единство между аналогичными по статусу, но различными по содержанию элементами универсальной классификации позволяют установить следующие аспекты обобщения ББК:
-основные таблицы,
-система типовых делений.
87
|
|
Основные разделы ББК |
Таблица 3.1 |
|
|
|
|
|
|
|
|
Индекс для |
|
Индекс для |
|
массовых |
Разделы (таблицы) ББК |
научных |
|
библиотек |
|
библиотек |
|
1 |
|
Общенаучное и междисциплинарное знание |
А |
2 |
|
Естественные науки |
|
|
|
|
|
|
20 |
Естественные науки в целом |
Б |
|
22 |
Физико-математические науки |
В |
|
24 |
Химические науки |
Г |
|
26 |
Науки о Земле (геодезические, геофизические, |
Д |
|
|
геологические и географические науки) |
|
|
|
|
|
|
28 |
Биологические науки |
Е |
|
|
|
|
3 |
|
Техника. Технические науки |
Ж/О |
|
|
|
|
4 |
|
Сельское и лесное хозяйство. Сельскохозяйст- |
П |
|
венные и лесохозяйственные науки |
||
|
|
|
|
5 |
|
Здравоохранение. Медицинские науки |
Р |
6/8 |
|
Общественные и гуманитарные науки |
|
|
60 |
Общественные науки в целом |
С |
|
63 |
История. Исторические науки |
Т |
|
|
|
|
|
65 |
Экономика. Экономические науки |
У |
|
66 |
Политика. Политическая наука |
Ф |
|
67 |
Право. Юридические науки |
Х |
|
|
|
|
|
68 |
Военное дело. Военная наука |
Ц |
|
|
|
|
|
70/79 |
Культура. Наука. Просвещение |
Ч |
|
80/84 |
Филологические науки. Художественная лите- |
Ш |
|
|
ратура |
|
|
|
|
|
|
85 |
Искусство |
Щ |
|
86 |
Религия. Мистика. Свободомыслие |
Э |
|
|
|
|
|
87 |
Философия |
Ю |
|
|
|
|
|
88 |
Психология |
Ю |
9 |
|
Литература универсального содержания |
Я |
|
|
|
|
|
|
88 |
|
Основные таблицы. Перечень разделов первого уровня деления (состав основных таблиц ББК) представлен в табл. 3.1. Следующие (второй, третий, четвертый и т.д.) уровни классификации в основных таблицах образуются путем деления первого уровня (основного ряда) на подчиненные группы наук, отрасли деятельности, отдельные науки, проблемы, темы и т.п.. Первый уровень деления таблиц ББК для научных библиотек обозначен первыми буквами русского алфавита, а для массовых библиотек – арабскими цифрами, т.е. в таблицах ББК для массовых библиотек отдельные естественные и общественные науки, которые в таблицах для научных библиотек представлены на первом уровне деления, перенесены на второй уровень деления и подчинены обобщающим классам.
Науки, возникшие в результате взаимопроникновения наук и (или) лежащие на пересечении двух или трех наук, в ББК условно относят к одной из них (агробиология – к сельскому хозяйству, биогеохимия – к биологии), а от другой (или других) дается отсылка. Комплексная наука разделяется на части, каждая из которых относится к соответствующей «материнской» науке (микробиология к биологии, медицинская микробиология к медицине и т.п.), а от общей науки даются отсылки к ее отраслям и дисциплинам.
Система типовых делений. Типовые деления помогают выделить и единообразно разместить однотипную литературу в систематическом каталоге. Система типовых делений представлена таблицами основных типовых делений, используемых во всех отделах классификации, и таблицами специальных типовых делений, обслуживающих отдельные отрасли наук.
Ктаблицам основных типовых делений относятся:
-таблицы общих типовых делений;
-таблицы территориальных типовых делений;
-таблицы типовых делений социальных систем.
Общие типовые деления (ОТД) используются для дополни-
тельного тематического (история науки, научные и культурные связи и т.п.) и формального (библиографические пособия, справочные издания, сборники и т.п.) деления. Например, во всех отделах могут встретиться книги по истории вопроса, справочники, учебники и т.п. Для каждого из этих видов изданий предусмотрены особые рубрики, которые включены в таблицу общих типовых де-
89
лений. Индексы ОТД присоединяются к основному индексу отрасли или темы непосредственно без всякого знака.
Территориальные типовые деления (ТТД) предназначены для единообразного подразделения материала по региональному (территориальному) признаку и отражают в основном современную политическую карту мира. Объектами классификации при этом являются территории и акватории земного шара. Основные деления ТТД выделены по физико-географическому признаку: весь мир (земной шар, Земля со всем существующим на ней), части света (суша) и Мировой океан. Исключения представляют деления "(2) Россия. СССР" и "(3) Зарубежные страны в целом". Россия (а раньше СССР) расположена в двух частях света (Европе и Азии) и не может быть представлена в целом ни в одной из них. Зарубежные страны в целом – это все страны, кроме тех, которые занимают обширные территории на всех континентах. Все страны, независимо от их величины и общественного устройства, расположены в пределах частей света в порядке алфавита их наименований. Дальнейшая детализация осуществляется по политико-административному и административно-территориальному признаку (для этого используется специальные типовые деления). В пределах стран все административные территории располагаются также по алфавиту их наименований.
Индексы ТТД присоединяются к индексу тех подразделений основных таблиц или общих типовых делений, в которых требуется выделить материал об отдельных странах, местностях, территориях.
Типовые деления социальных систем (ТДС) предназначены для единообразного подразделения и обозначения материала по признаку социальной системы.
Специальные типовые деления (СТД) используются для уни-
фикации построения классов по определенным признакам, типичным только для данной отрасли знания.
Способ кодирования, назначение и примеры применения типовых делений приведены в табл. 3.2.
Обозначения типовых таблиц отличаются от индексов основной таблицы и не имеют самостоятельного значения, а присоединяются к индексу основной таблицы непосредственно или же с помощью условных обозначений.
90
