Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

цификации. Под спецификацией в данном случае понимается точное, однозначное и непротиворечивое обозначение предмета без указания его относительного положения в классификационной схеме.

Рассматривая классификацию, как систематическое распределение предметов множества по классам, возникающее в результате последовательного многоступенчатого деления, можно выделить следующие два вида классификаций:

-Естественная классификация — классификация, в основание которой кладутся существенные для выделяемых классов признаки.

-Вспомогательная классификация — классификация, в основание которой кладутся несущественные для выделяемых классов признаки.

В задачах информационного обслуживания наиболее широко и устойчиво используются следующие классификации:

-библиотечно-библиографические, специально предназначенные для систематизации книг и других документов;

-классификации изобретений, служащие для распределения объектов промышленной собственности, заявленных или признанных изобретениями;

-классификации наук, призванные систематизировать научную информацию.

5.3.1. Библиотечно-библиографические классификации

Основной целью естественных классификаций является установление и обозначение существенных связей между предметами. Задача библиотечно-библиографической классификации совершенно иная: она должна обеспечить такую систематизацию множества документов, при которой документы (или их описания) по одному и тому же предмету будут физически собираться в одном, и только в одном, месте. Таким образом, для библиотечно-библиографической классификации исключительно большое значение имеет ясное обозначение относительного расположения классов в схеме, так как только благодаря этому можно:

1)помещать предмет (книгу, статью, реферат и т. п.) в соответствующее место схемы или раскрывать содержание этого предмета через его положение в классификационной схеме;

2)быстро находить предмет (книгу, статью, реферат и т. п.), если известно, какое место закреплено за ним в схеме;

3)проводить группировку таких предметов, которые с точки зрения потребителя предпочтительно иметь в одном месте.

В отличие от формально-логической классификации, для которой прежде всего важно образование классов предметов и установление родо-видовых отношений (иерархии) между этими классами, в

140

библиотечно-библиографической классификации требуется установление порядка подклассов в общем ряду и определение их пространственного расположения относительно друг друга. Логическое отношение включения лишь определяет, что подклассы необходимо расположить таким образом, чтобы было показано их подчинение классу. Но формальная логика не дает универсального метода установления, в каком порядке следует располагать элементы деления. Например, если мы разделим класс «информационные системы» на подклассы «техническое обеспечение», «программное обеспечение», «лингвистическое обеспечение» и т. д., то порядок этих подклассов в ряду определяется содержательно, а не по формально-логическим правилам. Таким образом, библиотечно-библиографическая классификация отличается от формально-логической классификации своим принципом упорядоченного размещения классов в пространстве.

В настоящее время сложились две группы библиотечнобиблиографических классификаций:

-перечислительные классификации;

-аналитико-синтетические классификации.

К перечислительным библиотечно-библиографическим классификациям относят иерархические и алфавитно-предметные классификации; к аналитико-синтетическим - фасетные классификации.

Различают три функции библиотечно-библиографической классификации:

библиотечная - организация фондов;

библиографическая - организация знаний и информации о

фондах;

когнитивная - организация тематических описаний для поиска

вфондах.

Библиотечная функция предназначена для ответа на один вопрос - где находится нужная книга.

Библиографическая функция обеспечивает систематический подход ко всему объему фондов. Необходимо, однако, отметить, что систематичность здесь определяется в том числе уровнем образования пользователей, их информационными потребностями, культурной, философской или политической подготовкой.

Когнитивная функция направлена на установление связей, ассоциаций, приближений и соответствий между элементами тематической области.

В [Nitecki1989] отмечается, что одна классификация не может полностью обеспечить все три перечисленные функции. В идеальной ситуации должно быть две классификации: одна для поиска самих

141

документов, другая для выполнения библиографической и когнитивой функций.

Основной функцией библиотечно-библиографической классификации является когнитивная. Это не просто система обозначений, а ментальная структура, выражаемая через обозначения.

Библиографическая функция классификации заключается в предоставлении систематического интеллектуального доступа к информации, содержащейся в библиографических материалах, который обычно осуществляется с помощью систематического каталога.

Существуют два подхода к библиотечно-библиографической классификации. Приверженцы реалистического подхода считают, что структура классификации должна отражать структуру взятой за основу теоретической классификации. Прагматический подход предполагает, что классификации изобретаются, а не открываются, и что годится любая организация тематики предметной области, соответствующая поставленной задаче. [Svenonius1989]

5.3.1.1. Иерархические библиотечно-библиографические классификации

В настоящее время наиболее распространенными библиотечнобиблиографическими классификациями являются ББК, Десятичная классификация Дьюи, Библиографическая классификация Блисса и классификация Библиотеки конгресса США.

К иерархической библиотечно-библиографической классификации предъявляются следующие основные требования:

-для любого объекта в классификации должен быть предусмотрен один, и только один, исчерпывающий класс;

-классификация должна обеспечивать информационный поиск по любому сочетанию признаков.

Для удовлетворения этих требований в иерархической классификации необходимо иметь отдельные исчерпывающие классы для всех возможных объектов, т. е. перечислить их в классификационных таблицах. Поэтому такие классификации называются перечислительными.

Однако общее количество объектов классификации с развитием науки и техники непрерывно возрастает, поэтому ни одна классификация не дает возможности заранее перечислить все предметы. Кроме того, общие принципы построения иерархических классификаций таковы, что они не позволяют иметь в классификации один, и только один исчерпывающий класс для каждого объекта. Рассмотрим справедливость этих утверждений с формально-логической и с содержательной точек зрения.

142

С целью формально-логического анализа иерархических классификаций построим графическую модель иерархической классификации (рис.5.4).

143

K

 

 

 

Kx1

 

 

Kx2

K

x3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Kx1y1 Kx1y2

 

Kx1y3 Kx2y1 Kx2y2 Kx2y3 Kx3y1

Kx3y2 Kx3y3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Kx1y1z1 Kx1y1z2 Kx1y1z3

Рис. 5.4. Граф иерархической классификации

Пусть имеется класс объектов К и множество признаков (оснований деления) {x, y, z}. Каждый из этих признаков делит класс на три подкласса. Обозначим подклассы индексами, составленными из идентификатора признака и номера подкласса. Рассмотрим систему идентификации классов для примера из [Михайлов1968].

В качестве исходного класса К взят класс «гражданские самолеты», а в качестве оснований деления — соответственно следующие признаки: «целевое назначение» (x) «число моторов» (y) и «расположение крыла» (z). Применение основания деления x к исходному классу дает нам подклассы «пассажирские самолеты» (Kx1),

«транспортные самолеты» (Kx2) и «специальные самолеты» (Kx3). Применение признака y соответственно к классам Kx1, Kx2 и Kx3 дает нам

подклассы «одномоторные пассажирские самолеты» (Kx1y1), «двухмоторные пассажирские самолеты» (Kx1y2), «четырехмоторные

пассажирские самолеты» (Kx1y3) и т. д. Наконец, применение признака z

соответственно к классам Kx1y1, Kx1y2, Kx1y3, Kx2y1, Kx2y2, Kx2y3, Kx3y1, Kx3y2 и

Kx3y3 порождает подклассы «одномоторные пассажирские самолеты с

низким расположением крыла» (Kx1y1z1), «одномоторные пассажирские самолеты со средним расположением крыла» (Kx1y1z2), «одномоторные

пассажирские самолеты с высоким расположением крыла» (Kx1y1z3) и т. д.

При построении этой классификации деление, как того требуют формально-логические правила, должно проводиться только по одному основанию. Если бы на первом шаге деления были применены одновременно два признака — например, «целевое назначение» и «число моторов», то на одном уровне иерархии получились бы пересекающиеся классы «пассажирские самолеты» и «одномоторные самолеты» и т. д. Тогда документы об одномоторных пассажирских самолетах пришлось бы помещать не в один, а в два класса.

Описанная классификация, безусловно, не является идеальной. При ее построении, например, не был применен признак «тип движителя» (воздушный винт, реактивный поток). Классификация не

144

является также и исчерпывающей: в число подклассов, образованных путем применения признака «число моторов», не входят подклассы «трехмоторные самолеты» и «шестимоторные самолеты». Из-за несоблюдения формально-логических правил построения классификации в ней не найдется класса, к которому можно было бы отнести документ о трехмоторных транспортных самолетах или о реактивных пассажирских самолетах. Следовательно, при построении иерархической классификации соблюдение установленных формальнологических правил имеет исключительно большое значение.

Но даже безусловное соблюдение установленных формальнологических правил при построении иерархической классификации не устраняет ее главного недостатка - невозможность проведения группировки документов и информационного поиска по любому сочетанию характеристик.

Одно из основных требований, предъявляемых к библиотечнобиблиографической классификации, состоит в том, чтобы она обеспечивала сбор документов по определенному предмету в одном, и только в одном, классе. Но это требование не выполняется даже в такой иерархической классификации, которая безупречна в формальнологическом отношении. Для построения иерархической классификации используется определенный ряд признаков (оснований деления). Число этих признаков обычно бывает невелико, и они применяются только в одной последовательности. Такая процедура позволяет построить классы предметов, обладающих лишь определенными сочетаниями признаков, выбранных в качестве оснований деления.

Если классификацию, которая приведена на рис. 5.4, использовать для информационного поиска по любому сочетанию признаков из множества оснований деления данной классификации, то придется собирать документы из нескольких классов в том случае, когда сочетание признаков отлично от исходного. Например, документы о гражданских самолетах с высоким расположением крыла в такой классификации распределены по 9 классам, документы о двухмоторных гражданских самолетах — по 3 классам и т. д.

Таким образом, для обеспечения возможности быстрого поиска документов по любому сочетанию признаков, взятых из некоторого данного множества (т.е. для предотвращения рассеяния таких документов по разным классам), необходимо построить отдельные классы для всех возможных сочетаний этих признаков. Эффективность этого метода зависит от числа классов самого нижнего уровня иерархии (обозначим это число через N), которое можно построить путем применения в разной последовательности исходного множества

признаков. Очевидно, что чем больше N, тем выше трудоемкость процедуры классифицирования документов.

145

Проведем оценку трудоемкости этой процедуры путем вычисления числа иерархий, которое можно построить на данном множестве признаков.

146

Пусть С - множество признаков, используемых в качестве оснований деления:

C = {c1 ,c2 ,...,cn }, где п — число элементов множества.

f (ci ) — число классов, порождаемых каждым признаком, взятым

из С.

 

n

 

Тогда

N = f (ci )

- число классов нижнего уровня одной

i =1

иерархии.

 

 

При построении классификации можно выбрать ту или иную последовательность применения признаков. Каждая отдельная последовательность признаков порождает свою иерархию классов. Число возможных перестановок классификационных признаков равно п!. Отсюда следует, что общее число классов нижнего уровня всех возможных иерархий:

n

N = n! f (ci )

i =1

.

На самом деле, в основе любой иерархической классификации, создаваемой по формально-логическим правилам, должно лежать отношение «род-вид», которое фиксирует последовательность применения признаков – оснований деления.

При построении же реальных иерархических библиотечнобиблиографических классификаций в качестве оснований деления используются не только видообразующие, но и другие признаки, имеющие характер отношения «от целого к части». Нарушение одного из важных принципов построения иерархических классификаций лишает процесс создания классификаций объективной формальнологической основы и делает его полуинтуитивным процессом, зависящим от конкретных практических потребностей, от опыта составителей схемы и от многих других факторов. В результате этого структура иерархической классификации усложняется, в ней появляются пересекающиеся классы и т. д.

Очевидно, что если специфика классифицируемых предметов такова, что классы в иерархических системах располагаются в определенном естественном порядке (например, для географической классификации естественным будет следующий порядок классов: часть света — страна — республика, штат, земля — область, край, воеводство, графство, департамент и т. д.), то такая классификация служит достаточно эффективным средством информационного поиска.

С другой стороны, имеется не меньше случаев, когда никакой естественной последовательности расположения классов в иерархической классификации не существует. Например, при создании иерархической схемы классификации грибов по их признакам (форма

147

шляпки, вид ножки, пищевая ценность, цвет мякоти и т. д.) можно использовать любое сочетание признаков для расположения классов в этой схеме, причем число таких вариантов, как было показано выше, может быть очень большим. Кроме того, приемлемость всех возможных вариантов иерархии фактически лишает иерархическую классификацию такого важного свойства, как обозначение родовидовых отношений между классами. Поэтому применение иерархической классификации в таких условиях становится неоправданным.

Рассмотрим далее содержательный аспект иерархической классификации как семантической системы, предназначенной для поиска документов. В основе любой иерархической классификации лежит представление о том, что вся совокупность накопленных человечеством знаний может быть разделена на взаимоисключающие классы и подклассы, где каждый класс делится лишь по одному основанию (признаку), давая одну серию подклассов. Классификационное дерево, получающееся в результате такого деления, является линейным и отличается большой жесткостью.

Вто же время развитие науки, как известно, характеризуется наличием двух противоположных тенденций: во-первых, дифференциацией, в результате которой каждая наука разделяется на все новые и новые ветви; во-вторых - взаимопроникновением не только смежных, но иногда очень далеких одна от другой наук, в результате чего появляются новые, ранее не существовавшие науки. Отсюда следует, что любая претендующая на научность и перспективность библиотечно-библиографическая классификация непременно должна учитывать npoцессы анализа и синтеза в развитии науки и иметь такую схему, которая бы позволяла адекватно отражать в классификации новые ветви уже сложившихся наук, новые науки и возникающие в результате дифференциации последних ветви новых наук.

Влюбой же иерархической классификации отдельные науки раз и навсегда разорваны разветвлениями жесткого классификационного дерева.

Особенно трудно включать в иерархическую классификацию новые межотраслевые предметы и области исследований, когда отсутствует даже общепринятая терминология для обозначения этих предметов. Однако, особенно в начальные периоды исследовательских работ в новых областях информационные запросы наиболее многочисленны, и быстрое удовлетворение этих запросов имеет особенно большое значение.

Таким образом, требуется периодическое изменение общей структуры той или иной реальной иерархической классификации, но на разработку новых таблиц иерархических классификаций уходит много времени и труда, и новый вариант иерархической классификации устаревает раньше, чем удается завершить работу по переклассифицированию документов. Поэтому выбирается путь

148

соответствующей модификации уже существующих таблиц иерархической классификации, что придает ей все более условный характер.

Иерархические классификации обычно строятся на базе классификации наук с ее делением на отдельные отрасли. Но имеется множество предметов, особенно в области естествознания, медицины и техники, изучение которых не является задачей какой-либо одной науки. Например, одна и та же машина или аппарат может применяться в различных отраслях техники. Поэтому в иерархической классификации создается несколько классов для одного и того же предмета, изучаемого разными науками или рассматриваемого в разных аспектах. Таким образом, невозможность иметь в иерархической классификации отдельные исчерпывающие классы для любого объекта делает такую классификацию малопригодной для информационного поиска по любым, заранее не предусмотренным сочетаниям признаков, а также по единичным признакам и признакам межотраслевого характера.

Суммируя вышеизложенное, можно сказать, что основные недостатки иерархических классификаций как семантической системы, предназначенной для поиска документов, состоят в следующем [Михайлов1968]:

1.Невозможность многоаспектного описания документов.

2.Непригодность для информационного поиска по любому

сочетанию признаков, а также по узкопредметным и межотраслевым запросам34.

3.Недостаточная глубина деления, из-за чего в классификации могут отсутствовать классы для специфических предметов.

4.Невозможность обеспечения взаимоисключаемости классов (явление «синонимии»).

5.Недостаточная эффективность механизма пересмотра классификации. Это означает, что в ней отсутствуют подразделения для новых объектов до тех пор, пока не будет опубликовано новое издание таблиц этой классификации. Таким образом, иерархическая классификация всегда отстает от достигнутого уровня развития науки и техники.

Тем не менее, наряду с перечисленными недостатками, иерархические классификации имеют и важные достоинства, благодаря которым различные классификации в течение многих веков используются в качестве основного средства для тематического поиска литературы. Ниже перечислены основные достоинства иерархических классификаций:

1. Классификация — один из привычных методов, которыми пользуются люди для определения объектов.

34 Строго говоря, непригодность иерархических классификаций для поиска документов по единичным и межотраслевым предметам не есть их недостаток, а одно из внутренних свойств.

149

2.Иерархическая классификация пригодна для каталогов и указателей, имеющих любую физическую форму.

3.Для составления и использования систематического каталога или указателя не требуется никаких специальных средств и устройств.

4.На описание документов по иерархической классификации, как правило, расходуется меньше квалифицированного труда, чем на описание по фасетным и алфавитно-предметным классификациям.

5.Для шифровки классов в иерархической классификации обычно применяются арабские цифры и буквы латинского алфавита, имеющие широкое распространение. Это превращает ту или иную иерархическую классификацию в специализированный международный язык, понятный специалистам разных стран.

Наиболее известными иерархическими классификациями на сегодняшний день являются Десятичная классификация Дьюи, Библиографическая классификация Блисса, Классификация Библиотеки конгресса США, ББК.

Рассмотрим далее более подробно состав и структуру отечественной библиотечно-библиографической классификации (ББК).

ББК (отечественная библиотечно-библиографическая классификация).

В настоящее время ББК используется в отечественных библиотеках по гуманитарным наукам, публичных и детских библиотеках. Первое издание ББК вышло в 25 выпусках и 30 книгах (1961-1968 гг.). В дальнейшем разрабатывались и публиковались издания ББК для научных библиотек, сокращенные таблицы, однотомники для массовых, детских и школьных библиотек, таблицы для областных библиотек и специализированные таблицы и каталоги.

ББК имеет синтетическую структуру, позволяющую многоаспектно отражать содержание произведений печати. Пять уровней обобщения ББК, позволяющие установить единство между аналогичными по статусу, но различными по содержанию элементами универсальной классификации – это:

-основные таблицы,

-планы расположения,

-общие типовые деления,

-специальные типовые деления,

-территориальные типовые деления.

Типовое построение схемы ББК способствует единству структуры, сокращает объем таблиц, делает их обозримыми, мнемоничными. Единство структуры ББК выражается четырьмя способами:

-согласование структуры типологически сходных наук;

-подразделение одних отделов по аналогии с другими;

150