Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

5.3.1.3.Фасетные классификации

Воснове аналитико-синтетических или фасетных классификаций. лежит фасетный анализ, идея которого принадлежит индийскому библиографу Ш. Р. Ран-ганатану.

Сущность фасетного анализа состоит в выделении в рассматриваемой предметной области категорий признаков классификации и в описании этих категорий множеством терминов. При этом категории называются фасетами, а каждый термин фасета называется фокусом.

Фасетный анализ проходит в несколько этапов:

- на основе анализа отрасли науки или техники составляется перечень основных категорий объектов, применяемых в данной отрасли; - из изучаемых документов выписываются все существенные термины, относящиеся к данной отрасли науки или техники, которые группируются по фасетам, т. е. объединяются в соответствующие

классы; - фасеты делятся на субфасеты, субсубфасеты и т. д. (если

необходима большая детализация); - устанавливается полезная, но фиксированная

последовательность расположения терминов внутри фасетов и фасетов

в схеме классификации;

-вводится обозначение соответствующими шифрами фасетов и терминов, входящих в эти фасеты;

-устанавливается фиксированная последовательность расположения фасетов при описании документа, которая называется

фасетной формулой.

Процедура описания документов по фасетной классификации осуществляется следующим образом. Сначала на естественном языке формулируется основное смысловое содержание документа. Затем этот смысл выражается в терминах фасетной классификации, т. е. при помощи цепочки фокусов, взятых из фасетов и расположенных в фиксированном порядке. Часто вместо фокусов используются их шифры. Такая процедура позволяет создавать классы для документов, тематика которых выражается сочетанием нескольких разноаспектных характеристик.

Отметим, что отсюда следует весьма существенное различие между фасетными и иерархическими классификациями. При составлении иерархических классификаций в некотором систематическом порядке дается перечень всех предметных комплексов, которые уже описаны в литературе. При построении же фасетной классификации дается некоторое множество элементарных термов («строительных кирпичей»), из которых можно построить большое число наименований тематических классов.

155

Фасетная классификация не пользуется только готовыми классами. Названия классов (а следовательно, и сами классы) строятся на базе разных сочетаний фокусов фасетной формулы, при этом ненужные фасеты пропускаются.

Таким образом, по сравнению с классификациями перечислительного типа фасетные классификации значительно облегчают многоаспектное описание документов. Представим рассмотренный ранее пример классификации гражданских самолетов с помощью совокупности фасетов:

«Типы гражданских самолетов» x1 Пассажирские самолеты x2 Транспортные самолеты x3 Специальные самолеты

«Ч и с л о моторов» y1 Одномоторные y2 Двухмоторные y3 Четырехмоторные

«Расположение крыла»

z1 Высокое расположение крыла

z2 Среднее расположение крыла

z3 Низкое расположение крыла

Нетрудно понять, что если расположить термины первого фасета на одной горизонтали, а затем приписать к каждому из этих терминов поочередно все термины второго фасета и после этого повторить описанную процедуру, используя термины третьего фасета, то мы получим иерархическую классификацию, приведенную на рис. 5.3. Таким образом, число всех возможных классов фасетной классификации во всяком случае не меньше числа иерархий, которые можно построить для эквивалентной ей иерархической классификации. Однако в такой классификации можно построить классы x2z2 – «Транспортные самолеты со средним расположением крыла», y1 – «Одномоторные гражданские самолеты» и т.п.

Фасетные классификации обладают рядом существенных преимуществ перед иерархическими классификациями. Основные из этих преимуществ состоят в следующем:

1.Возможность проведения многоаспектного описания документов.

2.Возможность собирать в одном месте все аспекты какого-либо предмета или темы. В общих иерархических схемах эти аспекты могут быть рассеяны по разным подразделениям (явление «синонимии»), причем отсутствуют правила отыскания таких подразделений.

3.Большая глубина деления понятий.

4.Возможность включать новые термины значительно проще и быстрее, чем в иерархические классификации.

156

Важнейший же недостаток фасетной классификации по сравнению с перечислительными классификациями — это большая трудоемкость построения фасетной классификации.

Первая фасетная Классификация с двоеточием (Colon Classification - СС) была опубликована ее разработчиком Ш. Р. Ранганатаном (Индия) в 1933 г. С тех пор она пересматривалась много раз. Уже в первом издании структура и система индексации классификации существенно отличались от распространенных тогда в мировой практике перечислительных классификационных систем. В изданиях 1939, 1950, 1952, 1957, 1960 гг. Ранганатан развил положенные в основу классификации принципы фасетного анализа и фасетного синтеза. По замыслу автора фасетные (или аналитико-синтетические) классификации должны обеспечить при систематизации одного и того же документа разными систематизаторами единое классификационное решение, стандартно оформленное в виде одного классификационного индекса, построенного в соответствии с фасетной формулой.

Ранганатан предложил пять основных фасетов, обозначаемых латинскими буквами: Р (Personality, Индивидуальность), M (Matter,

Материя), E (Energy, Энергия), S (Space, Место), T (Time, Время).

Фасеты (категории) в конкретных отраслевых классах отражают специфику той или иной отрасли. Каждое понятие представлено в тексте таблицы классификации только один раз и в случае необходимости отражается в синтезируемом классификационном индексе.

Совокупность первого ряда делений (главные классы классификации), по мнению Ранганатана, не имеет принципиального значения: время от времени могут возникать новые главные классы. Важно лишь строго выполнять условие: каждый предмет может относиться к одному и только к одному главному классу. Подразделения главных классов образуются, как правило, в соответствии с определенными для него фасетами (категориями).

Универсальная десятичная классификация (УДК). УДК создавалась в основном еще до того, как был разработан фасетный принцип. Поэтому в УДК этот принцип получил лишь частичное воплощение и она является классификацией полуфасетного типа.

Все классы УДК сгруппированы в шесть фасетов, из которых два являются фасетами формы и четыре — фасетами содержания (табл. 5.1)

157

Таблица 5.1.

Фасеты формы и содержания в УДК (с их стандартным символическим обозначением)

 

 

 

Стандартное символическое

 

 

 

обозначение (нотация)

№ пп

Тип фасета

Значение фасета

фасета

1

Фасет формы ..............

Язык документа

=

 

 

 

 

 

 

2

Фасет формы ..............

Форма документа

(0...

)

 

 

 

 

3

Фасет содержания

Место

(1/9)

4

Фасет содержания

Народность

(=...

)

 

 

 

 

 

 

 

5

Фасет содержания

Время

"...

"

 

 

 

 

6

Фасет содержания

Общий предмет

Отсутствует

 

 

 

 

 

Фасет содержания «Общий предмет» имеет десять основных подразделений, которые называются главными классами. Остальные фасеты УДК получили название вспомогательных таблиц.

Вспомогательные таблицы содержат перечни основных разделов УДК и таблицы вспомогательных фасетов классификации, а также других синтаксических средств, позволяющих комбинировать табличные классы в составе сложных тематических индексов, детально описывающих содержание классифицируемых материаловОсновными подразделениями фасета «Общий предмет» являются:

0 Общий отдел

1 Философия. Психология. Логика

3 Общественные науки

5Математика. Естественные науки

6Прикладные науки. Медицина. Техника

7Искусство. Декоративно-прикладное искусство. Фотография. Музыка. Игры. Спорт

8Языкознание. Филология. Художественная литература. Литературоведение

9География. Биографии. История

Общие определители языков обозначают язык документа,

содержание которого обозначается основным индексом УДК.

Хотя теоретически язык какого-либо документа или информационного сообщения может быть указан всегда, практически это полезно делать только тогда, когда имеется потребность различить документы на разных языках, например, чтобы обеспечить возможность поиска по языку или удовлетворительно упорядочить выдачу.

В индексе УДК определители языка обычно располагаются на последнем месте. Однако они могут располагаться в середине и даже в начале составного индекса, если есть потребность располагать

158

документы по порядку языков, а не по их содержанию. При необходимости определитель языка может быть отделен от последующего индекса УДК двоеточием. Например:

663.4(493)(075)=112.5 Пивоваренная промышленность Бельгии. Учебник на фламандском языке

Многоязычные документы могут быть обозначены кодом =00 или определителями отдельных языков, расположенных в порядке возрастания кода, например:

53(035)=00 Многоязычные справочники по физике

53(035)=111=112.2=133.1 Справочники по физике на английском, французском и немецком языках

Общие определители формы документов. Определители формы служат для систематизации документов по форме их публикации или представления. При этом форма документа должна четко отличаться от его содержания и касается только:

-его внешней физической стороны;

-формы его представления (рукопись, фотокопия, печатное издание и т.д.);

-способа представления информации об отдельном предмете, содержании документа (т. е. вида документа).

В сложных индексах общий определитель формы документа обычно занимает предпоследнее место, перед общим определителем языка.

Определители формы обычно используются в сочетании с индексами основной таблицы УДК, например

54(035) Справочники по химии 54(051) Периодические издания, журналы по химии

Общие определители места Общие определители места служат для обозначения географического положения (или другого пространственного аспекта) объекта, классифицируемого по УДК, путем присоединения определителя к индексу основного ряда. Они применяются преимущественно для дальнейшего подразделения документов по географическому признаку.

Определители места относятся к самостоятельным общим определителям, т.е. их можно использовать как самостоятельные индексы УДК с тем же значением.

Основной, наиболее часто используемой частью таблиц является раздел (4/9) «Страны и местности современного мира!. Этот раздел подразделяется в первую очередь по материкам (частям света): (4) «Европа», (5) «Азия», ..., (99) «Антарктика. Антарктида». Главный принцип, по которому построен раздел - современное политическое

159

устройство мира и политико-административное деление стран. Общие определители места, как правило, располагаются в соответствии с географическим положением стран и их областей. Большинство стран объединено по крупным частям материков.

При изменении политического статуса территорий (например, при образовании новых государств) Общие определители места обычно не менялись. Поэтому получилось, что в ряде случаев под одним определителем места объединены территории, принадлежащие разным странам, или, наоборот, части одной страны отнесены к разным определителям места.

Если какой-либо определитель места не совпадает по значению с совокупностью территорий, обозначенных всеми десятичными подразделениями этого определителя, то в квадратных скобках дается соответствующее пояснение.

При систематизации документов географический аспект часто играет определенную роль. Чтобы выразить связь рассматриваемого вопроса с указанным в документе местом, к основному индексу УДК присоединяют соответствующий определитель места, Например

621.311(410) Электростанции Великобритании 631.4(44) Почвы Франции 69(571.53/.62) Строительство в зоне БАМ

Общие определители народов (рас, этнических групп и национальностей). Общие определители народов (этнические определители) обозначают национальный или этнический аспект предмета, представленного основным индексом УДК, например

398(=81/=82) Фольклор Северной Америки (североамериканских индейцев)

Эти определители образуются, как правило, из общих определителей языка путем помещения их в круглые скобки. Они служат для обозначения народов, наций, народностей и этнических групп в отличие от языков, на которых эти народы говорят. Этнические определители могут также отражать культурно-языковые группы населения, например

(=111) Англоязычное население (в отличие от англичан - населения Англии)

Политическая национальность (гражданство национальных государств) отражается главным образом определителями (=1.4)/(=1.9), которые образованы из общих определителей места, но для некоторых аспектов могут оказаться более подходящими сами определители места как таковые.

Общие определители времени. Определители времени служат для отражения понятия, связанного с датой, периодом или другими аспектами времени.

160

Определители времени обычно добавляются после основного индекса.

Примеры:

53"196" Физика 1960-х гг. 54"196" Химия 1960-х гг.

Среди вспомогательных таблиц находятся так называемые знаки соединения индексов УДК – дополнительное семантическое средство построения сложных индексов. В табл. 5.2 приведены характеристики этих знаков и примеры использования.

 

 

 

 

 

 

 

 

 

Таблица 5.2.

 

 

 

 

 

 

 

 

 

 

Знак

 

 

Назначение

 

Примеры применения

 

 

+

Применяется тогда, когда содержание

622+669 Горное дело и металлургия

 

 

присоединение

документа не может быть выражено

(7+8) Северная и Южная Америка

 

 

 

одним

индексом.

В

этом случае два

 

 

 

 

 

(или более) индекса соединяются

 

 

 

 

 

знаком.

 

 

 

 

 

 

 

 

/

Применяется тогда, когда содержание

592/599 Систематическая зоология

 

 

распространение

документа можно выразить с помощью

(вместо 582+593+...+599)

 

 

 

нескольких индексов, следующих друг

669.2/.8 Металлургия цветных металлов

 

 

 

за другом в десятичном ряду. В этом

(вместо 669.2+669.3+...+669.8)

 

 

 

случае первый и последний индексы

 

 

 

 

 

соединяются знаком.

 

 

 

 

 

 

:

Применяется

для выражения общих

341.63(44:450) Международный

 

 

двоеточие

отношений,

отношений соподчинения

арбитраж между Францией и Италией

 

 

 

и обратимых отношений

 

341.63(450:44)

Международный

 

 

 

 

 

 

 

 

 

арбитраж между Италией и Францией

 

 

[...]

Применяются

в

качестве

31:[622+669](485) Статистика горного

 

 

квадратные

алгебраического

обозначения

группы

дела и металлургии в Швеции

 

 

скобки

из двух или более индексов, связанных

004.3:[621.771.016.3:669.14]

 

 

 

между собой знаками «+» или «:», с

Применение ЭВМ при холодной

 

 

 

целью отражения какого-либо понятия,

прокатке стали

 

 

 

 

если

эти индексы

подразделяются

 

 

 

 

 

дальше при помощи двоеточия или

 

 

 

 

 

определителей

(общих

или

 

 

 

 

 

специальных)

 

 

 

 

 

 

 

::

Применяется

 

для

закрепления

575::576.3 Цитогенетика

 

 

двойное

определенной последовательности двух

77.044::355 Военные фотосъемки

 

 

двоеточие

или более элементов в составном

 

 

 

 

 

индексе

 

 

 

 

 

 

 

Вправилах построения индексов УДК основное внимание уделено последовательности размещения характеристик в индексе документа, а также порядку расстановки таких индексов в систематическом указателе (каталоге).

ВУДК принята определенная последовательность присоединения индексов специальных и общих определителей к основному индексу. Таким образом, в УДК тоже применяется определенная фасетная формула, хотя эта формула имеет меньшую жесткость, чем в «чистых» фасетных классификациях.

161

Кроме общей фасетной формулы, в УДК применяется также субформула для построения сложных предметных индексов. Если предметный индекс УДК состоит из нескольких простых индексов, соединяемых друг с другом знаками присоединения, распространения, объединения или отношения, то эти простые индексы рекомендуется всегда располагать в следующей последовательности:

1.Предмет в целом

2.Виды предмета

3.Части предмета

4.Материалы

5.Свойства

6.Процессы

7.Действия

8.Агенты

Основными недостатками правил построения в УДК являются:

1)недостаточная специфичность правил построения (небольшое число символов используется для выражения значительно большего числа различных связей между характеристиками);

2)правила построения не позволяют выражать в линейном виде многомерные связи между характеристиками, что приводит к появлению многозначных выражений (индексов);

3)неоднозначность правил построения (не нарушая этих правил, два систематизатора могут по-разному выразить одно и то же отношение между характеристиками).

В Приложении 1 приведена таблица одного из основных делений общепредметного фасета УДК «004 Информационные технологии. Вычислительная техника. Теория, технология и применения вычислительных машин и систем».

Примеры других фасетных классификаций и методик их построения.

В [Harris1987] представлена классификация The Dickens House Classification (DНС), предназначенная для описания совокупности фактов, связанных с изучением жизни и творчества Чарльза Диккенса. Классификация разработана Домом Ч. Диккенса в Лондоне в сотрудничестве с рядом других организаций.

DHC - фасетная (аналитико-синтетическая) классификация и принадлежит к числу немногих классификаций, специально разработанных для сферы гуманитарного знания. Она включает 5 основных разделов:

общий раздел (сведения о языке, времени и месте фактов, связанных с Ч. Диккенсом),

основы изучения творчества Ч. Диккенса;

библиография о Ч. Диккенсе;

162