Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
0525065_0224D_gorbachenko_t_g_analitiko_sinteti...doc
Скачиваний:
13
Добавлен:
16.11.2019
Размер:
2.18 Mб
Скачать

1.3. Основні типи документних класифікаційних систем

Документні класифікації можна вирізняти за багатьма оз­наками:

  • за науковою основою;

  • за видом систематизованих документів;

  • за аспектами застосування;

  • за способом індексації тощо.

Однією з найбільш суттєвих ознак документних кла­сифікаційних систем є засіб їх будови, який визначає їх струк­туру. За структурою будови існує два типи документних класи­фікацій — ієрархічні та аналітико-синтетичні класифікації.

В основу будови ієрархічної класифікації покладено логіч­ну операцію поділу обсягу поняття. Сам термін «ієрархія» грецького походження й означає «підпорядкування». Тобто ієрархія — це таке, і тільки таке, співвідношення, за якого один клас є підкласом іншого, більш широкого. Тому підпо­рядкуванню підлягають саме такі класи.

Найбільш зручною формою зображення ієрархічних кла­сифікацій можна вважати графи за типом дерева. Граф — це умовна фігура, що складається з крапок (називають «вершина­ми») та відрізків, які з'єднують деякі з цих вершин (називають «ребрами»). Будь-яку «вершину», що обрана за початкову крапку, називають «коренем».

На рис. 1 подано граф-модель ієрархічної класифікації, де 0 — це корінь, що являє собою загальний зміст, який, відповідно, поділяється на вершини a, b, c, d тощо. Це — відділи, що одер­жані у результаті поділу. У свою чергу вони можуть поділяти­ся на підвідділи (а1, а2,...) та ін.

Рис. l. Граф-модель ієрархічної класифікації

У ієрархічних класифікаціях існують два типи відносин: зверху — донизу — це ієрархія, а горизонтальні пунктирні лі­нії позначають співпорядкування класів та підкласів. Безумов­но, взаємовідносини між науками та їх діленнями значно складніші, ніж це подано на рисунку.

Суть ієрархічної класифікації полягає у поділі кожного класу вищого порядку на послідовно підпорядковані класи, у цьому разі кожний окремо взятий клас безпосередньо підпо­рядкований тільки одному, більш широкому, класу. До цих класифікацій висувають такі вимоги:

  • для будь-якого предмета або предметного комплексу має бути передбачений один, і тільки один, вичерпний клас;

  • класифікація повинна забезпечувати інформаційний по­шук за будь-яким поєднуванням ознак.

Ієрархічні класифікації поділяють на перелічувальні та комбінаційні.

В основу будови перелічувальних класифікацій покладений принцип переліку: у класифікаційній системі перелічують усі теми, за якими існують документи. Типові поняття, тобто оз­наки, що повторюються, не відокремлюють в окремі таблиці, а відображають повторенням у різних рубриках схожого змісту. Однак ці класифікації мають слабкі сторони: докладно деталізована класифікація має великий обсяг; вона не може охопити всі питання й теми, за якими можуть у майбутньому з'явитися документи. Тому ці класифікації застосовують обме­жено. Єдиним прикладом застосування такої класифікації, яка існує й на початку ХХІ століття, є Класифікація Бібліоте­ки Конгресу США.

Комбінаційні класифікації характеризуються більш розви­неною структурою. Головна відмінність цих класифікацій у порівнянні з перелічувальними — це наявність таблиць типових рубрик. Таблиці комбінаційних класифікацій скла­даються з основних таблиць, таблиць загальних і типових спе­ціальних рубрик. Класифікування за допомогою комбінацій­них класифікацій не зводиться лише до пошуку готового індексу, а передбачає пошук інших класифікаційних ознак, тобто складання індексу шляхом поєднання індексів основних таблиць із таблицями типових рубрик.

Інша відмітна риса комбінаційних класифікацій — це мож­ливість поєднання за визначеними правилами індексів основ­них таблиць із метою утворення нових індексів, які не передба­чені в основній таблиці. За допомогою різних знаків (+, /, :) можна конструювати індекси нових понять. Наприклад, книга з органічної та аналітичної хімії. Індекс органічної хімії — 24.2, а аналітичної хімії — 24.4. Отже, книга означеної тема­тики матиме індекс 24.2 + 24.4.

Більшість сучасних документних класифікаційних систем є комбінаційними. Це — «Десяткова класифікація Дьюї» (ДКД), «Бібліотечно-бібліографічна класифікація» (ББК), «Універсальна десяткова класифікація« (УДК). Порівняно з перелічувальними, вони мають менший обсяг і одночасно більшу можливість відображення складних багатоаспектних та нових понять. Вони незамінні при широкому тематичному пошуку, а також придатні й для вузького тематичного пошу­ку. Проте комбінаційні класифікації (до речі, як і інші класи­фікації) мають певні обмеження. Зміни у структурі наукових знань відбуваються, наприклад, на тематиці наукових доку­ментів, які стають усе більш спеціальними (наслідок дифе­ренціації наук), а також багатоаспектними (наслідок інтегра­ції, взаємопроникнення наук). Це ускладнює систематичний пошук документів.

Значно більші можливості відобразити багатоаспектний зміст наукових документів мають аналітико-синтетичні (фа­сетні) документні класифікації. Це системи з розвиненою складною структурою, які призначені для багатоаспектного пошуку інформації. Фасетні класифікації відрізняються від ієрархічних тим, що на одному й тому ж масиві документів можна побудувати кілька тематичних ієрархій.

Головні ділення фасетної класифікації утворює ієрархіч­ний ряд за галузями знань. У межах кожної галузі є кілька таб­лиць категорій, побудованих у результаті попередньо проведе­ного категоріального аналізу термінології певної галузі. Типові ознаки характерні для всіх, чи більшості головних ділень класифікації, у допоміжних таблицях загальних кате­горій. В особливій таблиці подані визначення зв'язків між по­няттями. Документи аналізують за категоріями, які передба­чені для даної галузі знання, а знайдені у таблиці індекси синтезують відповідно до класифікаційних формул. Класифі­каційна формула відображає як зміст окремих понять, так і систему зв'язків між ними.

В основі аналітико-синтетичних класифікацій лежить фа­сетний аналіз, суть якого полягає в тому, що спочатку аналізують галузь знання і термінологічний склад певного ма­сиву документів із цієї галузі. На основі такого аналізу виділя­ють категорії, які й називають фасетами. Терміни групують за фасетами, тобто об'єднують у відповідні класи. Наприклад, терміни, що означають різні матеріали, утворюють фасет «ма­теріали»; терміни, що означають різні процеси — фасет «про­цеси» тощо.

Наступні етапи побудови фасетної класифікації — поділ фасетів на субфасети (субсубфасети і таке інше); установлення фіксованої послідовності розташування фасетів. Цю послідов­ність називають фасетною формулою.

Отже, фасетна класифікація — це класифікаційна систе­ма, у якій поняття подані як фасетна структура, а класифіка­ційні індекси синтезуються шляхом комбінування фасетних ознак відповідно до фасетної формули.

Однак фасетні класифікації не набули широкого розпо­всюдження у зв'язку зі складністю їх будови, але елементи фа-сетизації використовують у комбінаційних класифікаціях, наприклад, в УДК та ДКД.