Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-29 (1).doc
Скачиваний:
27
Добавлен:
22.03.2015
Размер:
260.61 Кб
Скачать

10.Класифікація економічної інформації, ієрархічний та фасетний метод класифікації.

Метод класифікації - це сукупність правил створення системи класифікаційних угруповань і їх взаємозв'язків. Найбільше поширені такі методи класифікації об'єктів: ієрархічний, фасетний, дескрипторний. Вони відрізняються стратегією застосування класифікаційних ознак.

Ієрархічний метод класифікації характеризується тим, що початкова множина об'єктів техніко-економічної інформації послідовно поділяється на класи першого рівня поділу, потім - на угруповання наступного рівня та ін. Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображають у вигляді розгалуженого графа, вузлами якого є угруповання. Найбільш суттєвими і складними питаннями, що постають при використанні ієрархічного методу класифікації, є вибір системи ознак, що стануть основою поділу, а також їх послідовність.

Ієрархічна система класифікації будується в такий спосіб (рис. 2.4): початкова множина елементів (0-й рівень) поділяється залежно від обраної класифікаційної ознаки на класи, що утворюють 1-й рівень; кожен клас 1-го рівня відповідно до власної класифікаційної ознаки поділяється на підкласи, що утворюють 2-й рівень, і т. д.

Класифікаційні ознаки визначають відповідно до мсти здійснення класифікації - властивостей об'єктів, що об'єднуються у класи.

В ієрархічній системі класифікації кожен об'єкт на будь-якому рівні належить до одного класу залежно від обраної класифікаційної ознаки. Кількість рівнів характеризує глибину класифікації.

Переваги ієрархічної системи класифікації:

o простота побудови;

o використання незалежних класифікаційних ознак у різних гілках ієрархічної структури.

Недоліки:

o жорстка структура, що спричинює складнощі при внесенні змін

o неможливість групувати об'єкти за непередбаченим заздалегідь поєднанням ознак.

Фасетний метод класифікації на відміну від ієрархічного дозволяє вибирати ознаки класифікації, не враховуючи семантику об'єкта класифікації. Кожна ознака фасетної класифікації відповідає фасеті, тобто списку значень найменованої ознаки класифікації. Ознаки класифікації називаються фасетами (facet). Для кожного об'єкта задається множина фасет - під-множина класифікаційних ознак, значення яких для нього визначені.

Множинне описання об'єктів техніко-економічної інформації здійснюється в конкретній задачі на основі задання фасетної формули, що утворюється з послідовності ознак класифікації, які використовуються у задачі. Кількість фасетних формул визначається можливим поєднанням ознак.

Для кожної фасетної формули може бути утворена ієрархічна класифікація, в якій на кожному рівні поділу використовується одна ознака, що відповідає окремій фасеті, а послідовність ознак визначається фасетною формулою.

При побудові фасетної системи класифікації необхідно, щоб значення, що використовуються в різних фасетах, не повторювалися. Фасетну систему легко можна модифікувати, вносячи зміни в конкретні значення будь-яких фасет.

При застосуванні фасетного методу класифікації слід додержуватися таких основних правил: 1) ознаки, які використовуються в різних фасетах, не повинні повторюватися; 2) із усіх ознак, що характеризують множину об'єктів класифікації, відбираються і фіксуються лише суттєві, які забезпечують розв'язування економічних задач.

Переваги фасетної системи класифікації:

o можливість використання великої кількості ознак класифікації;

o можливість простої модифікації всієї системи класифікації без зміни структури наявних угруповань.

Недоліком фасетної системи класифікації є складність її будови.

Дескрипторна (описова) система класифікації використовує мову опису інформаційних об'єктів (наприклад тезаурусів), яка схожа на природну мову. Особливо широко вона використовується в бібліотечній системі пошуку. Суть цієї системи класифікації полягає в тому, що:

o відбирається сукупність ключових слів або словосполучень, що описують конкретну ПрО або сукупність інформаційних об'єктів. Серед ключових слів можуть бути синоніми. Вибрані ключові слова і словосполучення підлягають нормалізації, тобто із сукупності синонімів вибирається найбільш вживаний;

o створюється словник дескрипторів - ключових слів і словосполучень, відібраних у результаті процедури нормалізації. Між дескрипторами встановлюються зв'язки, які дають змогу розширяти межі пошуку інформації.

Зв'язки можуть бути трьох типів:

1) синонімічні - визначають сукупності близьких за значеннями ключових слів;

2) родові - відображають включення певного класу об'єктів до іншого як підмножини;

3) асоціативні - мають спільні властивості. Приклад

Синонімічний зв'язок: студент <-> учень <-> школяр. Родовий зв'язок: університет <-> факультет <-> кафедра. Асоціативний зв'язок: студент <-> іспит <-> професор "-" <-" аудиторія.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]