Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
vstyp_psoi.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
709.63 Кб
Скачать

329. Система класифікації інформації.

Класифікація система розподілу об'єктів (предметів, явищ, процесів, понять) по класах відповідно до певною ознакою.

Розроблено три методи класифікації об'єктів:

1. ієрархічний.

2. Фасетний.

3. дескрипторний.

Ці методи розрізняються різною стратегією застосування класифікаційних ознак. Розглянемо основні ідеї цих методів для створення систем класифікації.

Ієрархічна система класифікації Ієрархічна система класифікації (рис. 1) будується таким чином: • вихідна безліч елементів складає 0-й рівень і ділиться залежно від обраного класифікаційної ознаки на класи (угруповання), які утворюють 1-й рівень; • кожен клас 1-го рівня відповідно до свого, характерним для нього класифікаційною ознакою ділиться на підкласи, які утворюють 2-й рівень; • кожен клас 2-го рівня аналогічно ділиться на групи, які утворюють 3-й рівень.

Фасетна система класифікації

Фасетна система класифікації на відміну від ієрархічної дозволяє вибирати ознаки класифікації незалежно як один від одного, так і від семантичного змісту классифицируемого об'єкта. Ознаки класифікації називаються фасетами (facet рамка). Кожен фасет (Фi) містить сукупність однорідних значень даного класифікаційної ознаки. Причому значення в фасет можуть розташовуватися в довільному порядку, хоча краще їх упорядкування. Процедура класифікації полягає в привласненні кожному об'єкту відповідних значень з фасетів. При цьому можуть використовуватися не всі фасети.

Дескрипторної система класифікації

Для організації пошуку інформації, для ведення тезаурусів (словників) ефективно використовується дескрипторної (описова) система класифікації, мова якої наближається до природної мови опису інформаційних об'єктів. Особливо широко вона використовується в бібліотечній системі пошуку. Суть дескрипторного методу класифікації полягає в наступному: • відбирається сукупність ключових слів або словосполучень, що описують певну предметну область або сукупність однорідних об'єктів. Причому серед ключових слів можуть знаходитися синоніми; • вибрані ключові слова і словосполучення піддаються нормалізації, тобто з сукупності синонімів вибирається один або декілька найбільш вживаних; • створюється словник дескрипторів, тобто словник ключових слів і словосполучень, відібраних в результаті процедури нормалізації.

330. Основні методи класифікації інформації.

Система класифікації визначається і характеризується використаним методом класифікації, ознаками класифікації, послідовністю і кількістю рівнів класифікації, кількістю угруповань.

Метод класифікації – це сукупність правил створення системи класифікаційних угруповань та зв"язки між ними. Розрізняють два основних методи класифікації: ієрархічний та фасетний.

Ієрархічний метод класифікації характеризується тим, що початкова множина об"єктів ТЕІ послідовно поділяється на угруповання (класи) першого рівня поділу, потім – другого і так далі. Сукупність угрупувань при цьому утворює ієрархічну деревоподібну структуру, яку зображають у вигляді гілястого графа.

Ієрархічний метод класифікації характеризується глибиною (кількістю рівнів класифікації), ємністю (глибина та кількість створених на кожному рівні угруповань) та гнучкістю (добра пристосованість для ручної обробки та велика інформативність кодів). Основним недоліком цього методу є жорсткість структури, яка зумовлена фіксованістю ознак та їх послідовністю. Зміна хоча б однієї ознаки призводить до перерозподілу класифікаційних угруповань.

Тому в класифікаторах, які побудовані за ієрархічним методом, повинні бути передбачені резервні ємності. Також цей метод не дає змоги агрегувати об'єкти за будь-яким довільним поєднанням ознак, що ускладнює АОД.

Фасетний метод компенсує недоліки ієрархічного методу класифікації. При цьому методі класифікації початкова множина об'єктів може незалежно поділятися на класифікаційні угруповання з використанням однієї з образних ознак. Кожна ознака фасетної класифікації відповідає фасеті, яка є списком значень цієї класифікації (колір: червоний, зелений, ....; професія: інженер, бухгалтер,...). Система класифікації може бути подана переліком незалежних фасетів (списків), які містять значення ознак класифікації. За допомогою фасетної формули, яка утворюється в послідовності ознак класифікації, можна описати об'єкти ТЕІ. Кількість фасетних формул, для яких можуть бути утворені ієрархічні класифікації, визначається можливим поєднанням ознак.

З використанням цих трьох ознак можна побудувати шість різних ієрархічних класифікацій з трьома рівнями розподілу.

Фасетний метод класифікації не має недоліків ієрархічного методу і тому він особливо ефективний при функціонуванні комп'ютерних ІС.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]