Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции_информсистемы_Назаров_16_09_20012.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.86 Mб
Скачать

6. Системи класифікації і кодування інформації

6.1 Класифікатори.

Класифікація – це розподіл об’єктів по групах у відповідності до встановлених ознак подібності. Класифікація — це процедура групування, спрямована на виділення однорідних властивостей об’єктів.

Система класифікації дозволяє згрупувати об’єкти виділити певні класи, які характеризуватимуться низкою загальних властивостей. Виділені класи називають інформаційними об’єктами.

Класифікатори являють собою систематичне зведення, перелік яких-небудь об’єктів, що мають певне (більш за все числове) позначення. Тобто класифікатор — це систематизоване зведення найменувань і кодів інформаційних об’єктів.

В будь-якій країні розроблені і застосовуються державні (поштовий індекс), галузеві (інвентарний номер вагона) і регіональні (номер колії на станції) класифікатори. Наприклад, класифіковані галузі промисловості, устаткування, професії, одиниці вимірювання, статті витрат, вантажі, станції тощо.

Призначення класифікатора:

  1. систематизація найменувань кодованих об’єктів;

  2. однозначна інтерпретація одних і тих самих об’єктів в різних задачах;

  3. можливість узагальнення інформації по заданій сукупності ознак;

  4. можливість зіставлення одних і тих самих показників, що містяться у формах статистичної звітності;

  5. можливість пошуку і обміну інформацією між різними інформаційними системами;

  6. економія пам’яті комп’ютера при розміщенні кодованої інформації.

Структура класифікаторів визначається прийнятою системою класифікації і кодування інформації.

6.2 Методи класифікації об’єктів.

Розроблено три методи класифікації об’єктів, які розрізняються різною стратегією застосування класифікаційних ознак.

  1. Ієрархічний метод класифікації – всі об’єкти розбиваються на групи між якими установлюються відношення підпорядкування (ієрархії).

Ураховуючи достатньо жорстку процедуру побудови структури класифікації, необхідно перед початком роботи визначити її мету, тобто якими властивостями повинні володіти об’єднувані в класи об’єкти. Ці властивості приймаються надалі за ознаки класифікації. В ієрархічній системі класифікації кожний об’єкт на будь-якому рівні повинний бути віднесений до одного класу, який характеризується конкретним значенням вибраної класифікаційної ознаки. Для подальшого групування в кожному новому класі необхідно задати свої класифікаційні ознаки. Кількість рівнів класифікації, відповідає кількості ознак, вибраних як підстава для розподілу, і характеризує глибину класифікації.

Достоїнства ієрархічної системи класифікації: простота побудови і використання незалежних класифікаційних ознак в різних гілках ієрархічної структури. Недоліки ієрархічної системи класифікації: жорстка структура, яка призводить до складності внесення змін, оскільки доводиться перерозподіляти всі інформаційні об’єкти; неможливість групувати об’єкти за заздалегідь не передбаченими ознаками .

  1. Фасетний метод класифікації – всі об’єкти розбиваються на незалежні групи (фасети), за різноманітними ознаками.

На відміну від ієрархічної дозволяє задавати ознаки класифікації, які не залежать одна від одної і не залежать від самих об’єктів, що класифікуються. Ознаки класифікації називаються фасетами (facet — рамка). Кожний фасет містить сукупність однорідних значень даної класифікаційної ознаки. Причому значення у фасеті можуть розташовуватися в довільному порядку, хоча доречно їх впорядковувати. Схема побудови фасетної системи класифікації представляється у вигляді таблиці. Назви стовпців відповідають виділеним класифікаційним ознакам (фасетам). В кожній клітці таблиці зберігається конкретне значення фасета. Процедура класифікації полягає в присвоєнні кожному об’єкту відповідних значень з фасетів.

Достоїнства фасетної системи класифікації: можливість використання великої кількості ознак класифікації для створення інформаційних об’єктів; можливість простої модифікації всієї системи класифікації без зміни структури існуючих інформаційних об’єктів. Недоліком фасетної системи класифікації є складність її побудови, оскільки необхідно ураховувати все різноманіття класифікаційних ознак.

  1. Дескрипторний метод класифікації

Для організації пошуку інформації, для ведення тезаурусів (словників) ефективно використовується дескрипторна (описова) система класифікації, мова якої наближається до природної мови опису інформаційних об’єктів. Особливо широко вона використовується в бібліотечній системі пошуку.

Після класифікації об’єктів їм присвоюють коди.