Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Perelik_pitan_dlya_pidsumkovogo_modulnogo_kont....docx
Скачиваний:
1
Добавлен:
08.09.2019
Размер:
72.27 Кб
Скачать

5. Суть системи класифікації економічної інформації. Методи класифікації

Класифікація — обов’язковий етап попередньої підготовки економічних даних до автоматизованого оброблення, а також передумова раціональної організації інформаційної бази та моделювання інформаційних процесів.

Її можна визначити як складову інформаційного забезпечення будь-якої інформаційної системи, що належить до мовних засобів управління. Тому класифікація є основою для кодування інформації та наступного її пошуку.

Система класифікації — це сукупність методів і правил розподілу множини об’єктів (М) на підмножину(Мij) відповідно до ознак схожості або несхожості.

Об’єкт класифікації — елемент класифікаційної множини.

Класифікаційне групування — підмножина об’єктів, отриманих у результаті класифікації.

Розрізняють два методи класифікації — ієрархічний і фа- сетний.

Ієрархічний метод класифікації — це послідовний поділ множини об’єктів на підлеглі класифікаційні угруповання.

Переваги: логічність побудови, чіткість визначення ознак, великий обсяг інформації, зручність використання.

Недоліки: жорстка структура, брак резервного обсягу.

Фасетний метод класифікації — паралельний поділ множини об’єктів на незалежні класифікаційні угруповання.

Фасет — набір значень однієї ознаки класифікації. Фасети взаємно незалежні. Кожний об’єкт може одночасно входити в різні класифікаційні угруповання.

Переваги: гнучкість структури (пристосування до змін у задачах), дає можливість вводити нові фасети чи видаляти старі.

Недоліки: недостатньо повне використання обсягу.

6. Суть системи кодування економічної інформації. Методи кодування

Класифікація і кодування являють собою єдиний безперервний процес для формального опису інформації з метою забезпечення її компактного збереження в пам'яті комп'ютера і зручності її обробки.

Кодування - завершальний етап процесу класифікації.

Ціль кодування полягає в представленні інформації у виді зручному для обробки на комп'ютері, більш компактного запису інформації а отже економія пам'яті, доповнення інформації існуючої вихідною мовою.

Система кодування – сукупність правил і методів розробки кодів і порядок складання класифікаторів.

Кодуванням називається утворення і присвоєння кодів класифікаційним угрупованням і об'єктам класифікації

Кодом називається умовна позначка класифікаційних угруповань і об'єктів класифікації.

Для кодування економічної інформації використовують так називані семантичні коди. Це коди, утворені на підставі властивостей об'єктів . Для кожного коду прийняті такі позначення:

алфавіт коду - система знаків прийнята для утворення кодів (числа, букви, спеціальні знаки);

основа коду, кількість знаків в алфавіті коду;

довжина коду, число знаків у коді без обліку пробілів;

розряд коду, позиція знаків у коді;

структура коду, умовна позначка складу і послідовності розташування знаків у коді.

Розглянутий вид кодування називається семантичним кодуванням об'єктів і класифікаційних угруповань.

Крім семантичного в ИС використовуються наступні види кодування:

Посимвольное - кодування символів для запису на комп'ютерні машинні носії у відповідності з визначеними стандартами;

перешкодозахисне - до повідомлень додаються зайві розряди, значення яких залежить від характеру повідомлення;

криптографічне - кодування з метою захисту інформації від несанкціонованого доступу;

кодування графічної й іншої нетекстової інформації - кодування з метою запису на комп'ютерні носії різних об'єктів нетекстового походження (зображення, звуки, анімації, відео);

Ціль семантичного кодування:

зменшення обсягу даних для більш раціонального використання технічних ресурсів при передачі і збереженні інформації;

однозначна ідентифікація об'єктів і проведення розходжень, що із працею визначаються звичайною мовою;

формалізація властивостей об'єктів для використання логічної обробки даних.

Семантичне кодування розділяється на :

ідентифікаційне - використовується для однозначної ідентифікації (виділення) одного чи декількох об'єктів з безлічі інших. Попередня класифікація при цьому не проводиться;

класифікаційне - призначене для формального запису інформації про властивості кодируемых об'єктів. Цьому виду кодування завжди передує попередня класифікація.

Вимоги до системи кодування:

система кодування повинна відповідати ЄСКК ТЕІ; алфавіт коду по можливості повинний бути цифровим;

кодове позначення повинне забезпечувати резерв, тобто можливе кодування додаткових позицій

Тепер розрізняють такі методи кодування: порядковий; серійний; позиційний.

Порядковий передбачає утворення і присвоєння кодів об'єктів з чисел натурального ряду. Приклад: 01, 02, 53.

Призначений для кодування невеликої кількості об'єктів, причому порядок їхнього проходження може бути довільним. Порядковий код не несе в собі ніякої характеристики об'єкта, характеризується тільки довжиною, що визначається значністю загального числа об'єктів кодування. Якщо порядковий код має меншу, чим у максимальному значенні значність то в нього додаються лідируючі нулі. Даний метод не передбачає проведення попередньої класифікації.

Серійний передбачає проведення однорівневої попередньої класифікації. Отримані в результаті класифікації угруповання визначається серією кодів з урахуванням резерву для кодування додаткових позицій. Приклад: для кодування академічних груп вузів за допомогою серійного методу можна визначитися в такою серією кодів: 0001 - 0030, 0031-0060. Розмір серії визначається по максимально можливій кількості об'єктів відповідної угруповання. Якщо можлива кількість об'єктів заздалегідь передбачити неможливо - необхідно установити великий розмір серії. В основному даний метод використовується разом із двома методами кодування (позиційним, порядкової).

Позиційний передбачає утворення коду об'єктів з кодів значень ознак (властивостей, якими володіє даний об'єкт). Перевага даного методу полягає в гнучкості, тобто - можливості кодування по довільній кількості ознак.

Розрізняють два різновиди позиційного коду:

Позиційно - залежний (коли значення молодшої ознаки позиційно залежить від значень старших ознак).

Позиційно-незалежний код - значення молодшої ознаки позиційно не залежить від значень старшої ознаки.

Звичайно код складається з двох частин: ідентифікаційної і класифікаційний.

Друга описує властивості об'єктів, а перша його порядковий номер (ідентифікатор).

Для забезпечення вірогідності введення і збереження кодів у пам'яті комп'ютера в кінець коду часто додається контрольний чи розряд контрольне число одержуване за допомогою спеціального апарата в процесі обробки вихідного значення кодів.

Рівнобіжний метод кодування заснований на фасетній класифікації, де кожній незалежній ознаці ставиться у відповідність кодове позначення. Порядок розміщення кодів узагалі не має значення. Але бажано при цьому з безлічі незалежних ознак класифікації в контексті розв'язуваної задачі виділити найбільш важливі і поставити коди цих ознак спочатку, а коди менш значимих - наприкінці коду.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]