- •Міністерство освіти і науки України Державний навчальний заклад «Приазовський Державний Технічний Університет» Кафедра перекладу
- •Введення
- •Штрихове кодування інформації
- •Класифікація і кодування інформації. Інформаційні технології
- •Єдина система класифікації та кодування. Категорії класифікаторів
- •Кодування інформації
- •Способи кодування
Єдина система класифікації та кодування. Категорії класифікаторів
Після присвоєння кодів створюється класифікатор.
Класифікатор — це систематизоване зібрання однорідних найменувань та їх кодових позначень.
Єдина система класифікації та кодування — це комплекс взаємопов’язаних класифікаторів техніко-економічної інформації, пристосованих до оброблення засобами обчислювальної техніки з автоматизованою системою ведення цих класифікаторів.
Результатом робіт із класифікації та кодування є розроблення класифікаторів за типом об’єктів і категоріями.
Держстандартом допускається використання класифікаторів таких видів:
загальнодержавні (державні) класифікатори;
міжгалузеві класифікатори;
галузеві класифікатори;
класифікатори підприємств (локальні).
Наведемо перелік основних загальнодержавних та галузевих класифікаторів:
СПАТО — система позначень автономій, територій, областей;
УКФВ — український класифікатор форм власності;
КОПФГ — класифікатор організаційно-правових форм господарювання;
ЄДРПОУ — єдиний державний реєстр підприємств, організацій України;
ЗКГНГ — загальний класифікатор галузей народного господарства;
СПОДУ — система позначень органів державного управління;
УКВ — український класифікатор валют;
УКП — український класифікатор продукції;
КОВ — класифікатор одиниць виміру;
УСГК — українська стандартна галузева класифікація ;
УБК — українська бюджетна класифікація;
КВПП — класифікатор видів платників податків;
КБУ — класифікатор банківських установ;
УКОЗ — український класифікатор основних засобів;
Наведемо приклад кодових позначень:
УКУД — український класифікатор управлінських документів.
Код уніфікованої форми документа складається з 7 цифрових десяткових знаків і контрольного числа. Структура коду форми документа за УКУД:
ХХ — клас форм;
ХХ — підклас форм;
ХХХ — реєстраційний номер;
Х — контрольне число.
УКВЕД — український класифікатор видів економічної діяльності.
Загальне кодове позначення об’єктів КВЕД виглядає так:
ХХ — розділ;
ХХ. Х — група;
ХХ. ХХ — клас;
ХХ. ХХ. ХХ — підклас.
Кодування інформації
Як уже зазначалося, класифікація інформації є основою її кодування.
Кодування - це утворення і надання кодового позначення об'єктам класифікації та класифікаційним угрупованням. Умовне позначення об'єктів за допомогою знака або сукупності знаків називають кодом. Система кодування - це сукупність правил утворення коду.
Система кодування використовується для заміни назви об'єкта на умовні позначення (коди) з метою забезпечення зручної і більш ефективної обробки інформації. Для кожного коду встановлюється: алфавіт коду - система знаків, що прийнята для утворення коду (цифровий, літерний, літерно-цифровий); основа коду - кількість знаків в алфавіті коду; розряд коду - позиція знака в коді; довжина коду - кількість знаків у коді. Процедура надання об'єктові кодового позначення називається кодуванням. Залежно від того, чи передує кодуванню класифікування об'єктів, усі відомі системи кодування поділяють на реєстраційні і класифікаційні системи, кожна з цих систем використовує певні методи кодування.
Класифікаційні системи кодування призначені для надання кодів об'єктам, що попередньо систематизовані за певними класифікаційними ознаками. Розрізняють послідовне і паралельне кодування.
За алфавіт кодування прийнято латинський, довжина коду - чотири розряди. Структура коду, починаючи зі старшого розряду, така: 1-й старший розряд виділений для класифікаційної ознаки "держава" - U (Україна); 2-й - "територія" (область); 3 і 4 - "хост".
Кодування розрахункових палат у системі електронних платежів здійснюється за аналогічним принципом, з тією відмінністю, що перший (старший) розряд (буква U) заміняється на букву регіону (логічна прив'язка учасника платіжної системи до палати), третій та четвертий символи відмінні від НО і відповідають HP (розрахункова палата). Наприклад, код електронної адреси Львівської розрахункової палати - NNHP, Тернопільської - ТТНР, Чернівецької - ZZHP тощо. Кодування банківських установ, як учасників електронних платежів, здійснюється за таким принципом: першим розрядом є літера території, яка обслуговує банківську установу; другий - літера території, де розташована банківська установа; третій та четвертий знаки є унікальним ідентифікатором банківської установи в межах території розташування. Наприклад, код електронної адреси Львівської філії Трансбанку - NNKA.
Така побудова кодів регіональних палат і банків дає можливість кодувати банки, які розташовані на території одного регіону, а обслуговує їх розрахункова палата іншого регіону. Наприклад, код філії львівського банку, що розміщена в Донецькій області і обслуговується Львівською регіональною розрахунковою палатою, буде мати код NDIA.
Паралельне кодування використовується для фасетної системи класифікації. Суть методу полягає в такому: всі фасети кодуються незалежно одна від одної; для значень кожної фасети виділяється певна кількість розрядів коду (у цьому разі для всіх фасет виділено один розряд, тому що кількість значень у фасетах не перевищує числа десять). Паралельній системі кодування притаманні ті ж переваги і недоліки, що її фасетній системі класифікації.
Проведемо кодування інформації, класифікованої за домогою фасетної схеми (див. табл. 1.1). Кількість кодових угруповань визначено кількістю фасет і становить п'ять. Виберемо десяткову систему числення як алфавіт кодування, для значень фасет - один розряд, що дозволить мати довжину коду, рівну чотирьом. На відміну від послідовного кодування для ієрархічної системи класифікації в цьому методі не має значення порядок кодування фасет. У загальному вигляді код можна записати як ХХХХХ, де X - значення коду фасети. Розглянемо структуру коду, починаючи зі старшого розряду:
1-й (старший) розряд виділений для фасети "Призначення швейного виробу" і має такі значення: 1 - побутові; 2 - спортивні; 3 - відомчі; 4 - спеціальні; 2-й розряд виділений для фасети "Вид" і має такі значення: 1 - пальта; 2 - напівпальта; 3 - плащі; 4 - куртки; 5 - костюми; 6 - сорочки тощо;
3-й розряд виділений для фасети "Матеріал" і має значення: 1 - тканина; 2 - трикотаж; 3 - натуральна шкіра; 4 - штучна шкіра; 5 - натуральне хутро; 6 - штучне хутро тощо;
4-й розряд виділений для фасети "Сезон" і має значення: 1 - зимові; 2 - літні;
4-й розряд виділений для фасети "Стать" і має значення: 1 - чоловічі; 2 - жіночі; 3 - дитячі.
Прийнята система кодування дає змогу легко розшифрувати будь-який код угруповання, наприклад: 13123 - дитячі літні із тканини плащі побутові; 21211 - чоловічі зимові з трикотажу пальта спортивні. Процедура кодування полягає в наданні кожному об'єктові відповідних значень із фасет. При цьому можуть бути використані не всі фасети. Для кожного об'єкта задається конкретне групування фасет структурною формулою, в якій відображається їх порядок розташування: Ks = (Ф1, Ф2,..., Фі.,. .., Фn ). Так, для структурної формули К = [Вид (Ф2), Матеріал (Ф3), Сезон (Ф4)] отримаємо код 351 - плащі зі штучної шкіри зимові.
