- •1.1. Повідомлення та інформація
- •1.2. Моделі інформаційних систем
- •1.4. Предмет теорії інформації та кодування
- •2.2. Кількісна міра інформації
- •2.3. Ентропія та її властивості
- •2.4. Безумовна ентропія
- •2.5. Умовна ентропія
- •2.6. Ентропія об'єднання двох джерел
- •3.1. Продуктивність дискретного джерела та швидкість передачі інформації
- •4.1. Квантування сигналів
- •4.2. Інформаційні втрати
- •4.3. Продуктивність неперервного джерела та швидкість передачі інформації
- •IhlilhM
- •4.4. Пропускна здатність . . . .
- •5.1. Класифікація кодів і характеристики їх
- •5.4. Способи подання кодів
- •5.6. Основні теореми кодування для каналів
- •6.1. Класифікація первинних кодів
- •6.2. Нерівномірні двійкові первинні коди
- •6.2.1. Код морзе
- •6.2.2. Число-імпульсні коди
- •6.3. Рівномірні двійкові первинні коди
- •6.3.1. Числові двійкові коди
- •6.3.2. Двійково-десяткові коди
- •6.3.4. Двійково-шістнадцятковий код ;;.-,-.
- •6.3.5. Рефлексні коди
- •7.1. Двійкові коди,
- •7.1.2. Код із перевіркою на непарність
- •7.1.3. Код із простим повторенням
- •7.2. Недвійкові коди, що виявляють помилки
- •7.2.1. Код із перевіркою за модулем q
- •7.2.2. Код із повторенням
- •8"6 90472 "100562 І' • шТрИховє зОбраЖєння кодового сло-
- •8.1. Двійкові групові коди
- •8.1.1. Лінійний систематичний груповий (блоковий) код
- •8.1.2. Коди хеммінга
- •8.1.4. Коди боуза - чоудхурі - хоквінгема
- •8.1.5. Код файра
- •8.1.6. Код із багатократним повторенням
- •8.3.2. Узагальнений код хеммінга
- •8.3.3. Коди боуза - чоудхурі - хоквінгема
- •8.3.4. Коди ріда - соломона
- •8.3.6. Недвійковий ланцюговий код
- •9.1. Вірогідність передачі кодованих повідомлень
- •9.2. Стиснення інформації"
- •9.2.1. Способи стиснення даних при передачі
- •9.2.2. Способи стиснення даних при архівації
- •Збіжного рядка
- •9.3. Збільшення основи коду
- •0Сзезс99е8с0е1с10d1c242d5c3d2c6d8cbd6e8c0
- •VosooooooooooooooooOvJvJ
6.2.2. Число-імпульсні коди
У число-імпульсному коді, який ще має назву одинично-десяткового [34], кожний розряд десяткового числа записується у вигляді відповідної кількості одиниць. Для можливості приймання їх приймачем окремі розряди кодових комбінацій відокремлюються інтервалами. Код не є рівномірним, хоча може бути перетворений на рівномірний дописуванням у кожній ком-
бінації зліва нулів для заповнення загальної кількості їх елементів до 10. Так, запис десяткового числа 45 має вигляд 1111,11111 (у варіанті рівномірного число-імпульсного коду це число записується так: 0000001111, 0000011111).
6.3. Рівномірні двійкові первинні коди
Ці коди широко застосовуються для передачі телеграфних повідомлень і даних, а різняться вони кількістю елементів, з яких складаються кодові комбінації, та комбінаціями цих елементів.
6.3.1. Числові двійкові коди
У цих кодах, які ще називаються простими, всі повідомлення нумеруються порядковою послідовністю в двійковій системі числення, що утворює їхній двійковий код. Кількість комбінацій двійкового коду N = 2Л, тобто для запису в двійковому коді N повідомлень треба мати п розрядів: п = log2 N, де п — ціле число.
У числових двійкових кодах використовуються всі можливі комбінації (ТУд = N); тому ці коди є безнадмірними та завадоне-захищеними, а мінімальна кодова відстань у них dmin = 1.
Міжнародний телеграфний код. Для використання в телеграфних апаратах МККТТ рекомендується міжнародний телеграф-
Таблиця 6.2
Номер комбінації |
Регістр |
|
Комбінація |
|
національний (укр/рос) |
латинський |
цифровий |
||
1 |
Т |
Т |
5 |
00001 |
2 |
Повернення каретки |
|
00010 с |
|
3 |
0 |
0 |
9 |
00011 |
4 |
Пробіл |
■■ • ■ ■:./. : |
|
00100 |
5 |
X |
н |
щ |
00101 |
6 |
н |
N .:>;:■ |
»- |
00110 |
7 |
м |
м |
|
00111 |
8 |
Переведення рядка |
|
01000 |
|
9 |
Л |
L |
) |
01001 |
10 |
Р |
R |
4 |
01010 |
11 |
Г |
G |
Ш |
01011 |
12 |
І/И |
І - |
8 |
01100 |
13 |
П |
Р |
О |
01101 |
14 |
Ц |
С |
|
01110 |
114
115
Закінчення табл. 6.2
Таблиця 6.3
|
Регістр |
|
Комбінація ] |
|
національний (укр/рос) |
латинський |
цифровий |
||
15 |
Ж |
V |
= |
01111 |
16 |
Е |
Е |
3 |
10000 |
17 |
3 |
Z |
+ |
10001 |
18 |
д |
D |
Хто там? |
10010 |
19 |
Б |
В |
? |
10011 |
20 |
С |
S |
Апостроф |
10100 |
21 |
И/Ы |
Y |
6 |
10101 |
22 |
Ф |
F |
Є/З |
10110 |
23 |
Ь |
X |
/ |
10111 |
24 |
А |
А |
- |
11000 |
25 |
В |
W |
2 |
11001 |
26 |
И |
J |
Ю |
11010 |
27 |
Цифровий регістр |
|
11011 |
|
28 |
У |
и |
7 |
11100 |
29 |
Я |
О |
1 |
11101 |
30 |
к |
к |
( |
11110 |
31 |
Латинський регістр |
|
11111 |
|
32 |
Національний регістр |
|
00000 |
|
ний код № 2 (табл. 6.2). У цьому п'ятиелементному коді з 32 комбінацій 29 застосовуються для передачі літер, цифр, розділових і службових знаків у трьох регістрах (латинському, національному, цифровому), для яких призначено решту кодових комбінацій.
У зв'язку з тим що при спотворенні кодової комбінації, яка відповідає алфавітному регістру (латинському, національному), вся послідовність комбінацій, що передається після неї, декодується неправильно, для перемикання регістрів вибираються комбінації, найбільш захищені від дії завад (латинський регістр — 11111, національний регістр — 00000).
Коди для передачі даних та обміну інформацією. При передачі даних, крім літер, цифрових, арифметичних і службових знаків міжнародного телеграфного коду № 2, необхідно передавати також не тільки малі, а й великі літери, додаткові розділові, службові та керуючі знаки. Розроблений для цієї мети міжнародний семирозрядний стандартний код № 5 (табл. 6.3), який рекомендовано для передачі та оброблення інформації, побудовано так, щоб будь-який знак його кодової таблиці можна відобразити семиелементною послідовністю, яка містить три Старші розряди, що відповідають стовпцю а7а6а$, і чотири молодші розряди, які відповідають рядку а4а3а2а1 (наприклад, літері В відповідає кодова послідовність 1000010). При цьому в
|
|
|
|
|
|
|
|
0 |
0 і |
6 jo |
1 |
T~l |
1 |
T~~] |
|
1 -^ |
|||||||||||||||
|
*ъ |
0 |
0 |
1 |
1 |
0 |
0 |
1 |
1 |
||||||
|
1 ^ |
||||||||||||||
0 |
і] |
, o| |
1 |
0 |
■ 1І |
ol |
1^ |
||||||||
г |
|
|
|
|
|
|
|
|
|
|
|||||
а11 а61 as |
а„ |
а3 |
£l |
а, |
|
№ |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
|
0 |
0 |
0 |
0 |
0 |
NUL |
JTC7)DLE |
Space |
0 |
-@- |
P |
V |
-^ |
||
Ь ' |
0 |
0 |
0 |
1 |
1 |
(TC^SOH |
DC, |
» |
1 |
A |
Q |
a |
-aJ |
||
г |
0 |
0 |
1 |
0 |
2 |
(TC2)STX |
DC? |
•* |
2 |
B |
R |
b |
_lJ |
||
|
0 |
0 |
1 |
1 |
3 |
(ТС3) ETX |
DC3 |
#£ |
3 |
C |
S |
с |
s | |
||
|
0 |
1 |
0 |
0 |
4 |
(ТСД) EOT |
DCd |
$ |
4 |
D |
T |
d |
t |
||
<: |
0 |
1 |
0 |
1 |
5 |
(ТСО ENQ |
(ТСЙ) NACK |
% |
5 |
E |
и |
e |
u | |
||
г |
0 |
1 |
1 |
0 |
6 |
(TCe) ACK |
(TO,) SYNC |
& |
6 |
F |
V |
f |
V | |
||
Ії.: |
0 |
1 |
1 |
1 |
7 |
BEL |
(TC10) ETB |
'1 |
7 |
G |
w |
9 |
w j |
||
|
1 |
0 |
0 |
0 |
8 |
(FEo) BS |
CAN |
( |
8 |
H |
X |
h |
X 1 |
||
1 |
1 |
0 |
0 |
1 |
9 |
(FE,) HT |
EM |
) |
9 |
I |
Y |
і |
Y |
||
|
1 |
0 |
1 |
0 |
10 |
(FE2)LF |
SUB |
* |
|
J |
z |
J |
z 1 |
||
f. |
1 |
0 |
1 |
1 |
11 |
(FE3) VT |
ESC " n |
+ |
|
К |
JL |
k |
|
||
|
1 |
1 |
0 |
0 |
12 |
(FE*) FF |
(ISa) FS |
|
< |
L |
|
I |
|
||
ft |
1 |
1 |
0 |
1 |
13 |
(FE,) CR |
(1S3) GS |
_ |
= |
M |
j_ |
m |
|
||
С- |
1 |
1 |
1 |
0 |
14 |
SO |
(IS,) RS |
|
> |
N |
A |
n |
|
||
і |
Hi |
гп |
ш |
ґП |
15 |
SI |
(ISO US |
/ |
? |
O |
~ |
о |
del! |
||
•Ї
разі необхідності простим виключенням старших розрядів можна дістати під множини комбінацій меншої розрядності.
Цей код у США використовується під назвою коду ASCII (або US ASCII) як засіб взаємодії з ЕОМ. Він дає змогу перетворювати машинні дані, записані в двійковому коді, на звичайні знаки (числа, літери), які можна роздрукувати та вивести на термінал. Оскільки восьмибітові коди застосовуються в ЕОМ значно частіше, ніж семибітові, в коді ASCII-8 восьмий (крайній лівий) біт використовується як біт парності (1 — якщо праві сім бітів складають непарне число одиниць і 0 — при парному їх числі для перевірки правильності передачі даних. При виявленні помилки користувачеві видається повідомлення Parity Error — помилка парності).
Міжнародний стандартний код № 5 логічно може бути поділений на чотири зони. До першої зони (колонки 0, 1) належать функціональні символи, за винятком символу DEL (витирання, перебій), для якого відведено останнє місце (комбінація 1111111). Основна частина функціональних символів цієї зони поділяється на чотири групи:
• перша — для керування передачею інформації по каналах зв'язку (TCj... TC10);
.?■! • друга — для керування друком (FE0... FE5); t • третя — для керування кінцевими пристроями (DCj... DC4); +* • четверта — для роздільників інформації (ISj... IS4). н Перша група містить символи зв'язку для керування передачею інформації по каналах зв'язку. Вони мають два призна-
116
117
чення: використовуються для обрамлення повідомлення у формат, який легко розпізнається, або в послідовність, яка може оброблятися споживачем; застосовуються для керування передачею даних у мережі.
Як відомо, текст — це інформаційний зміст повідомлення. Якщо воно досить тривале, то його, як правило, розбивають на кілька блоків, які передають один за одним по лінії зв'язку. Залежно від системи, що використовується для передачі, перед блоками може бути заголовок, який повинен мати адресну та керуючу інформацію, що супроводжує текст повідомлення. Заголовок може містити відомості про пріоритет повідомлення, дату та час його відправлення, ідентифікатор лінії зв'язку, по якій передається повідомлення, відомості про ступінь секретності тощо. Отже, в заголовку подаються відомості про те, як повідомлення має оброблятися на шляху від джерела до одержувача. Рішення про використання заголовка повідомлення, а також його зміст приймається на основі характеристик конкретної системи передачі даних і програмного забезпечення. Якщо повідомлення містить, наприклад, чотири блоки тексту, то перший його блок передається із заголовком, у якому подаються необхідні характеристики повідомлення, а всі наступні блоки передаються без заголовка.
Розглянемо призначення окремих символів зв'язку більш докладно.
Перша група. Символ TCj (початок заголовка) використовується як перший символ заголовка інформаційного повідомлення і повідомляє одержувача, що інформація, яка подається після нього, має інтерпретуватися (тлумачитися) як заголовок повідомлення.
Аналогічно символ ТС2 (початок тексту) розміщується на початку тексту і застосовується для позначення кінця заголовка, а також показує, що інформація, яка подається після нього, є текстом повідомлення.
Символ ТС3 (кінець тексту) передається в кінці тексту й означає, що повідомлення було передано повністю.
Символ ТС4 (кінець передачі) використовується для зазначення кінця передачі одного або кількох текстів.
Символ ТС5 (хто там?) застосовується для запиту відповіді віддаленої станції, причому відповідь може містити ідентифікатор і статус станції.
Символ ТС6 (підтвердження) передається приймачем як підтвердження прийому запиту передавача.
Символ ТС7 (перший авторегістр) використовується для розширення функцій керування передачею даних; при цьому він змінює значення обмеженої кількості символів, які передають-
ся безпосередньо за ним. До цих символів можуть належати тільки графічні символи та символи зв'язку.
Символ ТС8 (негативна квитанція) передається приймачем як негативна відповідь передавачу.
Символ ТС9 (синхронізація) застосовується в синхронних системах передачі за відсутності інформаційних символів для встановлення та підтримки синхронізації кінцевого устаткування.
Символ ТС10 (кінець блока) використовується для зазначення кінця блока тоді, коли дані, що передаються, розбиваються на блоки.
Зазначимо, що в деяких системах при передачі багатоблоко-вого повідомлення символ ТС3 (кінець тексту) має бути в кінці кожного блока для того, щоб одержувач міг скласти з блоків повне повідомлення.
Друга група. До цієї групи належать символи керування друком, які використовуються при розміщенні інформації на друкованому аркуші або на екрані пристрою візуального зображення з метою полегшення сприйняття даних. Перший символ FE0 (повернення на крок) відповідає поверненню на крок і дає змогу повернути головку пристрою друку на один крок назад. Для пристроїв візуального зображення цей символ означає переведення покажчика на одну позицію ліворуч.
Символ FEj (горизонтальна табуляція) дає змогу перемістити головку друку в задане положення в горизонтальному напрямку; символ FE2 (переведення рядка) — в те саме положення в наступному рядку; символ FE3 (вертикальна табуляція) — в те саме положення через кілька рядків у межах однієї сторінки; символ FE4 (переведення формату) — в те саме положення на зумовленому рядку на іншій сторінці; символ FE5 (повернення каретки) — в початкове положення рядка.
Третя група. До цієї групи належать символи керування пристроями, що встановлюють фізичні функції на терміналі. Так, символ DC, призначений для приєднання до терміналу касетного накопичувача; символ DC2 — для вимикання цього нако-пичувача; символ DC3 - для виведення інформації з пристрою візуального відображення на допоміжний пристрій друку, а символ DC4 — для блокування пристрою візуального зображення, щоб оператор не зміг вивести з нього дані.
Четверта група. Ця група символів має чотири роздільники інформації, призначені для логічного розмежовування інформації з метою полегшення її оброблення на ЕОМ. Так, символ IS j використовується для розмежовування найменшого обсягу інформації і називається роздільником одиниць; символ IS2 — для розмежовування підгруп інформації, які можуть містити кілька одиниць; символ IS3 — для розмежовування підгруп ін-
118
119
формації,
які можуть складатися з кількох підгруп,
а символ IS4
—
для розмежовування файлів, які можуть
містити кілька груп
інформації.
Решту зон табл. 6.3 зайнято графічними знаками. її другу зону (колонки 2, 3) виділено для спеціальних математичних знаків, а також знаків пунктуації та цифр. У двох останніх зонах цієї таблиці розміщуються великі й малі латинські літери відповідно до вимог лексико-графічної впорядкованості (положення цифр, знаків пунктуації та пробілу також вибрано з урахуванням цих вимог). Тут знаходяться й усі резервні позиції.
Знак «Пробіл» («Space») не друкується, але належить до числа графічних і застосовується для поділу слів і переміщення позиції друку на один крок уперед. Цифри кодуються звичайним двійковим кодом. Побудова чотирирозрядних комбінацій для них виконується відкиданням трьох старших розрядів.
Є два методи декодування знаків у міжнародному стандартному коді № 5. По-перше, можна застосувати їх двійкове подання (наприклад, послідовність 1010100 відповідає знаку Т). Інший метод полягає у використанні номерів рядків і стовпців для однозначного визначення конкретного знака (наприклад, запис 5/04 відповідатиме тому самому знаку Т, який знаходиться у п'ятому стовпці та четвертому рядку).
Відсутність у розглядуваному коді знаків, які відповідали б національному алфавіту (в тому разі, коли він відрізняється від латинського) не дає змоги широко використовувати його у країнах з нелатинськими алфавітами, в тому числі й у нашій країні. Тому на основі міжнародного стандартного коду № 5 було розроблено код [12, 43], в якому враховано особливості національного алфавіту (табл. 6.4). У цей код уведено національний регістр (український). Зручність використання такого семирозрядного коду в системах передачі даних полягає в простоті перетворення його на восьмирозрядний код з перевіркою на парність, що дає змогу підвищити завадостійкість передачі інформації по каналах із завадами.
Подальший розвиток кодів обчислювальних машин і апаратури передачі даних пов'язаний зі співробітництвом у 70-ті роки XX ст. країн Ради Економічної Взаємодопомоги у сфері розробки та вдосконалення обчислювальної техніки, завдяки чому було розроблено і впроваджено комплекс програмно-сумісних обчислювальних машин третього покоління — Єдиної системи ЕОМ.
Одними із засобів забезпечення їх сумісності є прийняті форма та формати подання даних. Структурною одиницею тут виступає восьмибітний байт. При цьому використовуються такі коди: КОІ-7 і КОІ-8 — для обміну інформацією; КПК-12 — для подання даних на перфокартах; ДКОІ — внутрішній.
120
Код КОІ-7 розроблено на основі семирозрядного стандартного коду [12,43], в якому враховано вимоги міжнародного стандарту ІСО МС 646. Семирозрядний код КОІ-7Н0 містить 128 знаків міжнародного алфавітно-цифрового набору. Індекс «0» у позначенні Нр указує місце цього коду при перекодуванні його в код КОІ-8: він розміщується в лівій частині кодової таблиці КОІ-8. При цьому старшим буде розряд 0.
Семирозрядний код КОІ-7Н! також містить 128 знаків: у стовпцях 0... З розміщуються символи, що відповідають знакам кодової таблиці КОІ-7Н0, а в стовпцях 4...7 — великі та малі літери національного алфавіту. Індекс «1» у позначенні Н, указує місце цього коду при перекодуванні його в код КОІ-8: він розміщується в правій частині кодової таблиці КОІ-8 під восьмим розрядом 1. Семирозрядний код КОІ-7С, містить 32 кодові комбінації для передачі додаткових керуючих знаків. Індекс «1» у позначенні С, указує місце цього коду при перекодуванні його в код КОІ-8: він розміщується в правій частині кодової таблиці КОІ-8 під восьмим розрядом 1.
Якщо під час запису інформації в послідовності кодованих знаків необхідно виконати перехід від коду КОІ-7Н0 до коду KOI-7Hj і навпаки, то подаються спеціальні кодові комбінації-«ВИХ» — 0001110 та «ВХ» — 0001111. Відсутність на початку тексту керуючих знаків «ВИХ» і «ВХ» рівнозначно наявності там керуючого знака «ВХ».
Коди КОІ-7Н0, KOI-7Hj і КОІ-7С1 дають змогу доповнювати їх восьмим розрядом для виявлення помилок в інформації. Це робиться перевіркою на парність семирозрядної кодової комбінації. Сукупність названих кодів з додатковим восьмим розрядом у кодовій комбінації утворює восьмирозрядний код КОІ-8.
Двійковий код ДКОІ для оброблення інформації розроблено на основі універсального міжнародного коду EBCDIC (Exended Binary Disimal Interchage Code) із включенням літер національного алфавіту [43].
Код КПК-12 для перфокарт [43] призначений для занесення інформації на 12-позиційні перфокарти пристроїв підготовки введення-виведення даних. Він містить 256 кодових комбінацій, які будуються на основі матриці 16 х 16. У кодовій таблиці виключено літери національного алфавіту, що мають однакове написання з латинськими (наприклад С, К, Р та ін.).

1
Номер 1
комбі-I
нації