
- •История кодирования
- •Теория кодирования
- •Определение понятий
- •Информация и алфавит
- •2.3 Двоичная система счисления
- •Практика кодирования
- •Кодирование сигнала
- •Первая теорема Шеннона
- •Способы кодирования/декодирования информации
- •Конкретные методы кодирования
- •Алфавитное неравномерное двоичное кодирование
- •Равномерное алфавитное двоичное кодирование
- •Азбука Морзе
- •Блочное двоичное кодирование
- •Обнаружение и исправление ошибок в технике связи
Азбука Морзе
В качестве примера использования кодирования с неравной длительностью элементарных сигналов рассмотрим телеграфный код Морзе («азбука Морзе»). В нём каждой букве или цифре сопоставляется некоторая последовательность кратковременных импульсов - точек и тире, разделяемых паузами. Длительности импульсов и пауз различны: если продолжительность импульса, соответствующего точке, обозначить г, то длительность импульса тире составляет Зг, длительность паузы между точкой и тире г, пауза между буквами слова 3;, пауза между словами (пробел) - 6г. Таким образом, под знаками кода Морзе следует понимать: « •» - «короткий импульс + короткая пауза», «-» - «длинный импульс + короткая пауза», «0» - «длинная пауза», т.е. код оказывается троичным.
Свой код Морзе разработал в 1838 г., т.е. задолго до исследований относительной частоты появления различных букв в текстах. Однако им был правильно выбран принцип кодирования - буквы, которые встречаются чаще, должны иметь более короткие коды, чтобы сократить общее время передачи. Относительные частоты букв английского алфавита он оценил простым подсчетом литер в ячейках типографской наборной машины. Поэтому самая распространенная английская буква «Е» получила код «точка». При составлении кодов Морзе для букв русского алфавита учёт относительной частоты букв не производился, что, естественно, повысило его избыточность. Как и в рассмотренных ранее вариантах кодирования, произведем оценку избыточности. По-прежнему для удобства сопоставления данные представим в приведенном ниже формате. Признак конца буквы («0») в их кодах не отображается, но учтён в величине k - длине кода буквы i.
Среднее значение длины кода К^3) = 3,361. Полагая появление знаков вторичного алфавита равновероятным, получаем среднюю информацию на знак равной /2) = log23 = 1,585 бит. Так как для русского алфавита I1(1)= 4,356 бит, то:
Q(r) = 1 - 4,356/(3,361 - 1,585)» 0,182 т.е. избыточность составляет около 18% (для английского языка »15%). Тем не менее, код Морзе имел в недалеком прошлом весьма широкое распространение в ситуациях, когда источником и приемником сигналов являлся человек (не техническое устройство) и на первый план выдвигалась не экономичность кода, а удобство его восприятия человеком.
Букв? |
К^Д |
Pi-10* |
к |
Буква |
|
Pi |
hi |
пробел |
GQ |
174 |
2 |
я |
|
16 |
5 |
о |
|
90 |
4 |
ы |
|
16 |
|
е |
г |
72 |
2 |
f |
в- г |
1C |
4 |
Й |
■ м |
62 |
3 |
ь.ъ- |
м- ■ ■ м- |
14 |
5 |
И |
- - |
62 |
~T |
& |
_... |
14 |
5 |
Г |
- |
53 |
_ |
г |
|
15 |
4 |
н |
-■ |
|
s |
ч |
|
12 |
5 |
С |
в >ь ь |
ds |
Л |
ft |
■ М MS м |
10 |
5 |
р |
|
40 |
4 |
х |
.... |
Э |
5 |
в |
|
33 |
4 |
ж |
гг, — |
T |
L- |
л |
■ Н* 1 ■ |
35 |
fr |
ю- |
■ 1 ^ВН~ |
a |
s |
к |
- - |
23 |
d |
ш |
|
в |
5 |
и |
— |
26 |
2 |
If |
-. — - |
4 |
5 |
А |
— |
23 |
4 |
щ |
н ж - м |
3 |
3 |
п |
■ |
23 |
A |
* |
■ ih ta III |
3 |
6 |
У |
— |
21 |
4 |
ф |
|
2 |
s” |