Общие понятия и определения. Кодирование.
Oбщие принципы кодирования информации справедливы как для систем связи (передача информации в пространстве), так и для систем хранения информации (передача информации во времени). В системах хранения информации линией связи считается среда, в которой хранится информация.
Кодирование можно трактовать в узком и широком смысле. Под кодированием в широком смысле подразумевается представление сообщений в форме, удобной для передачи по данному каналу связи. Обратная операция - операция восстановления сообщения по принятому сигналу называется декодированием.
Рассмотрим структурную схему системы передачи информации.
Рис. 2.1 - Общая структурная схема системы передачи информации:
ИИ - источник информации; ЛС - линия связи; КИ - кодер источника; ИП - источник помех; КК - кодер канала; ДМ - демодулятор; М - модулятор; ДИ - декодер источника; ДК - декодер канала; П - получатель информации
Сообщению z на выходе источника информации (ИИ) необходимо поставить в соответствие определенный сигнал. Поскольку число возможных сообщений при увеличении времени стремится к бесконечности, то ясно, что создать для каждого сообщения свой сигнал невозможно. Но с учетом того, что дискретные сообщения складываются из букв, а непрерывные сообщения также можно представить последовательностью цифр в момент отсчета (дискретизации), то можно обойтись конечным числом образцовых сигналов, соответствующих отдельным буквам алфавита источника.
Передача информации. Информационные каналы
Информация передается в виде сообщений от некоторого источника информации к ее приемнику посредством канала связи между ними. Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал. Этот сигнал посылается по каналу связи. В результате в приемнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением. Передача информации по каналам связи часто сопровождается воздействием помех, вызывающих искажение и потерю информации.
Любое событие или явление может быть выражено по-разному, разными способами, разным алфавитом. Чтобы информацию более точно и экономно передать по каналам связи, ее надо соответственно закодировать.
Информация не может существовать без материального носителя, без передачи энергии. Закодированное сообщение приобретает вид сигналов-носителей информации, которые идут по каналу. Выйдя на приемник, сигналы должны обрести вновь общепонятный вид с помощью декодирующего устройства.
Совокупность устройств, предметов или объектов, предназначенных для передачи информации от одного из них, именуемого источником, к другому, именуемому приемником, называется каналом информации, или информационным каналом.
Примером канала может служить почта. Информация, закодированная в виде текста, помещается в конверт, поступает в почтовый ящик, извлекается оттуда и перевозится в почтовое отделение, где сортируется (вручную или машиной). Далее информация перемещается с помощью поезда (самолета, теплохода и т.п.) в почтовое отделение пункта назначения, сортируется и доставляется адресату. Таким образом, почтовый канал включает в себя: конверт (предмет), транспорт и сортировочные машины (устройства), почтовых работников (объекты). Информация, помещенная в этот канал, остается неизменной.
Другим примером может служить телефон. При телефонной передаче источник сообщения – говорящий. Кодирующее устройство, изменяющее звуки слов в электрические импульсы, – микрофон. Канал, по которому передается информация, – телефонный провод. Часть трубки, которую мы подносим к уху, выполняет роль декодирующего устройства (электрические сигналы снова преобразуются в звуки). Информация поступает в “принимающее устройство” – ухо человека на другом конце провода. Канал включает в себя телефонные аппараты (устройства), провода (предметы) и аппаратуру АТС (устройства). Особенностью этого информационного канала является то обстоятельство, что при поступлении в него информация, представленная в виде звуковых волн, преобразуется в электрические колебания и затем передается. Такой канал называется каналом с преобразованием информации.
Еще один пример – компьютер. Отдельные его системы передают одна другой информацию с помощью сигналов. Компьютер – устройство для обработки информации (как станок – устройство для обработки металла), он не создает из “ничего” информацию, а преобразует то, что в него введено. Компьютер является информационным каналом с преобразованием информации: информация поступает с внешних устройств (клавиатура, диск, микрофон), преобразуется во внутренний код и обрабатывается, преобразуется в вид, пригодный для восприятия внешним выходным устройством (монитором, печатающим устройством, динамиками и др.), и передается на них.
Живой нерв канал связи совершенно другой природы. Здесь все сообщения передаются нервным импульсом. Но в технических каналах связи направление передачи информации может меняться, а по нервной системе передача идет в одном направлении.
Характеристики информационного канала
Информационные каналы различаются по своей пропускной способности.
Пропускная способность – это количество информации, передаваемое каналом в единицу времени. Измеряется пропускная способность в бит/с. В честь изобретателя телеграфа этой единице было дано имя Бод:
1 Бод = 1 бит/с.
Пропускная способность информационного канала определяется двумя параметрами: разрядностью и частотой. Она пропорциональна их произведению.
Разрядностью называют максимальное количество информации, которое может быть одновременно помещено в канал.
Частота показывает, сколько раз информация может быть помещена в канал в течение единицы времени.
Разрядность почтового канала огромна. Так, пересылая по почте, например, лазерный диск, можно поместить одновременно в канал более 600 Мб информации. В то же время частота почтового канала очень низкая – выемка почты из ящиков происходит не чаще пяти раз в сутки.
Телефонный канал информации однобитный: одновременно по телефонному проводу можно послать или единицу (ток, импульс), или ноль. Частота этого канала может достигать десятки и сотни тысяч циклов в секунду. Это свойство телефонной сети позволяет использовать ее для связи между компьютерами.
Абстрактный алфавит
Информация передается в виде сообщений. Дискретная информация записывается с помощью некоторого конечного набора знаков, которые будем называть буквами, не вкладывая в это слово привычного ограниченного значения (типа “русские буквы” или “латинские буквы”). Буква в данном расширенном понимании – любой из знаков, которые некоторым соглашением установлены для общения. Например, при привычной передаче сообщений на русском языке такими знаками будут русские буквы – прописные и строчные, знаки препинания, пробел; если в тексте есть числа – то и цифры. Вообще, буквой будем называть элемент некоторого конечного множества (набора) отличных друг от друга знаков. Множество знаков, в котором определен их порядок, назовем алфавитом (общеизвестен порядок знаков в русском алфавите: А, Б,..., Я).
Рассмотрим некоторые примеры алфавитов.
1, Алфавит прописных русских букв:
А Б В Г Д Е Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
2. Алфавит Морзе:
3. Алфавит клавиатурных символов ПЭВМ IBM (русифицированная клавиатура):
4. Алфавит знаков правильной шестигранной игральной кости:
5. Алфавит арабских цифр:
0123456789
6. Алфавит шестнадцатиричных цифр:
0 1 2 3 4 5 6 7 8 9 A B C D E F
Этот пример, в частности, показывает, что знаки одного алфавита могут образовываться из знаков других алфавитов.
7. Алфавит двоичных цифр:
0 1
Алфавит 7 является одним из примеров, так называемых, “двоичных” алфавитов, т.е. алфавитов, состоящих из двух знаков. Другими примерами являются двоичные алфавиты 8 и 9:
8. Двоичный алфавит “точка, “тире”:. _
9. Двоичный алфавит “плюс”, “минус”: + -
10. Алфавит прописных латинских букв:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
11. Алфавит римской системы счисления:
I V Х L С D М
12. Алфавит языка блок-схем изображения алгоритмов:
Код, кодовая комбинация (КК), кодовое слово – число или совокупность физических величин (элементов), отображающее передаваемое сообщение.
Основание кода (m) – число используемых при кодировании различных цифр (букв), равное основанию системы счисления.
Длина КК, значность кода, (n) – число цифр (элементов), отображающих длину слова или числа.
Число различных слов в КК:
Двоичная система счисления.
m=2, N=.
Комбинацией из 5 «0» или «1» можно передать любую букву славянского алфавита.
Количество информации определяется вероятностью появления символов «1» и «0».
Если (полная группа событий), то в соответствии с формулой К. Шеннона, максимальное количество информации:
бит.
Для КК(n=5): бит
Для десятичной системы счисления: бит, значит 1 элемент десятичной системы несет минимум 3 бита информации.
Старт- стопное кодирование
Таблица 1
М |
А |
7 |
24 |
00111 |
11000 |
Для передачи сообщения необходима цикловая и тактовая синхронизация: цикловая отделяет одну КК от другой, тактовая отделяет элементы. Тактовая синхронизация обеспечивается за счет высокостабильных кварцевых генераторов.
«Старт» – бестоковая посылка длительностью .
«Стоп» – токовая посылка длительностью 1,5.
Минимальное кодовое расстояние старт-стопного кода – =1
Рис. 1
Телеграфное сообщение, отображающее слог «МА» (рис. 2.2).
Рис. 2
По закону Ома Ом.
Длина линии: м, где - удельное сопротивление медной проволоки, Ом/м.
Таким образом, максимальная дальность телетайпа при наличии медного кабеля может быть 1000 м.
Время, в течение которого передается КК, состоящая из 15 элементов длительностью 1/50с каждый:
.
Синхронное избыточное кодирование
Пример.
Синхронный код (6, 5), где
n=6 – длина кодовой комбинации,
k=5 – количество информационных символов,
r = n-k= 6-5=1 – количество проверочных символов.
– минимальное кодовое расстояние, =2.
Таблица .2
М |
А |
00111(1) |
11000 (0) |
Проверочный символ получается в итоге суммирования по модулю 2.
Необходима цикловая и тактовая синхронизация. Обеспечение цикловой синхронизации – обрамление флагами (01111110), тактовой – применение опорных кварцевых генераторов.
Рис. 3
Начальный и заключительный флаги должны отличаться от информационных слов. Поэтому во всех словах текста, совпадающих по структуре с флагами, искусственно добавляется еще один бит «0» после появления пяти единиц подряд. Операция введения добавочного бита называется бит-стаффингом. На приемной стороне, когда после пяти 1 обнаруживается дополнительный 0, он автоматически удаляется из поля данных кадра, для чего в преамбуле вводится дополнительная информация о количестве бит в адресе и тексте.
Обнаруживающая и исправляющая способность кода
Теоремы Клода Шеннона: если декодер построен по принципу обнаружения ошибок, он обнаружит ошибки кратностью .
Если декодер построен по принципу исправления ошибок, он исправит любые ошибки кратностью (при четном ) и (при нечетном ).
Таблица 3
КК |
n |
k |
r |
|
5, 5 |
5 |
5 |
0 |
1 |
6, 5 |
6 |
5 |
1 |
2 |
7, 4 |
7 |
4 |
3 |
4 |
15, 10 |
15 |
10 |
5 |
6 |
В авиационной цифровой электросвязи на приемной стороне ставится декодер (код 7, 4), исправляющий ошибки.
На каналах «борт-Земля» любые сообщения повторяются 6 раз. Поэтому в авиационных каналах «борт-Земля» сначала ставится устройство FEC (forward error correction - прямое исправление ошибок), а потом устройство ARQ (Automatic Repeat Request - автоматический перезапрос повторения поврежденных блоков): принятое сообщение сравнивается с записанными в память, а в случае повреждения перезапрашивается.