Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Garbage / Информатика / 2.1.1 - Дискретные сообщения

.pdf
Скачиваний:
41
Добавлен:
21.05.2015
Размер:
352.56 Кб
Скачать

1. Дискретные сообщения

Сигнал называется дискретным, если параметр сигнала может принимать лишь конечное число значений, и существен лишь в конечном числе моментов времени (возможно, периодически повторяющихся).

Дискретными сообщениями называются такие сообщения, которые могут быть переданы с помощью дискретных сигналов.

1.1. Знаки, наборы знаков, алфавиты

Языковые сообщения в письменной форме строят обычно, записывая знаки письма (графемы) друг за другом. Хотя длинные сообщения могут размещаться на многих строчках и страницах, это разбиение не имеет, вообще говоря, никакого значения; оно не несёт важной информации. По существу такие сообщения являются последовательностями знаков. Это оказывается справедливым и для устных языковых сообщений, если разложить устный текст на элементарные составные части, так называемые фонемы, и под знаками понимать фонемы.

Точка зрения, что сообщение есть последовательность знаков, не ограничивается, разумеется, тем случаем, когда знаки - это фонемы или графемы (например, знаки букв и цифр, знаки препинания). Знаки планет или знаки зодиака и даже кивок и покачивание головой также могут пониматься как знаки. Поэтому мы определим понятие знака существенно шире.

Знак - это элемент некоторого конечного множества отличимых друг от друга „вещей", набора знаков.

Набор знаков, в котором определён (линейный) порядок знаков, называется

алфавитом.

Вот некоторые примеры алфавитов (порядок в них — это порядок перечисления):

а) алфавит десятичных цифр

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. b) алфавит заглавных латинских букв

{A,B,C,D,E,F,G,H,I,J,K,L,M,N,0,P,Q,R,S, T,U,V,W,X,Y,Z};

с) алфавит заглавных кириллических букв

{А,Б,В,Г,Д,Е,Ж,З.И,Й,К,Л,М,Н,0,П,Р,С,Т, У,Ф,Х,Ц,Ч,Ш,Щ,Ъ,Ы,Ь,Э,Ю,Я}; d) алфавит японской катаканы

e) алфавит международного кода семафорной сигнализации

ж) набор знаков азбуки Морзе

1.2. Коды и кодирования

Если N - предложение некоторого естественного языка, то N можно рассматривать как последовательность знаков, по крайней мере, тремя разными способами.

Прежде всего, N представляет собой последовательность букв, цифр, знаков препинания и т. д.; далее, N — это последовательность слов, которые в другом контексте могут сами рассматриваться как знаки; наконец, и всё предложение целиком можно рассматривать как один знак.

Первое понимание используется, например, когда имеется правило для кодирования сообщения N в текстовом файле; второе понимание лежит в основе стенографических сокращений; крайнее третье понимание бывает уместным при переводе на другой естественный язык, когда пословица одного языка переводится соответствующей по смыслу пословицей другого языка.

Дискретные сообщения представляют собой (конечные или бесконечные) последовательности знаков. При этом, исходя из соображений, связанных с физиологией органов чувств, или из чисто технических соображений, их обычно разбивают на конечные последовательности знаков, называемые словами.

На более высоком уровне каждое слово можно снова рассматривать как знак, при этом соответствующий набор знаков будет, вообще говоря, шире первоначального. Обратно, данный набор знаков можно получить с помощью составления слов, исходя из некоторого набора с меньшим числом знаков, в частности из двоичного набора знаков. Некоторые из перечисленных выше наборов получены с помощью словообразования „над" конкретными двоичными наборами знаков или, абстрактно, над набором {1, 0}.

Слова над двоичным набором знаков называются двоичными словами. Они не обязаны иметь постоянную длину (см. азбуку Морзе), если это всё же так, то говорят об n-разрядных двоичных знаках и n-разрядных двоичных кодах.

Дадим теперь точное определение:

Кодом называется правило, описывающее отображение одного набора знаков в другой набор знаков (или слов); также называют и множество образов при этом отображении.

Помимо основного значения слова „code" - «кодекс», «свод законов» (гражданский кодекс, кодекс Наполеона) - начиная с середины 19-го в. оно означало книгу, в которой словам естественного языка сопоставлены группы цифр или букв. Употребление таких кодов приобрело значение скорее в связи со стремлением сэкономить на стоимости телеграмм, чем в связи с соображениями конспиративности (АВС-код В. Клаузен-Туэ, 1874).

Если каждый образ при кодировании является отдельным знаком, то такое отображение мы называем шифровкой, а образы - шифрами (англ. cipher). Поскольку здесь имеется криптографический аспект, обращение этого отображения — когда оно однозначно — называется декодированием или

дешифровкой.

Использование кодов для шифрования сообщений означает замену некоторых или всех слов и фраз кодовыми словами, полученными из специальной книги, напоминающей словарь; на самом деле слово код относится только к такой

криптосистеме, хотя термины секретный код и взлом кода используются во всех разновидностях тайнописи. Иначе говоря, код должен имеет возможность установить семантическое содержание любого сообщения, которое можно передать по каналу, и как отправитель, так и получатель должны иметь кодовую книгу. При условии, что кодовая книга надежно защищена, такое сообщение чрезвычайно трудно (если вообще возможно) взломать. Однако передача сообщения невозможна, если фраза не включена в кодовую книгу. Напротив, при использовании шифра возможна передача произвольных сообщений, потому что шифр – это алгоритм, присваивающий новые символы шифрованного текста символам или группам символов открытого текста.

В коммерческих и криптографических кодах слова, фразы и понятия естественных языков кодируются в большинстве случаев словами над некоторым буквенным или цифровым алфавитом, обычно пятерками. В технических кодах буквы, цифры и другие знаки почти всегда кодируются двоичными словами.