- •Предисловие
- •Введение
- •1. ИНФОРМАЦИЯ И ИНФОРМАЦИОННЫЕ СИСТЕМЫ
- •1.1. Основные понятия и концепции теории информации
- •1.2. Основные направления в современной теории информации
- •1.4. Информационные системы
- •1.5. Критерии оценки качества информационных систем
- •2. СИСТЕМЫ СВЯЗИ И ИХ ОСНОВНЫЕ ХАРАКТЕРИСТИКИ
- •2.1. Основные понятия и определения
- •2.2. Системы связи
- •2.3. Основные показатели качества функционирования системы связи
- •3. МАТЕМАТИЧЕСКИЕ МОДЕЛИ СИГНАЛОВ И ПОМЕХ
- •4. ДИСКРЕТИЗАЦИЯ И КВАНТОВАНИЕ НЕПРЕРЫВНЫХ СООБЩЕНИЙ
- •4.1. Способы квантования сигналов
- •4.2. Общая постановка задачи дискретизации
- •4.3. Способы восстановления непрерывного сигнала
- •4.6. Равномерная дискретизация. Теорема Котельникова
- •4.7. Адаптивная дискретизация
- •4.8. Квантование сигналов по уровню
- •5. ЭНТРОПИЯ, КОЛИЧЕСТВО ИНФОРМАЦИИ
- •5.3. Энтропия непрерывного источника информации (дифференциальная энтропия)
- •5.4. Фундаментальное свойство энтропии дискретных эргодических процессов
- •5.6. Статистическая мера количества информации
- •6.1. Основные определения
- •6.3. Связь между энтропией и числом различных последовательностей сообщений
- •6.4. Кодирование дискретных источников
- •7. ДИСКРЕТНЫЕ КАНАЛЫ БЕЗ ШУМОВ
- •7.2. Пропускная способность канала связи
- •7.4. Кодирование как средство криптографического закрытия информации
- •9. ИНФОРМАЦИОННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМ, РАБОТАЮЩИХ С НЕПРЕРЫВНЫМИ СИГНАЛАМИ
- •9.1. Непрерывные ансамбли и источники
- •dxdy,
- •Эпсилон-энтропия
- •Эпсилон-энтропия гауссовского источника без памяти
- •10. ЭФФЕКТИВНОСТЬ ИНФОРМАЦИОННЫХ СИСТЕМ
- •10.1. Критерии оценки эффективности информационных систем
- •10.2. Способы повышения эффективности информационных систем
- •11.3. Способы повышения помехоустойчивости информационных систем
- •СПИСОК ЛИТЕРАТУРЫ
- •ОГЛАВЛЕНИЕ
- •Пахомов Герман Ильич
7.ДИСКРЕТНЫЕ КАНАЛЫ БЕЗ ШУМОВ
7.1.Модель информационной системы передачи дискретных
сообщений в отсутствие шумов
Основной функцией информационных систем является хранение ин формации и перенос се в пространстве. В системах передачи сообщений канал связи, представляемый в самом общем виде, включает любую со вокупность технических средств. Поэтому наряду с физической средой, предназначенной для распространения электромагнитных колебаний и называемой линией связи, к блокам канала связи относят (см. рис. 2.1) ко деры, модуляторы, антенные устройства передатчика и приемника и т.д.
В зависимости от конкретного набора блоков системы и соответс твенно формы и характеристик входных и выходных сигналов канала пе редачи возникает необходимость в введении специальной классификации каналов.
Абстрагируясь от конкретной физической природы сигналов и шумов на входе и выходе различных блоков канала, введем следующие опреде ления:
1.Канал называется дискретным по входу (по выходу), если множес тво входных (выходных) сигналов является счетным.
2.Канал называется непрерывным по входу (по выходу), если множес тво входных (выходных) сигналов является несчетным.
3.Канал называется дискретным по входу и непрерывным по выходу,
если множество входных сигналов конечно, а множество выходных сигна лов несчетно. Такие каналы называют еще полунепрерывными.
4.Канал носит название канала с дискретным временем, если сигна лы на его входе и выходе представляют собой конечные или бесконечные последовательности из элементов некоторых ансамблей.
4а. Дискретный по входу и выходу канал с дискретным временем на зывается дискретным каналом.
5.Канал называется каналам с непрерывным временем, если сигналы на его входе и выходе являются непрерывными функциями времени.
5а. Непрерывный по входу и выходу канал с непрерывным временем называют непрерывным каналом.
Канал считается заданным, если известны статистические данные о сообщениях на его входе и выходе и ограничения, накладываемые на
входные сообщения физическими характеристиками канала. Канал пря мой передачи (от источника сообщений к их получателю), дополненный обратным каналом, например, для запроса повторной передачи в случае обнаружения ошибки, называют каналом с обратной связью.
Будучи не полной, представленная классификация является доста точной для последующею изложения материала. В данном разделе рас сматриваются толыю дискретные каналы (к числу которых, в частности, относятся кодеры и декодеры).
Если в дискретном канале отсутствуют шумы, то, как бы ни кодирова лись сигналы, потерь информации не будет. Однако в большинстве случаев информацию нужно представлять не только безошибочно, но и экономно. То есть информация, получаемая от источника сообщений, должна быть передана потребителю наиболее рациональным способом.
Упрощенная блок-схема дискретного канала связи без шумов приве дена на рис. 7.1.
На вход такого канала подаются дискретные сообщения (х). Для пе редачи на расстояние воздействия любого источника сообщения, как правило, преобразуются в первичные электрические сигналы. Поэтому в дальнейшем будем считать, что сообщения (х) поступают в форме элект рических сигналов. Последние с помощью кодирующего устройства пре образуются в кодированные сигналы у.
И сточник |
Кодер |
Л иния связи |
Декодер |
Получатель |
X |
|
У |
Z |
W |
Рис. 7.1. Блок-схема дискретного канала связи без шумов
Назначение кодирующего устройства (кодера) состоит в том, чтобы представить выходное сообщение источника в некоторой стандартной форме, например в виде последовательности двоичных сигналов. Основ ная задача кодирования заключается в том, чтобы стандартное представ ление было наиболее экономным, т.е. требовало в среднем наименьшего возможного числа двоичных сигналов.
Для кодирования используется некоторый алфавит элементарных сигналов (символов) - У у 2, Ут , а существо кодирования сводится к представлению отдельных сообщений (х.) некоторыми определенными комбинациями символов используемого алфавита.
Кодированные сигналы передаются по каналу связи и на его прием ном конце восстанавливаются в точно такой же или в иной форме (z). Де
кодирующее устройство преобразует кодированные сигналы (z) в сообще ния (w) в форме, наиболее удобной для данного получателя.
С информационной точки зрения физическая реализация (форма или вид модуляции) кодированных сигналов на передающей (у) и на приемной
(z) сторонах, а также выходных сигналов (>v) значения не имеет. Важным является лишь установление определенного соответствия между у и JC, между z и у и, наконец, между w и z.
Не нарушая общности рассуждений, при отсутствии шумов (помех) можно принять z = у. Способ кодирования должен быть таким, чтобы в случае отсутствия шумов на приемной стороне по полученным кодиро ванным сигналам можно было однозначно восстановить вид переданных сообщений, т. е. чтобы w - х. Это накладывает некоторые ограничения на допустимые комбинации символов кода. Так, например, если мы закоди руем символы х, —►1, х, —* 2 и х3 —* 01, то при получении сигнала 01 на приемной стороне мы не будем знать, что было передано: сообщение х3 или два сообщения х ^ . Следовательно, необходимо либо отказаться от такого способа кодирования, либо заранее условиться, что комбинацию хут, передавать нельзя (она запрещена). На возможную последователь ность символов кода могут накладываться и другие ограничения.
Совокупность запретов, обусловленных принятым способом кодиро вания и построением аппаратуры, будем относить к фиксированным огра ничениям, накладываемым на информационный канал.
7.2. Пропускная способность канала связи
Введем определение пропускной способности канала связи в предпо ложении, что сообщения источника и шумы, действующие в линии связи, носят эргодический характер.
Обозначив через Хт последовательность сообщений, создаваемых источником за время Т, а через WTсоответствующую ей последователь ность принятых сообщений, определим количество информации I(Wp Хг), содержащееся в последовательности сообщений WTна выходе канала о последовательности Хтна его входе. /(ЖрА^) зависит от вероятностных характеристик источника сообщений и характеристик шумов, действую щих в линии связи, метода кодирования сообщений, а также промежутка времени Т.
Предел |
|
|
I(W ,X ) = П т Ш |
п Ы (бит/с) |
(7.1) |
Г -**> |
J |
|
определяет среднее количество информации, получаемое на выходе кана ла за единицу времени, и называется скоростью передачи информации.
При одном и том же способе кодирования длительность символов пе редаваемых сигналов может быть различной и зависит от вида модуляции и ширины полосы пропускания канала связи. С изменением длительности символов меняется и скорость передачи информации.
Положим, что нам известна некоторая совокупность фиксирован ных ограничений, накладываемых на информационный канал. К фик сированным ограничениям будем относить: параметры канала связи и, в частности, длительность передаваемых символов сигнала, использу емый код, методы декодирования сигналов и накладываемые в связи с этим запреты и т.п.
Максимальную скорость передачи информации назовем пропускной способностью канала связи С:
C = Sup(/(W',Ar) l — .
а,<=4 ( J С ( 7 2 )
В данном равенстве обозначение Sup указывает, что вычисляется верх няя грань, а запись а е В говорит о том, что параметр а. удовлетворяет за данному фиксированному ограничению, т.е. лежит в некоторой области В, При вычислении максимума скорости передачи могут предста
виться следующие случаи:
1.Канал связи определен полностью: заданы способы кодирова ния и декодирования сообщений, длительности передаваемых сиг налов, полоса канала связи и вероятностные характеристики помех; тогда максимальная скорость передачи информации отыскивается по статистическим характеристикам источника сообщений, т.е. разыски вают такое распределение вероятностей по сообщениям х, при кото ром скорость передачи информации наибольшая.
2.Статистические показатели источника сообщений заданы; в этом случае способы модуляции, кодирования и декодирования выбираются так, чтобы скорость передачи информации была максимальной.
3.Канал связи полностью не определен - имеется возможность изме нять те иди иные его параметры: длительности символов, способ кодиро вания и т.п.; в этом случае параметры канала, которые не заданы, выбирают
из условия получения возможно большей скорости передачи информации, а максимум в (7.2) снова отыскивают по статистическим характеристикам источника сообщений.
Пропускная способность есть хараюперистика канала и не зависит от фактической скорости передачи информации от данного источника.
Пропускная способность линии связи определяется так:
Сс = m ax I(Z,Y) (бит/с), |
(7.3) |
ще |
|
/(Z,r) = Um-n Z TJ T) |
(7.3’) |
Т->'« 'J' |
|
При этом ZTи YT- сигналы длительностью Т соответственно на выходе и входе канала связи.
Так как весь информационный канал связи не может пропускать ин формацию со скоростью большей, чем его часть, то всегда Сс > С.
При отсутствии шумов wT- x p zT=yr На основании свойств количес тва информации
WT,XT) = f(XT,XT) = Я(ХТ),
I(Zr,YT) = I(YT,YT) = H(YT).
Подставив последние выражения в (7.2) и (7.3), получим
- |
.. Н (Х Т) |
(7.4) |
|
С = шах lim — ~ - ^ 3 |
|||
|
г-»» |
Т |
|
Сс - |
max lim |
Т |
(7.5) |
С |
Г-»ш |
|
Обозначим через ЩТ) число всех возможных последовательнос тей сообщений, вырабатываемых источником, длительностью Т. Энт ропия Н(ХТ) максимальна, если все эти последовательности равнове роятны. Это максимальное значение равно log ЩТ), и выражения (7.4) и (7.5) можно переписать в виде
С - П т 108"<Г>, |
(7.6) |
|
•/•->«> |
т |
|
Сс = |
|
(7.7) |
С Г->со 7
где Nk(T) - число всех возможных кодированных последовательностей длительностью Т.
Соотношения (7.6) и (7.7) обычно используют в качестве определения пропускной способности дискретного канала без шумов.
Найдем пропускную способность некоторых дискретных каналов. Пример 1. Пусть для передачи сообщений используется код с основа
нием а (т.е. с а различными символами), длительность всех символов кода одинакова и равна т. Другие фиксированные ограничения отсутствуют.
Для вычисления Сс рассмотрим последовательность из М символов. Длительность такой последовательности Т = Мх. При Т —>со число сим волов в одной последовательности М —* оо. Очевидно, что всего можно образовать 0мпоследовательностей длиной в М символов, следовательно, Nc (Mi) = d 1и из (7.7) получим
lim log а** М—>оо Мх
или
Сс = - log а. |
(7.8) |
X
Нужно отметить, что если рассматривать выход кодирующего устройства как источник сообщений, то logo есть энтропия этого источника, т.е. logo = Н(У), у которого коррелятивные связи между символами отсутствуют и вероятности передачи различных сим волов одинаковы. Отсюда следует и весьма важное обратное ут верждение: для того чтобы в рассматриваемом канале скорость передачи была максимальной, необходимо, чтобы вероятности передачи различных символов были одинаковыми.
При использовании двоичного кода а = 2 из (7.8) получаем, чго
СГ —— дв.ед./с. |
|
(7.9) |
т |
1 |
= V , где V называют |
Для дискретных каналов принято обозначать - |
скоростью передачи, которая выражается в бодах, если т измеряется в се кундах. Таким образом, Сс = V, т.е. пропускная способность двоичного канала Л, выражаемая в двоичных единицах в секунду, равна скорости пе редачи в бодах.
Пример 2. В условиях предыдущей задачи нужно определить пропус кную способность линии связи, если на допустимый вид кодовых после довательностей накладываются некоторые ограничения.
При вычислении С будем рассматривать кодирующее устройство как источник информации и используем результаты гп. 6.
Рассмотрим сигнал ^длительностью Т= Aft. Энтропия этого сиг нала
H(YT) = MH(Y),
ще H(Y) - энтропия источника, вычисляемая с учетом наложенных фикси рованных запретов.
Очевидно, что скорость передачи информации в таком канале (7.10а)
а пропускная способность |
Т |
т |
’ |
|
|
|
|
^ |
_ Н ( Х ) ~ |
(7.106) |
|
Ч |
---------------- •> |
||
|
|
т |
|
ще H(Y)шах - максимально возможное значение энтропии кодированного сигнала с учетом наложенных запретов.
73. Кодирование как процесс выражения информации в цифровом виде
Любому дискретному сообщению или знаку сообщения можно при писать какой-либо порядковый номер. Измерение аналоговой величины, выражающееся в сравнении ее с образцовыми мерами, также приводит к числовому представлению информации. Передача или хранение сооб щений при этом сводится к передаче или хранению чисел. Числа можно выразить в какой-либо системе счисления. Таким образом, будет получен один из кодов, основанный на данной системе счисления.
Сравним системы счисления и построенные на их основе коды с позиций применения в системах передачи, хранения и преобразования информации.
Общепризнанным в настоящее время является позиционный при нцип образования системы счисления. Значение каждого символа (цифры) зависит от его положения - позиции в ряду символов, пред ставляющих число.
Единица каждого следующего разряда больше единицы предыдущего разряда в т раз, щ е /и—основание системы счисления. Полное число полу чаем, суммируя значения по разрядам:
Q = ^ а!т‘ 1 - а1т' ' + а1-\т> 2 + "• + а2т' + а'т°,
;=1
где i - номер разряда данного числа; / - количество разрядов; - множитель, принимающий любые целочисленные значения в пределах от 0 до т - 1 и показывающий, сколько единиц /-го разряда содержится в числе.
Чем больше основание системы счисления, тем меньшее число разря дов требуется для представления данного числа, а следовательно, и мень шее время для его передачи.
Однако с ростом основания существенно повышаются требования к линии связи и аппаратуре создания и распознавания элементарных сиг налов, соответствующих различным символам. Логические элементы вычислительных устройств в этом случае должны иметь большее число устойчивых состояний.
Учитывая оба обстоятельства, целесообразно выбрать систему, обес печивающую минимум произведения количества различных символов т на количество разрядов / для выражения любого числа. Этот минимум найден при воспроизведении определенного достаточно большого числа Q(Q~ 60000). Определено, что наиболее эффективной системой является троичная []. Незначительно уступают ей двоичная и четверичная. Систе мы с основанием 10 и более существенно менее эффективны. Сравнивая эти системы с точки зрения удобства физической реализации соответству ющих им логических элементов и простоты выполнения в них арифме тических и логических действий, предпочтение необходимо отдать дво ичной системе. Действительно, логические элементы, соответствующие этой системе, должны иметь всего два устойчивых состояния. Задача раз личения сигналов сводится в этом случае к задаче обнаружения (есть им пульс или нет импульса), что значительно проще.
Арифметические и логические действия также наиболее просто осу ществляются в двоичной системе. В таблицы сложения, вычитания и ум ножения входит всего по четыре равенства (табл. 1).
|
|
Таблица 1 |
Правила сложения |
Правила вычитания |
Правила умножения: |
0 + 0 = 0 |
0 - 0 = 0 |
0 0 = 0 |
0 + 1=1 |
1 - 0=1 |
0 - 1=0 |
1 + 0 = 1 |
1 - 1 = 0 |
1 -J 0 = 0 |
1 + 1 = 10 |
10- 1 = 1 |
1 1 = 1 |
Наиболее распространенная при кодировании и декодировании логи ческая операция - сложение по модулю. В двоичной системе она также наиболее проста и определяется равенствами:
Алгоритм перевода из двоичной в привычную для человека десяти чную систему несложен. Пересчет начинается со старшего разряда. Если в следующем разделе стоит 0, то цифра предыдущего (высшего) разряда удваивается. Если же в следующем разряде единица, то после удвоения предыдущего разряда результат увеличивается на единицу.
О <8>0 = 0 |
1 <8> 1=0 |
О ® 1 = 1 |
1 <8>0= 1 |
Итак, для передачи и проведения логических и арифметических опе раций наиболее целесообразен двоичный код. Однако он неудобен при вводе и выводе информации, так как трудно оперировать с непривычными двоичными числами. Кроме того, запись таких чисел на бумаге оказывает ся слишком громоздкой. Поэтому, помимо двоичной получили распростра нение системы, которые, с одной стороны, легко сводятся как к двоичной, так и к десятичной системе, а с другой стороны, дают более компактную запись. К таким системам относятся восьмеричная, шестнадцатеричная и двоично-десятичная. В восьмеричной системе для записи всех возможных чисел используется восемь цифр от 0 до 7 включительно. Перевод чисел из восьмеричной системы в двоичную крайне прост и сводится к замене каждой восьмеричной цифры равным ей трехразрядным числом. Напри мер, для восьмеричного числа 754 получаем:
7 |
4 |
5 |
111 |
100 |
101 |
Поскольку в восьмеричной системе числа выражаются короче, чем в двоичной, она широко используется как вспомогательная система при программировании.
Чтобы сохранить преимущества двоичной системы и удобство десятичной системы, используют двоично-десятичные коды. В таком коде каждую цифру десятичного числа записывают в виде четырех разрядного двоичного числа (тетрады). С помощью четырех разрядов можно образовать 16 различных комбинаций, из которых любые 10 могут составить двоично-десятичный код. Наиболее целесообразным является код 8 -4-2-1 (табл. 7.2). Этот код относится к числу взвешен ных кодов. Цифры в названии кода означают вес единиц в соответству
ющих двоичных разрядах. Двоично-десятичный код обычно исполь зуется как промежуточный при введении в вычислительную машину данных, представленных в десятично|М коде.
В табл. 7.2 представлены два других двоично-десятичных кода с ве сами 5-1-2—1 и 2-4—2-1, которые широко используются при поразрядном уравновешивании в цифровых измерительных приборах.
|
|
|
|
|
Таблица 7.2 |
||
Число в |
Двоично-десятич Двоично-десятич |
Двоично- |
|||||
де^ятич- |
|||||||
|
|
|
|
|
|||
Десятичном |
ный код с весами |
ный код с весами |
ныи код с |
||||
весами |
|||||||
Коде |
8-4-2-1 |
5-1-2-1 |
|||||
2-4—2-1 |
|||||||
0 |
0000 0000 |
0000 0000 |
0000 0000 |
||||
1 |
0000 0001 |
0000 0001 |
0000 0001 |
||||
2 |
0000 0010 |
0000 0010 |
0000 0010 |
||||
3 |
0000 ООП |
0000 ООП |
0000 ООП |
||||
4 |
0000 0100 |
0000 0111 |
0000 0100 |
||||
5 |
0000 0101 |
0000 1000 |
0000 |
1011 |
|||
6 |
0000 оно |
0000 1001 |
0000 |
1100 |
|||
7 |
0000 0111 |
0000 1010 |
0000 1101 |
||||
8 |
0000 |
1000 |
0000 1011 |
0000 1110 |
|||
9 |
0000 1001 |
0000 1111 |
0000 1111 |
||||
10 |
0001 |
0000 |
0001 |
0000 |
0001 |
0000 |
|
|
|
|
|
Таблица 7.3 |
Число в |
Код |
Число В |
Код |
Число в |
Код |
десятичном |
Грея |
десятичном |
Грея |
десятичном |
Грея |
коде |
|
коде |
|
коде |
|
0 |
0000 |
6 |
0101 |
11 |
1110 |
1 |
0001 |
7 |
0100 |
12 |
1010 |
2 |
ООП |
8 |
1100 |
13 |
1011 |
3 |
0010 |
9 |
1101 |
14 |
1001 |
4 |
оно |
10 |
1111 |
15 |
1000 |
5 |
0111 |
|
|
|
|
Среди кодов, отходящих от систем счисления, большое практическое значение имеют такие, у которых при переходе от одного числа к другому изменение происходит только в одном разряде.
Наибольшее распространение получил код Грея, часто называе мый циклическим или рефлекснд-двоичным. Код Грея используется в технике аналого-цифрового преобразования, где он позволяет свести к