Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный технический университет им. К. И. Сатпаева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

кодирования.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

12.08 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 258 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

1.3. Эффективное кодирование дискретных сообщений

Цели эффективного кодирования

Основной целью эффективного (статистического) кодирования яв- ляется преобразование сообщения в сигнал с меньшей, чем у сообще- ния, избыточностью (в пределе – без избыточности). Сигналы без из- быточности имеют максимальную удельную энтропию. Для передачи информации с помощью таких сигналов требуется минимальное коли- чество символов. Поэтому такие коды называют эффективными, а так- же экономными и оптимальными. В результате эффективного кодиро- вания скорость передачи информации по дискретному каналу связи может быть приближена к его пропускной способности. В этом случае говорят о согласовании источника с каналом.

Скорость передачи информации и пропускная способность дискретного канала без помех

Вопросы статистического кодирования сообщений рассмотрим в пред- положении, что передача ведется по каналу связи в отсутствии помех. В этом случае принятый за время T сигнал Y_Tсовпадает с переданным

^S_T^,^равн^ы^и^х^эн^т^ропи^и^H^(S_T⁾⁼^H^(Y_T⁾^и^с^к^ор^о^ст^ь^пере^д^а^ч^и^инфор^м^ации

_R__lim^H⁽^ST ⁾_^H1⁽^S⁾_,

_T__

 ^(2.13⁾

где H₁(S) – удельная энтропия сигнала;  – длительность символов сиг- налов неуправляемого источника ( = const).

При однозначном преобразовании сообщения в сигнал H(X_T) = H(S_T) и скорость передачи может быть выражена через удельную энтропию H₁(X) сообщения:

_R__lim^H⁽^ST ⁾__lim^H⁽^XT ⁾_^H1⁽^X⁾__H_₍_X₎_,

T T 

_(2.14)

T 

т. е. скорость равняется производительности источника (2.12).

Пропускная способность канала C, характеризующая его потенци- альные возможности, определяется как верхняя граница (или макси- мум) скорости передачи информации R. Для дискретного канала без помех максимальное значение скорости достигается при равновероят- ных и независимых символах сигнала (2.6)

_C__m_ax_R__m_ax_H₁₍_S₎__H₁₍_S₎_m_a_x__l_o_g_m_S_,

p ( x)

___^(2.15)

^г^д^е^m_s^–^а^лфави^т^к^о^дер^а^кан^а^л^а^(сигн^а^ла).

^В^{частности}^,^дл^я^{двоичног}^о^канал^а^m_s⁼²^и^C⁼¹^/^^{численн}^о^совпа-

^да^ю^т^с^о^с^к^ор^о^сть^ю^манип^у^ляци^и^сим^в^о^ло^в^в^к^ан^а^ле^.^Полн^о^е^со^г^ласо^ва^-

ние источника с каналом достигается при R / C = 1, а качество согласо- вания определяется отношением

_R_H₁₍_S₎_1 ,

_

^C^l^o^g^m_S

^^^_S

(2.16)

^г^д^е^_s⁼¹^–^H₁^(S)^/^lo^g^m_s^–^избы^т^о^чн^о^ст^ь^сигн^а^л^а^п^о^ан^а^логи^и
с⁽²^.^9).

^Пр^и^{заданно}^м^канал^е^{отношени}^е^R/^C^{полность}^ю^{определяетс}^я^избы-

^т^о^чн^о^сть^ю^сигн^а^л^а^и^е^г^о^у^дельно^й^эн^т^ропие^й^H₁⁽^S⁾^.

Чтобы R / C  1, следует выбирать такой способ кодирования сооб-

щений источника, при котором H₁(S)  log m_s, т. е. в результате коди- рования должна получаться последовательность, составленная из рав- новероятных и независимых символов.

Основная теорема кодирования

Вопрос о возможности передачи информации со скоростью, равной пропускной способности канала без помех, решается положительно при применении безызбыточного кодирования [(2.16) – при _s= 0]. Это ут- верждение доказывается одной из основных теорем теории информа-

ции, которая называется теоремой кодирования для источника. Посколь- ку при этом предполагается, что последовательность кодовых символов принимается без ошибок, то эту теорему называют также теоремой ко- дирования для канала без помех.

Одна из возможных формулировок этой теоремы следующая:

Если производительность источника H(X) = C – , где C – пропуск- ная способность канала связи, а  > 0 – сколь угодно малая величина, то

существует способ кодирования, обеспечивающий передачу всех сооб- щений, вырабатываемых источником, со скоростью R = H(X) = C – . Если H(X) > C, то длительная передача всех сообщений невозможна. Доказательство этой теоремы можно найти в [3]. Другая формулировка этой теоремы приведена в [1].

Избыточность источника возникает за счет:

неравной вероятности набора символов, составляющих алфавит источника;

зависимости выбора последующего символа от предыдущего (так, в связном русском тексте после гласных не может появиться "Ъ", мала вероятность сочетания более трех согласных подряд и т. п.).

Устранение избыточности достигается следующим образом:

1-й этап – применяется укрупнение алфавита источника для устра- нения статистической связи между соседними символами (кодируются не отдельные буквы, а целые слова текста), при этом уменьшается не- равновероятность букв укрупненного алфавита;

2-й этап – при последующем кодировании используются неравно- мерные коды; при этом наиболее вероятные буквы ранее укрупненного алфавита источника передаются меньшим количеством символов.

Теорема кодирования является теоремой существования, т. е. она доказывает, что оптимальные (эффективные) коды существуют, но не дает указаний о том, как построить такие коды.

В настоящее время разработано большое количество эвристических приемов, позволяющих осуществить статистическое кодирование и най- ти код, близкий к оптимальному. Однако основные свойства и особен- ности, которыми должны обладать такие эффективные коды, следуют из теоремы кодирования.

1. Для обеспечения минимальной средней длины кодового слова из- быточность должна быть сведена к минимуму (желательно к нулю). Для этого эффективный код должен состоять из кодовых слов, в которых все символы равновероятны и статистически независимы. Это позво- ляет уравнять скорость передачи с пропускной способностью канала связи, что и является целью безызбыточного кодирования.

2. Ни одна из кодовых комбинаций не должна получаться из другой, более короткой, путем добавления новых символов. Эффективные коды

не требуют разделительных символов (маркеров) и при этом должно выполняться их однозначное декодирование. Коды, удовлетворяющие этому условию, называются префиксными кодами, так как ни одно кодо- вое слово не является передней частью ("префиксом" – приставкой) дру- гого кодового слова.

3. Эффективные коды являются неравномерными, т. е. для передачи разных символов сообщения m_iиспользуются кодовые комбинации раз- ной длины. Наиболее вероятные сообщения кодируются самыми корот-

кими кодовыми словами, вследствие чего средняя длина кодового сло- ва в сообщении уменьшается, что и позволяет решить задачу равенства скорости передачи и пропускной способности канала.

При неравномерном эффективном кодировании средняя длина кодо- вого слова _nопределяется выражением

_m_i

ⁿ^ ⁿ_k^p⁽^x_k⁾^,

k  1

(2.17)

где p (x_k) – вероятность появления сообщения (кодового слова), при- чем их сумма равна 1; n_k– длина кодовых слов x_k(k = 1, 2, ..., m_i).

По аналогии с выражением (2.10), где предполагалось применение равномерных кодов с постоянной длиной кодовых слов (n = const), при использовании эффективных неравномерных кодов (n = var) избыточ- ность кода источника

__n  n_m_in_₁_ⁿ_m_in_.

_(2.18)

^k_n n

Очевидно, когда n = n_mi_n, что эквивалентно равенству H_ma_x(X) = H(X), избыточность кода _kравна нулю, и при применении эффективных ко- дов обеспечивается полное согласование источника сообщений с кана-

лом (2.16). При этом энтропия источника H(X) является оценкой сред- него числа ⁿдвоичных символов, требуемых для кодирования сообще- ний.

Процедуру построения эффективного кода, близкого к оптимально-

му, предложили практически одновременно Шеннон и Фано (код Шен- нона – Фано). Эта процедура рассмотрена подробно в [1, разд. 3.3].

В данной лабораторной работе студенты знакомятся с процедурой построения эффективных кодов, предложенной Хафменом. При малом алфавите источника и неравновероятных символах x_iвыгодно кодиро-

вать не отдельные символы, а целые блоки из нескольких символов (букв). В этом студенты убеждаются, исследуя в лабораторной работе метод кодирования Хафмена.

Код Хафмена

Д. А. Хафменом был предложен систематический метод кодирова- ния, который всегда приводит к получению оптимального множества кодовых слов для кодирования данного множества сообщений.

Для дискретных систем с двоичным алфавитом кодера (m = 2) мето- дика построения кода Хафмена сводится к следующей процедуре:

1. Все m_i= M сообщений (буквы алфавита источника) выписывают- ся в порядке убывания вероятностей p (x_i) (табл. 2.1).

2. Две последние буквы алфавита, имеющие наименьшие вероятнос-

ти p (x_М_–₁) и p (x_M), группируются вместе и объединяются в одну вспо- могательную букву, которой приписывается суммарная вероятность p_=

⁼^p⁽^x_M_–₁⁾⁺^p^(x_M^).

3. Вероятности букв, не участвовавших в объединении, и получен-

ная суммарная вероятность снова располагаются в порядке убывания вероятностей (в следующем столбце табл. 2.1). Объем нового алфавита таким образом уменьшается на единицу: М–1.

4. Производят второе укрупнение алфавита, состоящего уже из М–1 символов, путем объединения двух символов с наименьшими вероят- ностями и вычисляют их общую вероятность. Получают новый алфа- вит объемом М–2.

5. Упорядочивают по вероятности символы этого нового алфавита.

6. Образуют последовательность укрупненных алфавитов путем пос- ледовательного повторения операций пп. 4 и 5, пока в ансамбле не останется единственное сообщение с вероятностью, равной 1 (шаговая процедура, записываемая в столбцах табл. 2.1).

7. Проведя линии, соединяющие символы при последовательном ук- рупнении алфавита, получают так называемое кодовое дерево, концы вет- вей которого являются символами исходного алфавита источника сооб- щений. Приписывая ветвям дерева, исходящим из каждого промежуточ- ного узла, различные символы алфавита кодера (0 или 1), получают кодо- вые слова, соответствующие кодируемым сообщениям источника.

Методика поясняется примером, представленным в табл. 2.1, где для алфавита источника с объемом М = 8 приняты произвольные значения

вероятностей p (x_i) , но

 ^p⁽^x_i⁾^¹^.

i  1

Таблица 2.1

_x_iВероят- ности

^p⁽^x_i⁾

Шаговая процедура (кодовое дерево)

Кодовые слова

^x2 ^0,081^x3 ^0,081^x4 ^0,081^x5 ^0,009^x6 ^0,009

^x₇0,009 ¹

^x₈_0,001

⁰

0,081

_0,010

_0,009¹

_0,009

⁰

0,081

0,018

0,010

0,081

^0,081₁

_0,081

¹_0,028

⁰

_0,109

_0,08₁¹

_0,081

⁰

0,162¹

_0,109

		001
		00011
		00010
		00001
		00000

⁰

0,271

011

010

Для составления кодовой комбинации, соответствующей данному сообщению x_i, необходимо проследить путь перехода сообщения по строкам и столбцам таблицы. Для наглядности кодовое дерево постро-

ено в поле табл. 2.1. Целесообразно строить кодовое дерево, начиная с первого столбца таблицы, располагая ветви против группируемых по- парно вероятностей p (x_i) и соединяя их со значением суммарной веро-

^ятност^и^p_^,^{располагаемо}^й^в^{следующе}^м^{столбце}^.^Ветвя^м^с^{большей}

вероятностью присваивается символ 1, а с меньшей – 0 (или наоборот).

Такое последовательное ветвление продолжается до тех пор, пока ветвь не закончится узлом с вероятностью p (x_i) каждой буквы алфавита источника. Отдельно кодовое дерево для алфавита источника, рассмат-

риваемого в примере, приведено на рис. 2.2.

Перемещаясь по кодовому дереву сверху вниз, можно записать для каждой буквы алфавита x_iсоответствующую ей кодовую комбинацию

^x1 ^x2 ^x3 ^x4 ^x5 ^x6 ^x7 ^x8

1 011 010 001 00011 00010 00001 00000

Код Хафмена при любом распределении вероятностей p (x_i) дает однозначный ансамбль набора кодовых слов, в то время как при коде Шеннона – Фано на выходной ансамбль кодовых слов влияет субъек-

₁

⁰

^0,⁷²⁹_0,₂₇₁

_x₁

0,081

0,162

₁0

0,081 0,081

0,109

0,028

^x₂^x₃^x⁴

0,018

₀

0,010

¹₀

_0,₀₀₉¹

0,009

0,001

x₅^0,⁰⁰⁹

^x₆^x₇^x₈

_Рис_._2.2

тивный выбор границ последовательного разбиения алфавита на две группы [1].

Существенное преимущество кода Хафмена по сравнению с кодом Шеннона – Фано проявляется при применении кодов с основанием большим 2 (М > 2) и заключается в том, что методика Хафмена гаран- тирует однозначное построение кода с наименьшим для данного рас- пределения вероятностей средним количеством символов на букву, что показано в [1, с. 43–46].

Достоинства и недостатки эффективных кодов

Кратко сформулируем перечисленные выше достоинства оптималь- ных эффективных кодов.

1. При эффективном кодировании, учитывающим вероятности по- явления букв алфавита источника сообщений, удается построить коды с максимальной удельной энтропией на символ.

2. Обеспечивается преобразование сообщения в сигнал с меньшей, чем у сообщения избыточностью (в пределе – без избыточности).

3. На передачу сообщения затрачивается минимальное количество символов.

4. Решается задача согласования источника сообщений с каналом связи, в результате чего скорость передачи информации может быть приближена к пропускной способности канала.

5. Не требуется введения специальных разделительных символов (мар- керов), как, например, в коде Морзе для отделения одной кодовой ком-

бинации от другой, так как ни одна комбинация эффективного кода не совпадает с началом другой, более длинной. Такое свойство кода назы- вается "неприводимостью", и коды называются префиксными или кода- ми без запятой.

К недостаткам эффективных кодов можно отнести следующее:

1. Эффективные коды являются неравномерными, т. е. кодовые комбинации имеют различное количество символов. Если линия свя- зи работает с постоянной скоростью передачи, то на выходе кодера необходимо буферное запоминающее устройство (" упругая задерж- ка") для записи в него "пульсирующих" по длительности кодовых групп и последующего считывания в канал символов с постоянной скоростью. Аналогичная "упругая задержка" должна быть и на сто- роне приема.

2. Наибольший эффект оптимальные коды дают при кодировании

исходного сообщения длинными блоками, поскольку при этом достига- ется равновероятность и статистическая независимость блоков. Однако блочное кодирование вызывает необходимость накапливать слова ал- фавита источника, прежде чем поставить им в соответствие определен- ную кодовую группу эффективного кода. Это приводит к большим за- держкам при передаче и приеме сообщений, что затрудняет (или ис- ключает) применение эффективных кодов в системах, работающих в реальном масштабе времени. Эффективное кодирование (кодом Хафме- на) применяется при записи информации на магнитные носители (сис- темы архивации) и в системах факсимильной связи.

3. Существенным недостатком эффективных кодов является то, что они непомехозащищенные. Любая одиночная ошибка при при- еме переводит передаваемую комбинацию в другую, не равную ей по длительности, что влечет за собой неправильное декодирование целого ряда последующих кодовых групп. Такое специфическое вли- яние помех называется "треком ошибок" или пакетом ошибок. В чи- стом виде эффективное кодирование можно применять только для каналов без помех.

Таким образом, непосредственная передача сообщений при приме- нении эффективных кодов по каналу связи с шумами приводит к не- допустимо большим искажениям (потере информации). Однако эф- фективное кодирование, устраняющее статистическую избыточность в передаваемом сообщении, наилучшим образом подготавливает не- прерывную кодовую последовательность, полученную после первич-

ного кодирования сообщений источника, к последующему помехоус- тойчивому кодированию с помощью корректирующих кодов в кодере канала (рис. 2.1). Целенаправленное введение избыточности при по- мехоустойчивом кодировании путем добавления дополнительных про- верочных символов в кодовые информативные группы позволяет при декодировании обнаруживать и исправлять ошибки, вызванные по- мехами.

<<< < Предыдущая 1 2 3 4 5 6 78 / 258 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.03.201548.75 Кб21КИП_М_2.docx
#
01.05.202562.49 Кб0кластер.docx
#
25.05.2015237.68 Кб60КНБК.docx
#
01.07.202549.06 Mб1книга нугманов автомобиль.doc
#
13.03.20153.35 Mб60книга22.10.02(изменение).doc
#
01.07.202512.08 Mб0кодирования.doc
#
13.03.2015388.1 Кб36кокшетау васильковка.doc
#
01.05.2025135.35 Кб0Колектор .docx
#
01.05.20251.51 Mб0колледж_каз_лаб.doc
#
13.03.2015167.17 Кб12Коллекторы НиГ.rtf
#
13.03.2015417.54 Кб85комп клуб.docx