2 Вопрос

Кодированием информации называется операция преобразования сообщений в определенную последовательность сигналов, а обратная операция, восстанавливающая сообщение по принятым сигналам называется декодированием.

Префиксные коды - это такие коды, в которых ни одна более короткая комбинация не является началом более длинной комбинации, а это позволяет производить однозначное декодирование, даже если последовательность кодов не содержит разделителей между кодами.

Код Хаффмана

Второй код, являющийся не менее эффективным, чем код Шеннона-Фано, является код Хаффмана. Он также учитывает статистические свойства сигналов, при которых вероятности появления букв p₁, р₂, …р_к не равные между собой, поэтому H < log n.

Код Хаффмана строится следующим образом: буквы располагают в порядке убывания их вероятностей. Складывают вероятности двух последних букв, и ряд переписывают снова с учетом новой вероятности (суммы). Далее повторяют операцию, пока не получится 1. Нижнюю букву всегда кодируют нулем, а верхнюю – единицей.

Для составления кодовых комбинаций строится кодовое дерево. Двигаясь по кодовому дереву сверху вниз, можно записать для каждой буквы соответствующую ей кодовую комбинацию.

Код Хаффмана, также как и Шеннона-Фано является префиксным, то есть в таком коде ни одна комбинация не совпадает с началом более длинной комбинации, а это позволяет обеспечить однозначное декодирование без введения разделительных символов.

Среднее кол-во разрядов:

Энтропия

Код Шеннона-Фано

Все буквы записываются в порядке убывания их вероятностей, затем делятся на равновероятные группы, которые обозначаются 0 и 1, затем вновь делятся на равновероятные группы и т.д

Средняя длина кода определяется по формуле

Блочное кодирование

Пусть имеются две буквы алфавита A и B. Как возможно закодировать данные буквы, видимо только по одному символу.

A	0.9	0
B	0.1	1

Средняя длина будет равна 1 биту бит/буква

Аэнтропия равна . То есть, избыточность составляет 53%. Как же быть? Попробуем закодировать двухбуквенные сочетания. В этом случае уже можно воспользоваться эффективным кодированием.

AA	0.81	0	------	------	0
AB	0.09		0	------	10
BA	0.09	1	1	0	110
BB	0.01			1	111

Тогда средняя длина на блок из двух букв будет . А на одну букву =0.645 бит/буква. Избыточность в этом случае будет уже составлять примерно 17%. Если мы возьмем сочетания из трех букв, то получим еще лучший результат и т.д. Увеличивая длину блоков можно как угодно близко приблизиться к оптимальному значению

Блочное кодирование удобно применять и для устранения избыточности при кодировании десятичных цифр. При передаче десятичных цифр двоичным кодом максимально загруженными бывают только те символы вторичного алфавита, которые передают значения, являющиеся целочисленными степенями двойки. Это 4, 8, 16, … В других случаях тремя разрядами можно передать и 5 и 8. Так для передачи цифры 5 необходимо . Однако эту цифру необходимо округлить до ближайшего целого числа 3. Избыточность от округления будет составлять

<<< < Предыдущая 1 2 3 45 / 95 6 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.09.201936.55 Кб15OLIMPIADA (1).docx
#
22.11.2019654.85 Кб4OOP_080200.doc
#
22.11.2019261.12 Кб8OOP_100400.doc
#
05.06.2015232.45 Кб11Otchet_po_praktike_3_kurs (2).doc
#
05.06.2015261.63 Кб12otchet_po_praktike_za_4_kurs.doc
#
16.09.201976.24 Кб3otvety Kodirovanie.docx
#
23.09.2019180.07 Кб3Otvety_na_ekz_voprosy_po_GP_v2_0.docx
#
19.09.2019632.32 Кб2otvety_po_adm.doc
#
23.04.2019132.53 Кб10otvety_po_istorii_ekz.docx
#
16.04.2019133.01 Кб3otvety_po_kodexu.docx
#
03.12.201873.24 Кб3Pantileeva_Nina_Dmitrievna.docx