Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Педагогический Университет им. М. Акмуллы

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Кодирование.doc

Скачиваний:

Добавлен:

05.09.2019

Размер:

1.92 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 117 8 9 10 11 > Следующая >>>

6.2. Кодирование с минимальной избыточностью

Для практики важно, чтобы коды сообщений имели по возможности наименьшую длину. Алфавитное кодирование пригодно для любых сообщений, то есть S = A^*. Если больше про множество S ничего не известно, то точно сформулировать задачу оптимизации затруднительно. Однако на практике часто доступна дополнительная информация. Например, для текстов на естественных языках известно распределение вероятности появления букв в сообщении. Использование такой информации позволяет строго поставить и решить задачу построения оптимального алфавитного кодирования.

6.2.1. Минимизация длины кода сообщения

Если задана разделимая схема алфавитного кодирования , то любая схема , где является перестановкой , также будет разделимой. Если длины элементарных кодов равны, то перестановка элементарных кодов в схеме не влияет на длину кода сообщения. Но если длины элементарных кодов различны то длина кода сообщения зависит от состава букв в сообщении и от того, какие элементарные коды каким буквам назначены.

Если заданы конкретное сообщение и конкретная схема кодирования, то нетрудно подобрать такую перестановку элементарных кодов, при которой длина кода сообщения будет минимальна.

Пусть k₁,…,k_n – количества вхождений букв a_1,...,a_n в сообщение S,а l₁,…,l_n – длины элементарных кодов , соответственно. Тогда, если и , то . Действительно, пусть k_j=k+a, k_i=k и l_j=l, l_i=l+b, где a,b 0. Тогда

Отсюда вытекает алгоритм назначения элементарных кодов, при котором длина кода конкретного сообщения S будет минимальна: нужно отсортировать буквы в порядке убывания количества вхождений, элементарные коды отсортировать в порядке возрастания длины и назначить коды буквам в этом порядке.

ЗАМЕЧАНИЕ

Этот простой метод решает задачу минимизации длины кода только для фиксированного сообщения S и фиксированной схемы .

6.2.2. Цена кодирвания

Пусть заданы алфавит и вероятности появления букв в сообщении (p_i – вероятность появления буквы a_i). Не ограничивая общности, можно считать, что p_i+…+p_n=1 и (то есть можно сразу исключить буквы, которые не могут появиться в сообщении, и упорядочить буквы по убыванию вероятности их появления).

Для каждой (разделимой) схемы алфавитного кодирования математическое ожидание коэффициента увеличения длины сообщения при кодировании (обозначается ) определяется следующим образом:

, где

и называется средней ценой (или длиной) кодирования при распределении вероятностей P.

Пример

Для разделимой схемы А={a,b}, B={0,1}, при распределении вероятностей цена кодирования составляет 0.5*1+0.5*2=1.5, а при распределении вероятностей она равна 0.9*1+0.1*2=1.1.

Обозначим

Очевидно, что всегда существует разделимая схема , такая что . Такая схема называется схемой равномерного кодироваия. Следовательно, и достаточно учитывать только такие схемы, для которых , где l_i целое и . Таким образом, имеется лишь конечное число схем , для которых . Следовательно, существует схема , на которой инфимум достигается:

Алфавитное (разделимое) кодирование , для которого , называется кодированием с минимальной избыточностью, или оптимальным кодированием, для распределения вероятностей P.

<<< < Предыдущая 1 2 3 4 5 67 / 117 8 9 10 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.03.2015262.66 Кб6Ключ, комментарии.doc
#
18.03.201580.33 Кб24книжка.docx
#
15.07.2019363.83 Кб1книжка5 курс.rtf
#
18.03.2015141.31 Кб16Коган.doc
#
18.03.20151.91 Mб102Кодирование.doc
#
05.09.20191.92 Mб15Кодирование.doc
#
18.03.2015194.05 Кб40Коллоквиум.doc
#
18.03.201530.31 Кб14коллоквиум.docx
#
18.03.2015460.8 Кб248Комплексная работа Три котенка 1 класс.doc
#
18.03.2015145.41 Кб13Конвенция о Правах Ребёнка.doc
#
18.03.2015151.04 Кб4конвенция о правах ребенка.doc