Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Одесская национальная академия связи им. А.С. Попова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лабораторная работа укр.алф..doc

Скачиваний:

Добавлен:

27.11.2019

Размер:

202.75 Кб

Скачать

☆

1 / 31 2 3 > Следующая >>>

Лабораторная работа 1.3 по ирс исследование эффективного кодирования с укрупнением алфавита

1 Цель работы

1.1 Изучение принципа укрупнения алфавита с целью эффективного (экономного) кодирования.

1.2 Исследование эффективности кодирования с укрупнением алфавита для дискретных источников без памяти и с памятью.

2 Ключевые положения

2.1 Дискретный источник сообщений – это источник, который выдает последовательность знаков конечного алфавита объема M_A. Дискретные источники классифицируются на:

– источники без памяти – появление любого знака последовательности не зависит от предыдущих знаков. Такой источник задается безусловными вероятностями знаков алфавита P(a_k), для k = 1, 2,…, M_A.

– источник с памятью – появление любого знака последовательности зависит от предыдущих знаков. Такой источник задается условными вероятностями знаков алфавита. Для математического описания дискретных источников с памятью используют цепи Маркова и такие источники называются марковскими K-го порядка. В этом случае появление любого знака последовательности зависит только от K предыдущих знаков. Тогда марковский источника 1-го порядка (когда вероятность появления знака в последовательности зависит только от предыдущего) будет задаваться условными вероятностями P(a_k/ a_j), для k, j = 1, 2,…, M_A.

2.2 Двоичный источник дискретных сообщений (M_A = 2) без памяти задается безусловными вероятностями P(a₁) = p и P(a₂) = (1 – p). Зависимость энтропии такого источника от p показана на рис. 1 и записывается как:

H(A) = –plog₂p – (1 – p)log₂(1 – p). (1)

Рисунок 1 – Зависимость энтропии H(A) от вероятности p

H(A), дв.ед./знак

нтропия максимальна, когда знаки равновероятны (P(a₁) = P(a₂) = 0,5) и равна 1 дв. ед./знак. Таким образом, каждый символ в среднем содержит не более 1 дв. ед. (бит) количества информации. В случае, когда p  0,5 – энтропия H(A) < H_max(A) и такой источник обладает избыточностью. При p = 0 или p = 1 энтропия равна 0, т.к. неопределенность отсутствует.

2.3 Для марковского двоичного источника сообщений с памятью 1-го порядка необходимо задать условные вероятностями P(a₁/ a₁), P(a₁/ a₂), P(a₂/ a₁) и P(a₂/ a₂). Энтропия такого источника определяется:

H(A) = – . (2)

Пример 1. Задан марковский двоичный источник сообщений с памятью 1-го порядка с вероятностями P(a₁) = P(a₂) = 0,5; P(a₁/ a₁) = P(a₂/ a₂) = 0,3; P(a₁/ a₂) = P(a₂/ a₁) = 0,7. Найти энтропию источника.

По формуле (2) находим

H(A) = – 0,5(0,3log₂0,3 + 0,7log₂0,7) – 0,5(0,3log₂0,3 + 0,7log₂0,7) = 0,881бит/знак

Энтропия источника с памятью меньше, чем энтропия двоичного источника без памяти с равными вероятностями (H_max(A) = 1 бит/знак). В этом случае избыточность обусловлена статистической связью между знаками.

2.4 В случае двоичного источника без памяти, когда знаки разновероятны, то энтропия меньше 1 дв.ед./знак (рис. 1). К примеру, P(a₁) = 0,8 , P(a₂) = 0,2. Тогда энтропия равна H(A) = 0,722 дв.ед./знак. Применение эффективного кодирования (например, кода Хаффмана) к такому двоичному источнику не даст никакого эффекта (каждый из знаков будет кодироваться одним битом, независимо от вероятностей их появления). Для эффективного кодирования требуется предварительное укрупнение алфавита.

Под укрупнением алфавита будем понимать формирование нового алфавита укрупненных знаков (укрупненный знак является сочетанием из m знаков первичного алфавита). Объем нового (вторичного) алфавита M_B определяется как

M_B = . (3)

Кодирование такого укрупненного (вторичного) алфавита будет более эффективным.

Пример 2. Рассмотрим укрупнение по 3 знака (m = 3) для двоичного источника без памяти приведенного выше с энтропией H(A) = 0,722 бит/знак.

Т.к. двоичный источник без памяти (т.е. источник выдает знаки независимо друг от друга), то из теории вероятности известно, что вероятность появления укрупненного знака будет равна произведению вероятностей входящих в него знаков первичного алфавита (P(a₁a₁) = P(a₁) P(a₁)). Объем укрупненного алфавита по формуле (3) равен M_B = = 2³ = 8. Рассчитаем вероятности укрупненных знаков и применим к ним эффективное кодирование (например, метод Шеннона-Фано) (табл. 1).

Таблица 1 – кодирование укрупненного алфавита

Укрупн. знак b_i	Вероятность P(b_i)	Подгруппы					Кодовые комбинации
Укрупн. знак b_i	Вероятность P(b_i)	I	II	III	IV	V	Кодовые комбинации
a₁a₁a₁	0,512	0					0
a₁a₁a₂	0,128	1	0	0			100
a₁a₂a₁	0,128		0	1			101
a₂a₁a₁	0,128		1	0			110
a₁a₂a₂	0,032			1	0	0	11100
a₂a₁a₂	0,032				0	1	11101
a₂a₂a₁	0,032				1	0	11110
a₂a₂a₂	0,008				1	1	11111

Рассчитаем среднюю длину кодовой комбинации укрупненных знаков:

= 2,184 символов

а среднее число кодовых символов на знак определяется как

. (4)

Для рассмотренного случая получим = 0,728 символов. При сравнении с энтропией H(A) = 0,722 бит/знак видно, что предварительное укрупнение алфавита значительно повысило эффективность сжатия (кодирование первичного алфавита без укрупнения давало = 1).

С увеличением количества знаков при укрупнении m можно получать более эффективный код, т.е. среднее число кодовых символов на знак будет больше приближаться к энтропии.

2.5 Укрупнение алфавита также целесообразно в случае дискретного источника сообщений с памятью. Известно, что статистическая зависимость между знаками первичного алфавита, расположенных рядом, больше, чем расположенных на расстоянии нескольких знаков. Соответственно, укрупненные знаки будут обладать значительно меньшей зависимостью (очевидно, что чем больше m, тем меньше зависимость между укрупненными знаками). В этом случае (для источника с памятью) для определения вероятностей укрупненных знаков необходимо учитывать условные вероятности (P(a₁a₁) = P(a₁) P(a₁/ a₁)).

Таким образом, избыточность, обусловленная статистическими связями между знаками первичного алфавита, преобразуется в избыточность, обусловленную различными вероятностями укрупненных знаков. А такую избыточность можно уменьшить, используя эффективное кодирование (например, кодирование Хаффмана).

1 / 31 2 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.02.2016123.9 Кб6Лабораторна робота № 6.doc
#
10.02.2016122.37 Кб10Лабораторна робота № 7.doc
#
10.02.201675.78 Кб9Лабораторна робота № 8.doc
#
10.02.2016142.85 Кб16ЛАБОРАТОРНА РОБОТА1(готово).doc (МСС).doc
#
10.02.2016310.27 Кб20Лабораторная работа 2,1.doc
#
27.11.2019202.75 Кб4Лабораторная работа укр.алф..doc
#
18.11.20191.86 Mб10ЛАБОРАТОРНАЯ РАБОТА №1__рус.doc
#
10.02.2016175.62 Кб11Лабораторная работа4,111111.doc
#
10.02.2016138.75 Кб26Лабораторная работа6,1.doc
#
10.02.201677.31 Кб18Лабораторная работа8,1.doc
#
10.02.2016174.08 Кб17Лабораторний практикум 1.doc