Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методические указания к выполнению лабораторных ра (1)

.pdf
Скачиваний:
26
Добавлен:
10.02.2016
Размер:
806.6 Кб
Скачать

61

2.7 В значительной мере определяющим моментом процесса сжатия сообщения по алгоритму LZW является момент полного заполнения словаря. В классическом алгоритме LZW, который изучается, после заполнения словарь не изменяется, а на выходе кодера появляются номера строк, присутствующие в этом словаре.

Процесс заполнения словаря – это процесс описанной адаптации алгоритма к кодируемому сообщению, и пока заполняется словарь, постоянно возрастает коэффициент сжатия. Как только словарь заполнится, алгоритм перестает адаптироваться к сообщению, а коэффициент сжатия перестает увеличиваться.

Классическое решение этой проблемы в алгоритме LZ78 – сброс словаря после его полного заполнения. После сброса словаря процесс его заполнения повторяется. Таким образом алгоритм адаптируется к отдельным частям сообщения, позволяющий несколько увеличить коэффициент сжатия. Недостаток этого решения – малый коэффициент сжатия в начале заполнения словаря.

Также классическое решение проблемы – увеличение объема словаря. Теоретически неограниченный по объему словарь позволяет достичь максимально возможного коэффициента сжатия log 2 M А H (A), но при значительном

увеличении MА значительно возрастает время, необходимое на поиск строки в словаре, т.е. уменьшается скорость сжатия. Так, протокол V.42bis не ограничивает объем словаря, указывается лишь минимально возможное значение –

M А ³ 512 .

Наиболее удачное решение – не прекращать заполнение словаря. В этом случае номера строк в словаре постоянно изменяются. Номера строк, которые встречаются очень часто, уменьшаются, т.е. эти строки располагаются в начале словаря. Строки, которые встречаются редко, располагаются в конце словаря. Когда словарь заполнен, то новая строка заносится в словарь вместо последней строки, которая реже всего встречается в сообщении.

2.8Поиск строк в словаре является отдельной задачей, а его эффективность определяет скорость сжатия. Важно, что при увеличении объема словаря для увеличения коэффициента сжатия, уменьшается скорость поиска строк в словаре. Чтобы увеличить скорость сжатия, одновременно с увеличением объ-

ема словаря ограничивается длина строки в словаре NC. Т.е., в словарь не заносятся строки, длина которых превышает NC, но при этом, снова таки, несколько уменьшается коэффициент сжатия. В протоколе V.42bis указывается, что максимальная длина строки может изменяться в диапазоне от 6 до 250 символов.

2.9Преимуществом алгоритма LZW является то, что декодирование сообщения не нуждается в дополнительных данных и осуществляется с высокой скоростью. Принцип декодирования аналогичный сжатию:

1)словарь декодера инициализируется таким же образом, как и словарь

кодера;

2)за принятым номером в словаре отыскивается соответствующая стро-

ка;

3)найденная строка подается на выход декодера;

62

4) в словарь заносится строка, которая состоит из предыдущей строки и первого символа текущей строки.

Пример декодирования сжатого по алгоритму LZW сообщения "65 66 256 67 258 260" приведено в табл. 3. Необходимо обратить внимание на исключительную ситуацию, когда принимается номер строки, которой еще нет в словаре. В этом случае строка заносится в словарь в процессе декодирования: первая строка состоит из предыдущей строки и ее первого символа.

Таблица 3 – Пример декодирования сообщения за алгоритмом LZW

Номер

Есть в слова-

Декодированная

Буфер

Занести в словарь

Буфер

ре?

строка

строка

под номером

 

 

 

65

да

"А"

"А"

-

-

"А"

 

 

 

 

 

 

 

66

да

"В"

"АВ"

"АВ"

256

"В"

 

 

 

 

 

 

 

256

да

"АВ"

"ВА"

"ВА"

257

"АВ"

 

 

 

 

 

 

 

67

да

"С"

"АВС"

"АВС"

258

"С"

 

 

 

 

 

 

 

258

да

"АВС"

"СА"

"СА"

259

"АВС"

 

 

 

 

 

 

 

260

нет

"АВСА"

"АВСА"

"АВСА"

260

"АВСА"

 

 

 

 

 

 

 

2.10 Известный факт, что сообщения с малой избыточностью очень чувствительны к ошибкам, возникающим в каналах связи. Например, если при передаче первого числа сжатого сообщения состоится ошибка и будет принято число "193" вместо "65", то наступит коллизия, которую декодер не способен решить. В таком случае, согласно протоколу V.42bis, осуществляется запрос на повторную передачу. Но более опасными являются ошибки, которые не приводят к коллизиям. Например, ошибка происходит в четвертом числе и принимается последовательность "65 66 256 66 258 260". На выходе декодера получим "АВАВВАВВАВВА". Таким образом, одна ошибка привела к появлению еще двух, т.е. наблюдается явление размножения ошибок. Итак, в случае сжатия сообщений к каналам связи предъявляются жесткие требования.

3 Ключевые вопросы

3.1Что называется примитивным кодированием?

3.2Что называется эффективным кодированием или сжатием сообщения?

3.3Назвать причины избыточности сообщений.

3.4Дать определение коэффициента сжатия?

3.5Чему равен максимальный коэффициент сжатия в случае сжатия без потерь информации?

3.6Назвать известные алгоритмы сжатия сообщений без потерь инфор-

мации.

3.7Описать процесс сжатия сообщения по алгоритму LZW.

3.8Описать процесс декодирования сообщения по алгоритму LZW.

63

4 Домашнее задание

4.1Изучить по конспекту лекций и ключевым положениям раздел "Эффективное кодирование дискретных сообщений". При изучения раздела можно воспользоваться литературой [2, с. 16...27; 5, с. 876...887].

4.2По алгоритму LZW выполнить сжатие сообщения, которое задано в табл. 4. Процесс сжатия оформить в виде табл. 2.

4.3Декодировать сжатое в п. 4.2 сообщение. Процесс декодирования оформить в виде табл. 3.

4.4Подготовиться к беседе по ключевым вопросам.

Таблица 4 – Исходные данные к домашнему заданию

Номер бригады

Сообщение

1

AAABCD

 

 

2

DAAABC

 

 

3

CDAAAB

 

 

4

BCDAAA

 

 

5

ABCDAA

 

 

6

AABCDA

 

 

5 Лабораторное задание

5.1Ознакомиться с виртуальным макетом на рабочем месте. Для этого запустить программу 2.3 Исследование алгоритма сжатия дискретных со-

общений LZW, используя иконку Лабораторные работы на рабочем столе, а затем папки ТЭС и Модуль 2. Изучить схему макета на дисплее компьютера, пользуясь разд. 6. Уточнить с преподавателем план выполнения лабораторного задания.

5.2Проверить правильность выполнения домашнего задания. Вы-

брать закладку “ Сжатие сообщения”. Инициализировать словарь путем нажатия на кнопку "Инициализация словаря". После этого, в поле "Входные символы" ввести сообщение из домашнего задания. Для завершения введения сообщения необходимо нажать на кнопку "Завершить введение символов". Сжатие сообщения осуществляется в пошаговом режиме путем нажатия на кнопку "Начать сжатие". Каждое действие кодера объясняется в поле "Описание действия кодера". После завершения сжатия сообщения эта кнопка станет недоступной. Проверить правильность выполнения п. 4.2 домашнего задания. На любом шаге можно прекратить сжатие путем нажатия на кнопку "Очищение".

После того, как сообщение сжато, выбрать закладку "Декодирование сообщения". Осуществить инициализацию словаря, для чего нажать на кнопку "Инициализация словаря". Декодирование осуществляется в пошаговом режиме путем нажатия на кнопку "Начать декодирование". После завершения декодирования сообщения эта кнопка станет недоступной. Убедиться, что декодированное сообщение совпадает с заданным. На любом шаге можно прекратить декодирование путем нажатия на кнопку "Очищение".

64

5.3Исследовать процесс сжатия и декодирования сообщения. Выпол-

нить сжатие и декодирование сообщения, которое состоит из вашей фамилии и инициалов. Процесс сжатия оформить в виде табл. 2, а процесс декодирования

в виде табл. 3. Выполнить сжатие и декодирование сообщения "aaaaaaaaaaaaaaaaaaaaaaaaaaaa". Зафиксировать в протоколе процессы сжатия и декодирования в виде табл. 2 и 3 соответственно. Обратить внимание на ситуацию, когда длина строки становится равной максимальной длине строки NC.

5.4Исследовать зависимость коэффициента сжатия от типа сообще-

ния. Выбрать закладку "Коэффициент сжатия" и тип сообщения "Равновероят-

ные и независимые символы". Установить значения: длины сообщения N = 1000 символов; объема словаря МА = 512 строк; максимальной длины строки NC = 6 символов. Нажать на кнопку "Пуск" и зафиксировать в протоколе значения коэффициента сжатия. Повторить измерение коэффициента сжатия, если тип сообщения "Типичный текст" и "Документ Word". Сделать выводы относительно полученных результатов.

5.5Исследовать зависимость коэффициента сжатия от длины сооб-

щения. Выбрать тип сообщения "Типичный текст". Установить значения: объ-

ема словаря МА = 512 строк; максимальной длины строки NC = 6 символов. Измерить значение коэффициента сжатия сообщения длинами N: 1, 5, 10, 25, 50, 100, 200. Результаты измерений представить в виде таблицы η(N). Сделать выводы.

5.6Исследовать зависимость коэффициента сжатия от объема слова-

ря. Выбрать тип сообщения "Типичный текст" и установить длину сообщения

N = 5000 символов, максимальную длину строки в словаре NC = 6. Измерить значение коэффициента сжатия для объемов словаря MА: 512, 1024, 2048, 4096. Результаты измерений представить в виде таблицы η(МА). Сделать выводы.

5.7Исследовать зависимость коэффициента сжатия от максимальной

длины строки в словаре. Установить максимальную длину строки NC = 50 символов и повторить измерение п. 5.6. Результаты измерений представить в виде таблицы η(МА). Сделать выводы.

6 Описание лабораторного макета

Лабораторная работа выполняется на компьютере с использованием виртуального макета, структурную схему которого приведено на рис. 1.

65

Измеритель

коэффициента

Ручное введение сжатия η сообщения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кодер

 

 

Декодер

 

Генератор

 

 

 

 

 

 

сообщения

 

 

 

LZW

 

 

LZW

 

Установка:

 

 

 

 

 

 

 

 

 

 

 

 

 

Установка:

 

 

 

 

- типа сообщения;

 

 

 

 

 

 

 

 

 

 

MА, NС

 

 

 

 

- N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отображения Отображения Отображения

Рисунок 1 – Структурная схема макета

Макет в зависимости от пункта исследований автоматически переключается или в пошаговый режим, или в режим реального времени. Также в зависимости от пункта исследований включается ручное введение сообщения или генератор сообщения. Генератор сообщения позволяет выбирать один из двух типов сообщения и изменять длину сообщения N в пределах от 1 до 10000 символов. Реализация кодера позволяет выбирать одно из пяти значений объема словаря MА и изменять максимальную длину строки в словаре NC в пределах от 6 до

250.

7 Требования к отчету

7.1Название лабораторной работы.

7.2Цель работы.

7.3Результаты выполнения домашнего задания.

7.4Структурные схемы исследований и результаты выполнения п. 5.2...5.7 лабораторного задания (таблицы и графики с подписями).

7.5Выводы по каждому пункту задания, в которых предоставить анализ полученных результатов (совпадение теоретических и экспериментальных данных).

7.6Дата, подпись студента, виза преподавателя с оценкой по 100балльной системе.

66

Лабораторная работа 2.4 ДИСКРЕТИЗАЦИЯ ПЕРВИЧНЫХ СИГНАЛОВ ЭЛЕКТРОСВЯЗИ

1 Цель работы

Изучение процесса дискретизации непрерывных во временем сигналов и способа восстановления их по отсчетам. Анализ характеристик дискретных сигналов и факторов, которые вызывают погрешности при восстановлении непрерывных сигналов.

2 Ключевые положения

2.1 Дискретизация непрерывных по времени сигналов. Под дискретизацией непрерывного по времени сигнала s(t) понимают представление сигнала его мгновенными значениями (отсчетами) s(kTд), где k = …, – 1, 0, 1, 2, …; Tд – интервал дискретизации. Последовательность отсчетов на графиках изображают вертикальными линиями высотой s(kTд) каждая (рис. 1) и называют ее дискретным сигналом sд(t).

В реальных устройствах отсчет сигнала s(kTд) – это импульс с амплитудой s(kTд) и длительностью τ ≤ Tд, начинающийся в момент времени kTд (рис. 2). Но, обычно, τ << Tд. Устройство, формирующее отсчеты, называется дискретизатором. В случае τ << Tд дискретизатор – это ключ, который замыкает цепь от источника к нагрузке на время τ (рис. 3).

s(t)

s(t)

ψ(t)

Тд

s(д)

sд(t)

kТд

Рисунок 1 – Процесс получения дискретного сигнала

t

t

 

 

ψ(t)

 

 

 

τ

 

 

 

 

 

 

t

 

 

 

 

 

Тд

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

sд(t)

t

kTд

t

Рисунок 2 – Процесс дискретизации в реальных устройствах

ψ(t)

s(t)

 

sд(t)

 

 

 

 

Рисунок 3 – Дискретизатор

 

67

Аналитическое выражение дискретного сигнала sд(t):

 

 

sд(t) = s(t) y(t) = s(t) p (t -kTд) ,

(1)

k = −∞

где y(t) – последовательность отсчетных импульсов, определяющая моменты времени, в которые берутся отсчеты сигнала, и их длительность;

р(t) – отсчетный импульс:

 

1

для

0 ≤ t < τ,

р(t) =

 

 

(2)

0

для

t < 0, t ³ t.

2.2 Спектр дискретного сигнала. Преобразование Фурье правой части выражения (1) определяет спектральную плотность Sд(j2pf) дискретного сигнала (соответствующие математические выкладки можно найти в [1, с. 37, 38]):

 

 

 

 

 

Sд(j2pf) = an S ( j2p( f - nfд )) , – ¥ < f < ¥,

(3)

n = −∞

 

 

 

 

 

где fд = 1/ Tд – частота дискретизации;

 

 

an =

τ

×

sin n p fд t

(4)

Tд

n p fд t

 

 

 

 

коэффициенты разложения импульса р(t) в ряд Фурье; поскольку t << Tд, то для малых значений n коэффициенты практически не зависят от n, т.е. an = t/Тд;

S(j2pf) – спектральная плотность непрерывного сигнала s(t).

Из выражения (3) вытекает, что спектр дискретного сигнала – это сумма спектров S(j2pf) непрерывного сигнала s(t), смещенных на величину fд и убывающих с увеличением n согласно выражению (4).

Для первичных сигналов электросвязи характерно, что их спектры прилегают к нулевой частоте. На рис. 4, а приведен амплитудный спектр произвольной формы S(f) первичного сигнала, который простирается до максимальной частоты Fmax. Дальше на рис. 4 изображенные амплитудные спектры сигналов, которые могут иметь место при дискретизации сигнала со спектром, приведенным на рис. 4, а:

рис. 4, б

спектр Sψ(f) последовательности отсчетных импульсов y(t), по-

строенный на основе представления y(t) рядом Фурье:

 

 

y(t) = an ×cos 2pnfдt;

 

n = 0

рис. 4, в

спектр Sд(f) дискретного сигнала, когда fд > 2Fmax;

рис. 4, г

спектр Sд(f), когда fд = 2Fmax;

рис. 4, д

спектр Sд(f), когда fд < 2Fmax.

2.3 Восстановление сигналов по их отсчетам. Согласно теореме Котельникова любой сигнал с ограниченным спектром можно точно восстановить

68

(интерполировать) за его отсчетам, взятыми через интервал Tд £ 1/(2Fmax), где Fmax – максимальная частота спектра сигнала.

S(f)

0

Sψ(f)

0

Sд(f)

0

Sд(f)

0

Sд(f)

0

Fmax

a

f

 

 

 

 

fд

2fд

f

б

АЧХ идеального ФНЧ

f

 

 

2ffд

f

 

д

 

д

 

 

 

 

 

в

fд

г

2fд

f

 

 

 

fд

д

2fд

f

 

 

 

 

 

 

Рисунок 4 – Спектральные диаграммы, иллюстрирующие процессы дискретизации и восстановления непрерывных сигналов

В справедливости теоремы Котельникова легко убедиться, рассмотрев

рис. 4, в, г, д. Если fд ³ 2 Fmax (рис. 4, в, г), то после подачи дискретного сигнала на вход идеального ФНЧ с частотой среза Fmax £ Fср £ fд Fmax на выходе получим сигнал со спектром S(f) (рис. 4, в, г), т.е. восстановленный непрерывный сигнал. На рисунках штриховыми линиями показана АЧХ идеального ФНЧ с

частотой среза Fср = Fmax. Если же fд < 2Fmax, то, как видно из рис. 4, д, невозможно выделить спектр S(f), поскольку имеет место перекрытие спектров.

69

Процесс восстановления непрерывного сигнала по его отсчетам можно трактовать и во временной области. Если для восстановления сигнала используется идеальный ФНЧ с частотой среза Fср, то его импульсный отклик (без учета задержки в фильтре):

g(t) =

sin 2 p Ft

.

(5)

 

 

2p Ft

 

Поскольку отсчетные импульсы короткие (t << Tд) (приближаются к d- функции), то можно считать, что отклик ФНЧ на импульс с амплитудой s(kTд), поданный в момент t = kTд, имеет вид

 

 

 

sin (2 π F(t kTд ))

 

 

s(kTд) =

 

 

 

 

 

.

 

 

(6)

 

 

2pF(t - kTд )

 

 

 

 

 

 

 

 

 

Если подать на вход ФНЧ сигнал sд(t), на его выходе получим сумму от-

кликов

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

sin(2 π F(t kTд ))

 

s (t) = s(kTд ) ×

 

 

.

 

(7)

 

 

 

k = −∞

 

 

 

2 pF(t - kTд )

 

Сравним это выражение с рядом Котельникова, являющимся математи-

ческим выражением теоремы Котельникова,

 

 

 

 

 

 

 

 

sin(2 p Fmax (t - kTд ))

 

s(t) =

s(kTд ) ×

 

 

 

.

(8)

 

2 p Fmax (t

 

 

k = −∞

 

 

 

- kTд )

 

Если Fср = Fmax, то s(t) =

s (t), т.е. имеет место точное восстановление не-

 

 

ˆ

 

 

 

 

 

 

 

прерывного сигнала.

2.4 Погрешности, которые возникают при восстановлении сигналов. 2.4.1 Неограниченность спектров реальных сигналов. Реальных сигналов

со строго ограниченным спектром не существует, поскольку сигналы с конечной длительностью имеют неограниченные спектры – когда f ® ¥, спектры убывают с конечной скоростью. Для реальных сигналов максимальная частота спектра Fmax определяется из условия, что составляющие с частотами f > Fmax малые (в определенном смысле). В спектрах реальных дискретных сигналов возникает перекрытие спектров, по крайней мере, составляющих суммы (3) с индексами n = 0 i n = 1 (рис. 5). Предположим, что для восстановления непрерывного сигнала используется идеальный ФНЧ с частотой среза Fср = Fmax, его АЧХ показана пунктирной линией на рис. 5. Восстановленный сигнал будет иметь две составляющие погрешности восстановления:

– линейные искажения за счет отсечения составляющих сигнала s(t) с

частотами f > Fmax;

– наложение составляющих спектра S(f fд) с частотами f < Fmax на спектр сигнала s(t) (погрешность наложения спектров).

С учетом сказанного значения Fmax и fд определяют из условия, чтобы погрешность восстановления была достаточно малой.

70

Sд(f)

 

 

 

n = 0

n = 1

 

 

 

 

Fmax

f =2F

max

f

 

д

 

Рисунок 5 – Иллюстрация возникновения погрешности восстановления непрерывного сигнала из-за неограниченности спектра непрерывного сигнала

2.4.2 Отклонение характеристик реального ФНЧ от идеального. В идеального ФНЧ АЧХ имеет прямоугольную форму, а ФЧХ – линейную. Т.е., идеальный ФНЧ без искажений пропускает все составляющие спектра сигнала в пределах полосы пропускания, когда f < Fср, и полностью ослабляет составляющие с частотами f > Fср. Реальные ФНЧ описываются граничной частотой полосы пропускания Fпп и граничной частотой полосы задерживания Fпз (рис. 2.6, б).

Если ФНЧ предназначен для восстановления непрерывного сигнала с максимальной частотой Fmax из дискретного сигнала с частотой дискретизации

fд, то необходимо, чтобы Fпп ³ Fmax и Fпз £ fд Fmax. В случае реальных ФНЧ могут возникать две составные погрешности восстановления:

через непостоянство АЧХ и нелинейность ФЧХ в полосе пропускания фильтр вносит линейные искажения в восстановленный сигнал;

через недостаточное ослабление в полосе задержания ФНЧ пропускает

составляющие сигнала sд(t) с частотами f > fд Fmax, которые образуют погрешность наложения спектров.

Реальные ФНЧ для восстановления непрерывных сигналов проектируют так, чтобы погрешность восстановления была достаточно малой.

H(f)

H(f)

0

Fср

f

0

Fпп

Fпз

f

 

а

 

 

 

б

 

 

Рисунок 6

АЧХ: а – идеального ФНЧ; б – реального ФНЧ

 

3 Ключевые вопроса

3.1Объяснить физическую суть дискретизации по времени непрерывных

сигналов.

3.2С какой целью выполняется дискретизация непрерывных сигналов?

3.3Объяснить связь спектров непрерывного и дискретного сигналов.

3.4Объяснить физическую суть процесса восстановления сигнала по от-

счетам.

3.5Сформулировать теорему Котельникова.

3.6Записать ряд Котельникова для сигнала с ограниченным спектром.