
- •2. Цифровые методы обработки и передачи звуковых сообщений
- •2.1. Особенности представления звуковых сообщений в цифровой форме
- •2.2. Классификация методов и показатели качества компрессии сигналов при передаче звука
- •2.3.Кодеры формы
- •2.3.2. Дифференциальная импульсно-кодовая модуляция (дикм)
- •2.4.Вокодеры
- •2.4.1. Принципы вокодерного кодирования
- •2.4.2. Некоторые особенности процесса речеобразования, учитываемые в вокодерах
- •2.4.3. Метод линейного кодирования с предсказанием
- •2.5. Гибридные кодеры
2.3.2. Дифференциальная импульсно-кодовая модуляция (дикм)
Обычно между двумя соседними отсчетами сигнала существует определенная взаимосвязь, которую в радиотехнике обозначают термином корреляция. Это справедливо для всех сигналов за исключением так называемого белого шума, отсчеты которого некоррелированы. Степень корреляции между отсчетами возрастает с ростом частоты дискретизации. Наличие корреляции указывает на наличие избыточности в сигнале.
Учитывая корреляцию между отсчетами, можно сжать сигнал по сравнению с обычной ИКМ. Самый распространенный метод кодирования, основанный на учете корреляции между отсчетами, - ДИКМ-кодирование.
При ДИКМ кодируют и передают по каналу не сам отсчет (как в ИКМ), а разность (или ошибку) между текущим отсчетом и предварительной оценкой (предсказанным значением) этого отсчета, полученной из анализа предыдущих отсчетов
ε(n)=s(n)-sпредск.(n). (2.8)
Чем точнее осуществляется предсказание очередного отсчета, тем меньше по величине разностный сигнал и, следовательно, тем меньшее количество разрядов потребуется для его кодирования в цифровом виде. В качестве сигнала предсказания можно использовать либо предыдущий отсчет s(n-1), либоMпредшествующих отсчетов, что позволяет повысить точность предсказания:
, (2.9)
где ci– коэффициенты.
Типовой вариант реализации метода ДИКМ
приведен на рис.2.5.
.
На приемной стороне (рис.2.5,б) восстановление исходного сообщения осуществляется на основе соотношения
s*(n) = ε*(n)+ s*предск.(n).
Эффективность метода ДИКМ может быть повышена путем перехода к адаптивной дифференциальной импульсно-кодовая модуляции (АДИКМ). При этом производится автоматическое регулирование величины шага квантования сигнала ошибки предсказания, а также автоматическая подстройка коэффициентов ci в (2.9) в соответствии с изменением текущего спектра передаваемого сообщения. Для этого как в передающее, так и в приемное устройства вводятся дополнительные цепи автоматической регулировки усиления и подстройки параметров предсказателя на основе статистического оценивания параметров передаваемого сообщения.. Этот алгоритм дает практически такое же качество воспроизведения речи, как и ИКМ, однако для передачи информации при его использовании требуется полоса всего в 32 кбит/с. Алгоритм АДИКМ был принят в качестве международного стандарта G.726 в 1984 г.
2.4.Вокодеры
2.4.1. Принципы вокодерного кодирования
Вокодерыпредназначены для кодирования
исключительно речевого сигнала. При их
построении максимально учитывают
особенности образования речи и ее
восприятия человеком. Форма восстановленного
сигнала при этом может радикально
отличаться от формы исходного сигнала.
В качестве примера на рис. 2.6 приведены
осциллограммы двух сигналов, внешне
весьма различных. Тем не менее, при их
воспроизведении человек не заметит
разницы. Дело в том, что спектральный
состав обоих сигналов одинаков: они
являются суммой синусоиды и ее третьей
гармоники. Различны лишь значения
начальной фазы третьей гармоники. Органы
слуха человека не реагируют на фазовые
соотношения.
Рис. 2.6.
Задача ИКМ, ДИКМ, АДИКМ и других аналогичных им методов - максимального точно передать информацию о форме сигнала. Именно поэтому эти методы кодирования называют кодированием формы. Задача вокодерной обработки другая - обеспечить, чтобы восстановленный сигнал звучал как можно более сходно с исходным сигналом.
Принципиальное отличие вокодерного кодирования от кодирования формы состоит в том, что по каналу связи передают не сам сигнал, а параметры модели его образования. На приемном конце восстановленный сигнал синтезируют.
Существует большое число идей построения вокодеров. Например, в канальных или полосовых вокодерах спектр речи делят на 7 - 20 полос (каналов) аналоговыми или цифровыми полосовыми фильтрами. Большее число каналов дает большую натуральность и разборчивость. С каждого полосового фильтра сигнал поступает на детектор и фильтр низких частот. На приемный конец раз в 20 мс передают информацию об уровне сигнала в каждом канале. Синтезатор речи представляет собой набор синусоидальных генераторов и регулируемых аттенюаторов, устанавливающих требуемые соотношения между амплитудами колебаний разных частот. Передача информации об уровне сигнала в каждом канале возможна в аналоговом или цифровом виде.
В фонемных вокодерах используют тот факт, что речь передается ограниченным числом слогов - фонем. Например, русский язык использует 42 фонемы. Выполняя фонемный анализ речи, можно периодически (например один раз в 20 мс) передавать на приемный конец номер соответствующей фонемы, закодированный 6 битами, а также информацию об уровне сигнала (еще 6 бит). Таким образом, скорость цифрового потока составит (6+6)/20=0,6 кбит/c. На приемном конце синтезатор воспроизводит соответствующую фонему, извлекая ее из памяти. Известны и другие принципы вокодерного кодирования. Хотя первые вокодеры были предложены в 30-е годы, до начала 80-х годов качество восстанавливаемой речи было крайне низким. Область применения вокодеров ограничивалась линиями командной связи, речевого управления и говорящими автоматами информационно-справочных служб. При этом достигалась низкая скорость передачи (порядка 0,6 - 4 кбит/c).
Прогресс вокодеров в 80-е и 90-е годы непосредственно связан с новыми возможностями цифровой обработки сигналов и микропроцессорной техники. С другой стороны, он явился ответом на потребности быстро развивающегося рынка массовых цифровых систем подвижной радиосвязи, в частности сотовых систем.
Вокодеры используют достаточно сложные алгоритмы обработки речевых сигналов и по этой причине выполняются на основе цифровых сигнальных процессоров (ЦСП). Производительность ЦСП обычно оценивают в миллионах операций в секунду. Вокодеры, использующие ЦСП, способные выполнять 15 млн. операций в секунду, относятся к низкопроизводительным, если указанный параметр превышает 30 млн. операций в секунду, то такие вокодеры считаются выскопроизводительными.