Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
CSTM / METOD / Сведения--zстm.doc
Скачиваний:
231
Добавлен:
07.02.2016
Размер:
2.18 Mб
Скачать

3.3.7 Кратковременный спектр

Спектр речи, показанный на рис. 3.24, усреднен за большой период времени. В течение более коротких периодов времени спектры существенно изменяются и в них становятся видны структуры, спе­цифические для звуков с пиками энергии (резонансами) на одних частотах и провалами энергии – на других. Частоты, на которых возникают резонансы, называются частотами формант, или просто формантами. Гласные и звонкие согласные звуки речи обычно со­держат от трех до четырех четко определяемых формант. Эти свойства кратковременного спектра иллюстрирует спектрограмма на рис. 3.25. Спектрограмма – это представление энергии речи в виде функции времени и частоты. Горизонтальная ось представляет время, вертикальная – частоту, а яркость отметки соответствует уровню энергии. Таким образом, более темные участки на рис. 3.25 указы­вают на относительно высокий уровень энергии (форманты) в кон­кретный момент времени.

Кодеры речи в частотной области улучшают эффективность пре­образования за счет кодирования наиболее важных компонент спект­ра на динамической основе. С изменением звуков кодируются раз­личные части (форманты) полосы частот. Период между сменами формант в типовом случае составляет от 10 до 20 мс. Некоторые высококачественные вокодеры вместо использования периодических изменений спектра непрерывно с высокой скоростью следят за по­степенным изменением спектра. Вокодеры в частотной области часто требуют меньшей скорости передачи, чем кодеры во временной об­ласти, но обычно создают речь с менее натуральным звучанием.

3.4 Дифференциальная импульсно-кодовая модуляция

Дифференциальная импульсно-кодовая модуляция (ДИКМ) спе­циально разработана для реализации преимуществ, которые дает использование корреляции между дискретами в типовом речевом сигнале. Поскольку диапазон разностей значений дискретов меньше диапазона самих значений дискретов, для кодирования разности ве­личин дискретов требуется меньше разрядов. Частота дискретизации часто берется той же, что и в сравниваемой ИКМ-системе. Вследст­вие этого ограничивающий полосу фильтр в кодере и сглаживающий фильтр в декодере в основном такие же, как и в обычных ИКМ-системах.

Простейшими средствами получения разности значений дискретов для ДИКМ-кодера являются запоминание предыдущего входного ди­скрета непосредственно в аналоговой памяти и использование анало­гового вычитающего устройства для измерения изменения. Измене­ния сигнала затем квантуются и кодируются для передачи. Однако структура системы с ДИКМ, показанная на рис. 3.26, является более сложной, так как предыдущая входная величина восстанав­ливается с помощью цепи обратной связи, в которой накапливаются кодированные разности значений дискретов. По существу, сигнал в цепи обратной связи представляет собой оценку входного сигнала, которая получена путем интегрирования кодированных разностей дискретов. Вследствие этого сигнал обратной связи, полученный та­ким же образом, используется в декодере для восстановления формы исходного сигнала.

Преимущество реализации с цепью обратной связи состоит в том, что при этом ошибки квантования не накапливаются неогра­ниченно. Если сигнал в цепи обратной связи отклоняется от входного в результате накопления ошибок квантования, то при следующей операции кодирования разностного сигнала это отклонение автомати­чески компенсируется. В системе без обратной связи выходной сигнал, формируемый декодером на противоположном конце линии, может неограниченно накапливать ошибки квантования.

Как и в системах с ИКМ, процесс аналого-цифрового преоб­разования может осуществляться с компандированием и без него. В некоторых из систем с ДИКМ используют также технику адапта­ции для подстройки размеров шагов квантования в соответствии с уровнем средней мощности сигнала. (См. обзор различных способов в [18].) Эти способы адаптации часто называют слоговым компан­дированием в соответствии с интервалом времени между подстройка­ми усиления. Слоговое компандирование рассматривается в разделе, посвященном системам дельта-модуляции, где оно наиболее часто применяется.

Пример 3.4Качество устройства, преобразования речи в цифровую форму иногда измеряется с помощью синусоидального колебания с частотой 800 Гц, используемого как типовой испытательный сигнал. Предполагая, что имеется система с ИКМ и равномерным квантованием, способная кодировать синусоиду в заданном динамическом диапазоне, определим, сколько разрядов на дискрет можно сэкономить, используя систему с ДИКМ и равномерным квантованием.

Решение. По существу, решение состоит в определении того, во сколько раз уменьшается динамический диапазон разностного сигнала по сравнению с динами­ческим диапазоном исходного сигнала. Предположим, что амплитуда синусоиды рав­наА,так что

x(t)=-A sin2800t.

Амплитуду разностного сигнала можно получить путем дифференцирования и умножения на временной интервал между дискретами

dx/dt=A2800cos2800t;

|x(t)|max=A2800/8000=0,628 А.

Экономию числа разрядов на дискрет можно определить как

log2(1/0,628)=0,67 разряда.

Пример 3.4 показывает, что при одинаковом качестве в системе с ДИКМ можно использовать на 2/3 разряда меньше, чем в системе с ИКМ. В типовом случае система с ДИКМ уменьшает размер кодовой комбинации на один полный разряд. Может быть получена и большая экономия, поскольку в среднем сигналы речи имеют меньшую крутизну, чем тон с частотой 800 Гц (см. рис. 3.24).

Соседние файлы в папке METOD