3.3.7 Кратковременный спектр

Спектр речи, показанный на рис. 3.24, усреднен за большой период времени. В течение более коротких периодов времени спектры существенно изменяются и в них становятся видны структуры, специфические для звуков с пиками энергии (резонансами) на одних частотах и провалами энергии – на других. Частоты, на которых возникают резонансы, называются частотами формант, или просто формантами. Гласные и звонкие согласные звуки речи обычно содержат от трех до четырех четко определяемых формант. Эти свойства кратковременного спектра иллюстрирует спектрограмма на рис. 3.25. Спектрограмма – это представление энергии речи в виде функции времени и частоты. Горизонтальная ось представляет время, вертикальная – частоту, а яркость отметки соответствует уровню энергии. Таким образом, более темные участки на рис. 3.25 указывают на относительно высокий уровень энергии (форманты) в конкретный момент времени.

Кодеры речи в частотной области улучшают эффективность преобразования за счет кодирования наиболее важных компонент спектра на динамической основе. С изменением звуков кодируются различные части (форманты) полосы частот. Период между сменами формант в типовом случае составляет от 10 до 20 мс. Некоторые высококачественные вокодеры вместо использования периодических изменений спектра непрерывно с высокой скоростью следят за постепенным изменением спектра. Вокодеры в частотной области часто требуют меньшей скорости передачи, чем кодеры во временной области, но обычно создают речь с менее натуральным звучанием.

3.4 Дифференциальная импульсно-кодовая модуляция

Дифференциальная импульсно-кодовая модуляция (ДИКМ) специально разработана для реализации преимуществ, которые дает использование корреляции между дискретами в типовом речевом сигнале. Поскольку диапазон разностей значений дискретов меньше диапазона самих значений дискретов, для кодирования разности величин дискретов требуется меньше разрядов. Частота дискретизации часто берется той же, что и в сравниваемой ИКМ-системе. Вследствие этого ограничивающий полосу фильтр в кодере и сглаживающий фильтр в декодере в основном такие же, как и в обычных ИКМ-системах.

Простейшими средствами получения разности значений дискретов для ДИКМ-кодера являются запоминание предыдущего входного дискрета непосредственно в аналоговой памяти и использование аналогового вычитающего устройства для измерения изменения. Изменения сигнала затем квантуются и кодируются для передачи. Однако структура системы с ДИКМ, показанная на рис. 3.26, является более сложной, так как предыдущая входная величина восстанавливается с помощью цепи обратной связи, в которой накапливаются кодированные разности значений дискретов. По существу, сигнал в цепи обратной связи представляет собой оценку входного сигнала, которая получена путем интегрирования кодированных разностей дискретов. Вследствие этого сигнал обратной связи, полученный таким же образом, используется в декодере для восстановления формы исходного сигнала.

Преимущество реализации с цепью обратной связи состоит в том, что при этом ошибки квантования не накапливаются неограниченно. Если сигнал в цепи обратной связи отклоняется от входного в результате накопления ошибок квантования, то при следующей операции кодирования разностного сигнала это отклонение автоматически компенсируется. В системе без обратной связи выходной сигнал, формируемый декодером на противоположном конце линии, может неограниченно накапливать ошибки квантования.

Как и в системах с ИКМ, процесс аналого-цифрового преобразования может осуществляться с компандированием и без него. В некоторых из систем с ДИКМ используют также технику адаптации для подстройки размеров шагов квантования в соответствии с уровнем средней мощности сигнала. (См. обзор различных способов в [18].) Эти способы адаптации часто называют слоговым компандированием в соответствии с интервалом времени между подстройками усиления. Слоговое компандирование рассматривается в разделе, посвященном системам дельта-модуляции, где оно наиболее часто применяется.

Пример 3.4Качество устройства, преобразования речи в цифровую форму иногда измеряется с помощью синусоидального колебания с частотой 800 Гц, используемого как типовой испытательный сигнал. Предполагая, что имеется система с ИКМ и равномерным квантованием, способная кодировать синусоиду в заданном динамическом диапазоне, определим, сколько разрядов на дискрет можно сэкономить, используя систему с ДИКМ и равномерным квантованием.

Решение. По существу, решение состоит в определении того, во сколько раз уменьшается динамический диапазон разностного сигнала по сравнению с динамическим диапазоном исходного сигнала. Предположим, что амплитуда синусоиды равнаА,так что

x(t)=-A sin2800t.

Амплитуду разностного сигнала можно получить путем дифференцирования и умножения на временной интервал между дискретами

dx/dt=A2800cos2800t;

|x(t)|_max=A2800/8000=0,628 А.

Экономию числа разрядов на дискрет можно определить как

log₂(1/0,628)=0,67 разряда.

Пример 3.4 показывает, что при одинаковом качестве в системе с ДИКМ можно использовать на 2/3 разряда меньше, чем в системе с ИКМ. В типовом случае система с ДИКМ уменьшает размер кодовой комбинации на один полный разряд. Может быть получена и большая экономия, поскольку в среднем сигналы речи имеют меньшую крутизну, чем тон с частотой 800 Гц (см. рис. 3.24).

<<< < Предыдущая 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 5657 / 6357 58 59 60 61 62 63 > Следующая >>>

Соседние файлы в папке METOD

#
07.02.2016518.14 Кб17lab4.doc
#
07.02.2016204.8 Кб16lab5.doc
#
07.02.2016147.46 Кб16lab6.doc
#
07.02.20161.81 Mб54zstm-rus.doc
#
07.02.20162.26 Mб18zstm-ukr-met.doc
#
07.02.20162.18 Mб231Сведения--zстm.doc