Добавил:
linker.pp.ua Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Рихтер ОБРАБОТКИ ИНФОРМАЦИИ В СИСТЕМАХ СВЯЗИ.doc
Скачиваний:
76
Добавлен:
15.12.2018
Размер:
3.49 Mб
Скачать
  1. Основы цифрового представления речевых сигналов: импульсно-кодовая модуляция

Под цифровым представлением речевых сигналов (РС) будем понимать их аналого-цифро­вое преобразование (АЦП). Первый шаг при АЦП РС состоит в его периодической дискретизации - замене непрерывной функции её дискретными значениями. Процесс базируется на теореме отсчетов (теорема В.А. Котельникова), в соответствии с кото­рой произвольный сигнал со спектром, ограниченным некоторой частотой Fв, может быть полностью восстановлен (т.е. преобразован в ана­логовую форму с помощью линейной интерполяции) по последовательности своих отсчетов, следующих с интервалом времени Тд = 1 / (2Fв). Здесь Fв - наивысшая частота спектра (ширина полосы) входного сигнала. Обычно за наивысшую частоту спектра (называемую частотой Найквиста) принимают частоту, ниже которой максимумы спектра имеют уровень не более – 40 дБ. На практике неискаженная передача непрерывного (аналогового) сигнала с полосой частот, ограниченной значением Fв, дискретной последовательностью его отсчетов возможна, если Fд = kFв, где k2, а для восстановления используется идеальный фильтр (рис. 7.1). Метод, представленный на этом рисунке, называют обычно амплитудно-импульсной моду­ляцией (АИМ).

Рис. 7.1. Иллюстрация процедуры дискретизации аналогового сигнала

В соответствии с описанием гласных и фрикативных звуков РС не ограничен по полосе частот, хотя его спектр быстро спадает в области высоких частот. На рис. 7.2 изображены спектры ти­пичных звуков речи. Видно, что для вокализованных звуков наивысшая частота, ниже которой максимумы спектра меньше уровня -40 дБ, состав­ляет около 4 кГц. С другой стороны, для невокализованных звуков спектр не затухает даже на частотах выше 8 кГц. Таким образом, для точного воспроизведения всех звуков речи требуется частота дискретизации около 20 кГц. В большинстве приложений такая частота дискретизации, однако, не требуется. Например, если дискретизация предшествует оцениванию трех первых формантных частот вокализованной речи, то достаточно рас­полагать частью спектра до частоты около 3,5 кГц. Следовательно, если перед дискретизацией РС пропускается через ФНЧ так, что Fв = 4 кГц, то частота дискретизации должна составлять 8 кГц.

Этот результат поясняет рис. 7.3, где представлен спектр входного сигнала и результирующий спектр импульсной последовательности АИМ сиг­нала, состоящий из дискретных гармоник частоты дискретизации. Входной сигнал модулирует каждую из этих гармоник отдельно. В результате этого создаются две бо­ковые полосы около каждой дискретной частоты в спектре импульсной пос­ледовательности. ФНЧ, восстанавливающий исходный сигнал, рассчитывает­ся на подавление всех частот, кроме частот исходного сигнала. Как по­казано на рис.7.3, такой фильтр должен иметь частоту среза, которая расположена между Fв и FдFв. Следовательно, разделение возможно, если выполняется не­равенство Fд > 2 Fв.

Входной сигнал пе­ред дискретизацией должен быть ограничен по полосе, чтобы можно было удалить из него составляющие с частотой выше, чем Fд/2, даже если эти­ми составляющими, как неслышимыми, можно было бы пренебречь. Таким образом, полная АИМ-система должна иметь фильтр, ограничивающий полосу сигнала перед дискретизацией, для гарантии того, что никакие ложные или свя­занные с источником сигналы не приведут к появлению помех в требуемой полосе вследствие наложения спектров после дискретизации. Поэтому этот фильтр часто называют фильтром защиты от перекрытия спектров.

Рис. 7.2. Спектры ти­пичных звуков речи

Второй шаг в процессе АЦП состоит в квантовании, когда непрерывному множеству мгновенных значений отсчетов аналогового сигнала ставят в соответствие конечное множество значений - уровней квантования. Набор разрешенных уровней квантования называется шкалой квантования. Расстояние между разрешенными уровнями - это шаг квантования . Разность  между исходным и квантованным сигналами называется ошибкой или шумом квантования. Мощность шумов квантования при наличии сигнала не зависит от сигнала и определяется шагом квантования: Рш.кв = 2 / 12.

Для передачи квантованные по амплитуде отсчеты преобразуются в двоичные кодовые комбинации - кодовые слова, которые передаются затем в виде потока двоичных импульсов - бит. Эта операция на­зывается кодированием. Необходимое число разрядов для кодирования m при заданном максимальном числе уровней шкалы кван­тования nмакс определяется из выражения m = log2nмакс. В цифровых системах связи и веща­ния распространены двоичные симметричные коды, характеризуемые тем, что первый символ (т.е. старший значащий бит) кодовой комбинации определяется по­лярностью кодируемого отсчета сигнала, а остальные символы несут ин­формацию об абсолютном значении отсчета.

Рис. 7.3. Спектры входного сигнала и импульсной последовательности АИМ сиг­нала

При цифровой передаче сиг­налов речи по ТФ каналам общепринятой является Fд = 8 кГц, а число двоичных разрядов АЦП обычно выбирается равным m = 8, включая знаковый разряд. Поэтому диапа­зон чисел (исключая ноль) на выходе АЦП составляет от -127 до +127. В результате на выходе АЦП формируется последовательность 8-раз­рядных кодовых слов (т.е. 8-битовых чисел), следующих с частотой 8 кГц. Следова­тельно, цифровая скорость передачи сигнала на выходе АЦП составляет

Rц = Fдm = 8  8 = 64 кбит/с. (7.1)

Эта величина представляет собой информационный объем цифрового предс­тавления РС (система ИКМ-64), который необходимо знать при его передаче или хранении.

На приемной стороне линии цифровой передачи в декодере битовый поток восстанавливается и формируются величины квантованных отсчетов. Затем для интерполяции между величинами отсчетов и восстановления исходной формы сигнала используется ФНЧ. Декодер и ФНЧ образуют цифро-аналоговый преобразователь (ЦАП). Если ошибок в передаче не было, то сигнал на выходе идентичен входному - за исключением шума квантования Рш.кв. Структурная схема системы ИКМ приведена на рис. 7.4.

Fд

ФНЧ

Дискретизатор

Квантователь

Кодер

Канал ТЧ ИКМ - канал

ФНЧ

Декодер

Рис. 7.4. Структурная схема системы ИКМ

Искажения (шум) квантования, возникающие при преобразовании ана­логового сигнала в цифровую форму, обычно выражаются в виде отношения средних мощностей сигнала и шума, т.е. отношения сигнал-шум квантования (ОСШК) Рсш.кв. ОСШК, выраженное в децибелах, при равномерном квантовании определяется соотношением:

Рс / Рш.кв = 6m + 4,8 – 20 lg Q, дБ, (7.2)

где Q – значение пик-фактора сигнала. Отсюда имеем:

  • для гармонического сигнала (Q = 2) Рс / Рш.кв = 6m + 1,8, дБ;

  • для речевого сигнала (Q = 12 дБ) Рс / Рш.кв = 6m – 7,2, дБ.

Система ИКМ с линейным квантованием практически не применяется, поскольку для достижения приемлемо­го качества восприятия восстановленного речевого сигнала при равно­мерном квантовании необходимо обеспечить m ≥ 12. Столь большое число уровней квантования nмакс = 212 при Fд = 8 кГц требует, чтобы скорость Rц передачи символов в канале была не менее 96 кбит/с. Для существенного уменьшения скорости Rц цифрового потока прибегают к нелинейному квантованию (рис. 7.5а) в процессе мгновенного компандирования (МК), когда на передающей стороне РС подвергают компрессии по логарифмическому закону, а на приемной осуществляют обратную операцию – экспандирование с помощью экспоненциального преобразования. При МК устраняется психофизическая избыточность, определяемая низкой заметностью искажений квантования на фоне сильного сигнала.

В электросвязи используется ИКМ с компандированием либо по  - закону, либо по А - закону; характеристика компрессии по  - закону приведена на рис. 7.5б для разных значений коэффициента сжатия. Обычно используют  = 30; 100; 255 или А = 87,6. Структурная схема системы ИКМ с МК дополняется элементами логарифмического компандера (рекомендация ITU-T G.711, 1960 г.). Так, можно либо компрессировать исходный сигнал по логарифмическому закону с последующим равномерным квантованием при сравнительно малом числе уровней (например, при m = 8), либо компрессировать предварительно преобразованный в цифровую форму сигнал при срав­нительно большом исходном числе уровней квантования (например, при m = 12) с последующим преобразованием к восьмиразрядному коду (m = 8). Результатом преобразования является двоичная последова­тельность, передаваемая со скоростью Rц = 64 кбит/с.

Рис. 7.5. Принцип нелинейного квантования (а) и характеристики компрессии по  - закону (б)

Из-за трудностей реализации неравномерного квантования с аналоговыми компрессорами переходят к цифровым, у которых плавная характеристика компрессии заменяется линейно-ломанной аппроксимирующей функцией с различным числом сегментов.