Добавил:
linker.pp.ua Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Рихтер ОБРАБОТКИ ИНФОРМАЦИИ В СИСТЕМАХ СВЯЗИ.doc
Скачиваний:
76
Добавлен:
15.12.2018
Размер:
3.49 Mб
Скачать

6. Передача речевых сигналов по сетям связи

Рассмотрим общую модель цифровой системы связи, представленную на рис. 6.1. Структура системы определяет необходимые процедуры обработки речевого сигнала, а её характе­ристики - основные свойства СПРС и прежде всего – энергетические и спектральные.

Рис. 6.1. Модель цифровой системы связи

Источник сообщения генерирует сообщения, представляющие собой либо непрерыв­ные функции от времени, либо потоки дискретных сигналов. Пример непрерыв­ного во времени сообщения - волновой сигнал, передающий человеческую речь. Чтобы передать такой аналоговый сигнал через цифровую систему связи, его не­обходимо преобразовать в цифровую форму. С этой целью сигнал последовательно подвергается аналого-цифровому преобразованию (АЦП) и кодированию с устранением избыточности в кодере источника. Хороший кодер источника «подгоняет» длину двоичных последовательно­стей под статистические свойства источника сообщений. В случае передачи речевого сигнала, кодер источника принято называть коде­ром речи. Важной характеристикой сигнала, преобразованного в цифровую форму, является цифровая скорость передачи (скорость цифрового представления), измеряемая числом формируемых на выходе АЦП двоичных символов в единицу времени - Rц, бит/с. В результате сжатия информации коде­ром речи скорость цифрового потока многократно уменьшается при сохранении приемлемого качества передачи речи.

На следующем этапе компактно представленный речевой сигнал подвергается ряду преобразований, основное из которых – помехоустойчивое (избыточное) кодирование. Дело в том, что некоторые физические явления, происходящие в каналах связи, приводят к возникновению ошибок при приеме сигналов. Эти ошибки можно представить как разность переданной и восстановленной из принятого сигнала двоичными после­довательностями. Для того чтобы обнаружить и по возможности исправить ошибки, применяются канальный кодер в передатчике и канальный декодер в приемнике. К информационным блокам добавляется определенное число вы­бранных особым образом дополнительных битов. Значения этих битов рассчи­тываются путем сложения по модулю двух информационных битов, подбираемых таким образом, чтобы между ними существовала алгебраическая взаимосвязь, позволяющая обнаружить и скорректировать возможные ошибки.

Следующая процедура преобразования речевого сигнала на передающей стороне канала связи – модуляция, которой на приемной стороне соответствует демодуляция. Модем, реализующий эти процедуры, является своеобразным интерфейсом, согласующим дискретную часть системы с её непрерывной частью, которая представлена на рис. 6.1 радиоблоком и физическим каналом. Модулятор - это блок, формирующий синусоидальный сигнал, параметры которого (частота, амплитуда и/или фаза) являются функциями по­данной на его вход цифровой последовательности. В результате модуляции несу­щий информацию сигнал переносится в соответствующую часть радиодиапазо­на и приобретает четко сформированные спектральные параметры. Это свойство сигнала — важнейшее для систем подвижной связи. Здесь необходимо эффектив­но использовать выделенные спектральные ресурсы, чтобы не искажать сигна­лы, передаваемые пользователями соседних областей спектра. Электромагнитный спектр - ценный и ограниченный ресурс, поэтому каждая система должна использовать максимально возможное количество своих собственных каналов в выделенном ей частотном диапазоне.

Радиоблок, иначе – высокочастотый (ВЧ) блок, работает в радиочастотном диапазоне и усиливает радиосигнал до требуемого уровня. Ширина полосы сигнала зависит от выбранного типа модуляции и используемого метода многостанционного до­ступа. Обычным требованием к применяемому в системе подвижной связи усилителю ВЧ является ограничение энергопотребления. Поэтому усилитель ВЧ дол­жен обладать большим динамическим диапазоном и вынужден функционировать в нелинейной области своих характеристик. Компенсировать нелинейные искажения, вносимые усилите­лем ВЧ, позволяет применение методов модуляции с постоянной или слабо ме­няющейся огибающей.

В системах подвижной связи передатчик излучает сигнал в пространство с помощью антенны. Свойства канала тесно связаны с типами передающей и при­емной антенн. Особенно важную роль играют параметры направленного дейст­вия и усиления антенны. Характеристики антенны определяют рабочий диапа­зон системы и ее эффективность.

Преобразования, производимые в приемнике, имеют обратное соответствие процессам, происходящим в передатчике. После усиления и фильтрации в каска­дах ВЧ блока принятый сигнал демодулируется. Характер преобразования зави­сит от применяемого метода цифровой модуляции и параметров канала. Сильное влияние на выбор типа применяемого демодулятора оказывает фактор стоимост­ной реализации приемника. Основная задача демодулятора - выделить последо­вательность импульсов из модулированного сигнала, полученного после ВЧ об­работки. На основе этих импульсов демодулятор выделяет из принятого сигнала переданные символы данных и преобразует их в двоичные последовательности.

Канальный декодер, используя добавленные канальным кодером избыточные биты, а также дополнительную информацию о достоверности принятого сигна­ла, определяет кодовую последовательность. Из полученной кодовой последова­тельности выделяется двоичная информационная составляющая. Именно она является основной целью декодирования.

Декодиро­ванный сигнал преобразуется в декодере источника (в СПРС – в декодере речи) и после цифро-аналогового преобразования (ЦАП) попадает через усилитель и громкоговоритель (телефон) в приемник сообщений - ухо пользователя.

Основные требования, предъявляемые к процессу передачи речи по сетям связи, — это высокое качество сигнала и низкая системная (временная) задержка. При этом качество речи по большей части напрямую связано со ско­ростью цифрового потока на выходе кодера речи, в то же время более сложные алгоритмы кодирования речи способны достичь более высоких отношений качества к скорости ци­фрового потока.

Сжатие речи при ее передаче сокращает объем передаваемых данных, затраты и, благодаря этому, позволяет снижать цены на услуги. Очевидно, чем изощренней алгоритм кодирования речевого сигнала, тем сложнее его реализовать. Сложность связана с вычислениями, необходимыми для воспроизведения процессов кодиро­вания и декодирования сигналов в реальном времени в микросхемах АТ. Скорость обработки измеряется миллионами опе­раций в секунду (MIPS). Достижения в технологии сигнальных процессоров (DSP), сверхбольших интегральных схем (VLSI) и увеличение емко­сти элементов памяти позволяют выполнять более сложные алгоритмы кодирования-декодирования речи даже в однокристальных микропро­цессорах. Сложность обработки влияет на физические размеры кодека речи, на его стоимость, потребляемую мощность, а также отражается на величине коммутационной задержки – временной задержке сигнала при его обработке и буферизации в кодере и декодере. Задержка речевого сигнала в трактах передачи и приема не имеет большого значения в системах вещания, однако в телефонном канале значительное запаздывание сигнала заметно снижает качество восприятия речи. Реальные коммутационные задержки (при кодировании и декодировании) составляют от 125 мкс (в линиях с ИКМ) до 100 мс (в некоторых низкоскоростных системах кодирования). Предельно допустимой в телефонии считается общая задержка порядка 400 мс. Например, в стандарте GSM система синхронизации рассчитана на компенсацию абсолютного времени задержки сигналов до 233 мкс, что соответствует максимальному радиусу соты 35 км.

Исторически сложились два направления кодирования речи: кодирование формы сигнала (КФС), называемое также аппроксимацией формы речевой волны, и параметриче­ское компандирование речи, иногда называемое кодированием источника сигнала. В первом методе кодер формы волны аппроксимирует форму речевого сиг­нала во времени. Этот метод основан на использовании статистических характеристик речевого сигнала (РС) и практически не зависит от механизма его формирования. Кодеры этого типа обеспечивают высокое качество пере­дачи речи, но скорость цифрового потока редко бывает меньше 32 кбит/с. Поэтому для кодирования речи со скоростью передачи 16 кбит/с и меньше – прежде всего для цифровых систем сотовой и персональной спутниковой связи - получили мощное развитие разнообразные методы параметриче­ского компандирования речи (табл. 6.1).

Таблица 6.1.

Вид преобразования речи

Устройства преобра- зования

Алгоритмы кодирования -декодирования речи

Скорость передачи, кбит/с

Кодирование формы сигнала

Кодеры формы

сигнала

Импульсно - кодовая модуляция (ИКМ)

64

Дифференциальная ИКМ (ДИКМ)

48/52/56

Адаптивная дельта-модуляция (АДМ)

40

Адаптивная дифференциальная ИКМ (АДИКМ)

32

Парамет-

рическое компандирование

(кодирова-

ние) речи

Вокодеры

Спектрально-временные (полосный, формантный, гармонический)

1,2-4,8

Кодирование на основе линейного предсказания (LPC)

Гибридные

кодеры

Линейное предсказание с возбуждением от остатка предсказания (RELP)

4,8-16

Линейное предсказание с многоимпульсным возбуждением (MPE-LPC)

Линейное предсказание с долговременным предсказанием

(LTP-LPC)

Линейное предсказание с регулярным импульсным возбуждением (RPE-LPC)

Линейное предсказание с кодовым возбуждением (CELP)

Линейное предсказание с кодовым возбуждением и малой

задержкой (LD-CELP)

Линейное предсказание с возбуждением алгебраическим кодом (ACELP)

Линейное предсказание с векторным возбуждением (VSELP)

Адаптивное кодирование с предсказанием (АРС)

Метод квантования по максимуму правдоподобия (MP-MLQ)

Трудность создания кодеков, обеспечивающих минимально возможную скорость передачи для речевого источника, обусловлена рядом причин. Во-первых, речь представляет собой колебания сложной формы, зависящей от произносимых слов, тембра голоса, интонации, пола и возраста говорящего, а речевой сигнал не является стационарным процессом. Законы изменения его вероятностных характеристик на участках произнесения гласных и согласных звуков существенно различаются, не говоря уже о паузах и смычках (участки звучания согласных типа «м», «н», «п» и т. п.), где характеристики могут изменяться почти скачком.

Вторая причина связана с определением (формализацией) критерия верности передачи, свойственным получателю. Действительный критерий восприятия, который характеризует качество слухового приема речевого сигнала человеком, отличается от распространенного критерия среднеквадратической ошибки или от какого-либо другого критерия, контролирующего отклонение «формы реализаций». Поэтому воспользоваться непосредственно результатами теории передачи информации для расчета качественных характеристик источника речевого сигнала затруднительно. Однако, можно попытаться получить оценки минимально возможной скорости передачи из других соображений, используя физические свойства получателя и источника речевых акустических колебаний.

При параметрическом компандировании моделирует­ся процесс речеобразования человека. Для этого в кодере из речевого сигнала вычисляются определенные параметры, которые передаются к декодеру, где они используются для восстановления формы сигна­ла. Восстановленная форма сигнала очень часто отличается от формы исходного сигнала; при этом звук подобен или близок к оригиналу. Ис­пользование полностью параметрических методов в настоящее время ограничено, так как они приводят к заметному ухудшению натурально­сти звучания голоса и чрезвычайно чувствительны к фоновому шуму. Один из способов снижения скорости передачи речи и повышения эф­фективности использования полосы пропускания канала связи состоит в применении гибридных методов, основанных на принципах линейного предсказания и объединяющих параметрическое компандирование и кодирование формы волны (табл. 6.1).

Основные характеристики наиболее распространенных и перспективных методов кодирования речи являются предметом изучения в следующих лекциях.