Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс АО 13.doc
Скачиваний:
6
Добавлен:
01.05.2025
Размер:
4.42 Mб
Скачать

Тема 2.4.Устранение избыточности речи, методы речевого кодирования в абонентском оборудовании мобильной связи Требования к знаниям

Студент должен

знать:

  • содержание методов кодирования формы сигнала и источника сигнала;

  • методы оценки качества передачи речи;

  • зависимость качества передачи речи от скорость кодирования;

  • принципы работы вокодеров, типы вокодеров, гибридные кодеры;

  • задачи выбора метода речевого кодирования в абонентском оборудовании различных стандартов сотовой, транкинговой связи, в стандартах беспроводной телефонии. уметь:

  • объяснить, почему длительность блочного кодирования выбирается величиной 20 мс;

Содержание учебного материала

Методы и показатели качества кодирования речевых сообщений.

Основная функция схем кодирования - проанализировать сигнал, удалить избыточность и соответствующим образом закодировать информативные части сигнала. При декодировании сигнала восстановить его с минимально-возможными отклонениями.

В процессе развития схем кодирования речи сложилось два метода кодирования: кодирование формы сигнала и кодирование источника сигнала.

Первый метод основан на использовании статических характеристик сигнала и практически не зависит от механизма формирования сигнала. Кодеры этого типа обеспечивают высокое качество передачи речи, но отличаются невысокой эффективностью при сжатии сигнала речи, представленного в цифровой форме.

При втором методе кодирования – кодировании источника сигнала, использовалась модель голосового тракта, а устройства, осуществляющие кодирование этим методом были названы вокодерами. Вокодеры позволяли получить низкую скорость передачи информации, но при характерном, «синтетическом» качестве речи на выходе.

Для снижения скорости цифрового потока разрабатываются всё более сложные методы устранения избыточности. Качество речи и скорость передачидва конфликтующих фактора. Чем более низкая скорость речевого кодера, т.е. более высокая степень компрессии сигнала, тем больше страдает качество (достоверность) передаваемой речи. Другие критерии выбора, которые также должны рассматриваться, включают время задержки из-за кодирования при передаче от точки к точке, требования к источникам питания, особенно для портативных абонентских станций, совместимость с существующими стандартами и устойчивость закодированной речи к ошибкам в канале передачи. Особенно важным является последнее требование, поскольку каналом передачи в сотовой связи является радиоканал, в котором радиосигналы подвержены многим нежелательным эффектам (замираниям, затенениям, доплеровскому расширению спектра).

В зависимости от используемого метода кодирования речевого сигнала различные речевые кодеки (кодер и декодер) имеют разную устойчивость по отношению к ошибкам в канале передачи. Например, при одной и той же вероятности ошибки на бит ADPCM (АДИКМ) со скоростью 32 кбит/с обеспечивает намного лучшее качество передачи речи, чем логарифмическая PCM (ИКМ) со скоростью 64 кбит/с. Следует отметить, что снижение скорости передачи не обязательно сопровождается повышением устойчивости к ошибкам передачи. Более того, если речевой сигнал представляется меньшим числом битов, то это сопровождается увеличением информации, содержащейся о сигнале в каждом бите, и, следовательно, необходимо повышать защищённость битов от ошибок.

Выбор кодека осуществляется также с учётом размера соты в планируемой системе. Если размер соты мал, так что в системе обеспечивается высокая спектральная эффективность за счёт повторного использования частот, можно применять простые высокоскоростные кодеры. Напр., в системах стандартов СТ2, DECT (микросоты), кодеры ADPCM (АДИКМ) со скоростью 32 кбит/с обеспечивают приемлемое качество речи даже без канального кодирования. Сотовые системы имеют более крупные соты и более сложные условия распространения в радиоканалах. Поэтому они должны снабжаться низкоскоростными кодами, корректирующими ошибки в канале передачи.

В спутниковых системах с очень большим размером сот и малой доступной полосой частот, приходится ограничиваться скоростью речевого кодера порядка 3 кбит/с.

Для систем, которые работают в телефонных сетях общего пользования и им подобным, основным требованием является качество кодирования, однако для закрытых сетей, таких как коммерческие или военные системы, требования к качеству могут быть снижены с целью понижения скорости.

Перечень стандартов приведен в таблице 1.

PCM – импульсно-кодовая модуляция ИКМ

ADPCM – Адаптивная дифференциальная ИКМ

LD-CЕLP – возбуждаемое кодом линейное предсказание с малой задержкой APC – кодирование с адаптивным предсказанием

RPE-RTL – линейное предсказание с возбуждением регулярной последовательностью импульсов и долговременным предсказанием.

MPLPC - многоимпульсное кодирование с линейным предсказанием

VSELP - линейное предсказание с векторным возбуждением

CELP – линейное предсказание с возбуждением от кода

MBE – многополосное возбуждение

VAPC – кодирование с векторно-адаптивным предсказанием

LPC-10 – кодирование с линейным предсказанием

Табл.1

Скорость

преобразования кбит/с

Область применения

Тип кодера

Год внедре-

ния

64

ТФОП (1-е поколение)

РСМ

1972

32

ТФОП (2-е поколение)

ADPCM

1984

16

ТФОП (3-е поколение)

LD-CELP

1992

16

Морские системы связи INMARSAT Standard В

APC

1985

13

Общеевропейская система GSM

RPE-RTL

1991

9,6

Аэрокосмическая система связи (Skyphone)

MPLPC

1990

8

Мобильные системы связи (северо-американская система цифр. подвиж. р/с)

VSELP

1992

6, 7

Мобильные системы связи (японская сист. цифровой подвижной радиосвязи )

VSELP

1993

5…6

Мобильная система связи Half-Rate GSM

CELP

1993

6,4

Наземные системы связи INMARSAT Standard M

MBE

1993

4,8

Федеральный стандарт правительст. США

CELP

1991

4,8

Система мобильной спутниковой связи NASA MSAT-X

VAPC

1991

2.4

Федеральный стандарт правительст. США

LPC-10

1997

Способы оценки качества передачи речи подразделяются на объективные и субъективные. Объективные критерии основываются на значениях некоторых статистических параметров, которые позволяют судить о степени отличия принятого по каналу связи речевого сигнала от переданного (средняя квадратичная ошибка, отношение сигнал – шум, искажения спектра и т. д.). Объективные критерии обычно используют при проектировании системы связи.

Но для слушателя оценкой качества речи является усреднённое субъективное восприятие. Субъективные критерии оценки качества речи основываются на статистической обработке субъективных оценок качества большого числа слушателей – экспертов.

Методика вычисления средней экспертной оценки регламентирована рекомендациями Европейского института стандартов в области Телекоммуникаций (ETSI-T):

табл. 2

Описание уровня

Оценка

Степень усилий при восприятии

Превосходный

5

Без усилий

Хороший

4

Нет ощутимых усилий

Допустимый

3

Умеренные усилия

Слабый

2

Значительные усилия

Плохой

1

Теряется восприятие при физически возможных усилиях

В качестве примера ниже приведены результаты оценки семи типов кодеков

табл. 3

Тип кодера

Cкорость преобразования

Значения оценки MOS

PCM (ИКМ)

64 кбит/с

4,3

ADPCM (АДИКМ)

32 кбит/с

4,1

RPE-LTR (стандарт GSM)

13 кбит/с

3,58

VSELP (стандарт D-AMPS)

8 кбит/с

3,44

CELP (стандарт CDMA)

4,8 кбит/с

9,6 кбит/с

3,0

3,7

Q-CELP (стандарт CDMA)

13 кбит/с

4,02

LPC

2,4 кбит/с

2,5

Структурная схема процессов обработки речи в стандарте GSM.

В стандарте GSM принята прерывистая передача речи DTX (включение передатчика только во время разговора и отключение в паузах и в конце разговора). Система DTX управляется детектором активности речи VAD, который обеспечивает обнаружение и выделение интервалов передачи речи с шумом и шума без речи даже в тех случаях, когда уровень шума соизмерим с уровнем речи. В состав системы прерывистой передачи речи входит также УФКШ – устройство формирования комфортного шума, включаемое в паузах. DTX-процесс включает также в себя восстановление потерянных при передаче по радиоканалу фрагментов речи.

Рис. 3 Структурная схема процесса обработки речи в стандарте GSM.

В случае применения стандартных кодеков ИКМ (PCM) для формирования 8 TDMA-кадров (временных каналов) в одном частотном канале потребовалась бы скорость передачи 64×8=512 кбит/с. Такую скорость обеспечить в частотном канале шириной 200 кГц практически невозможно. Имеется 2 решения:

- увеличение плотности передаваемой информации (сложна техническая реализация),

- применение более сложных способов кодирования, при которых передаётся меньший объём информации (передаваемая в радиоканале информация уменьшается, а затем восстанавливается в приёмном декодере).

Наиболее низкая скорость передачи информации в вокодерах – (1-3 кбит/с) не обеспечивает требуемого качества речи. В стандарте GSM используется способ кодирования, использующий вокодеры и DPCM (ДИКМ), который получил название дифференциального кодирования.

Речевой аппарат человека можно представить механизмом:

- источник колебаний – голосовые связки;

- горло и рот – фильтр.

Этот механизм инерционен и за 10-30 мс не изменяет своего состояния. И, если брать отрезки речевого сигнала по 20 мс, уметь определять частоту основного тона и параметры фильтра речеобразующего тракта, то по ним в приёмном устройстве можно восстановить исходный сигнал в состоянии близком к передаваемому. Изменение сигнала (ухудшение качества) происходит из-за того, что параметры речевого аппарата постоянно изменяются. Для уменьшения этого влияния, в DPCM кодируется не сам сигнал, а разность амплитуд поступившего и предыдущего дискретного отсчётов.

В Европейском стандарте GSM используется кодек RPE-LTR (долговременное предсказание с возбуждающей регулярной последовательностью импульсов). Кодер создаёт битовый поток со скоростью 13 кбит/с и был выбран после многочисленных экспертных оценок. Этот кодер вобрал в себя достоинства 2-х способов кодирования: RELP (линейное предсказание с возбуждением с остатком) и MPE-LTR (долговременное предсказание с импульсным возбуждением), предложенные ранее Францией и Германией. Преимущество RELP – кодека состоит в том, что он обеспечивает очень хорошее качество речи при сравнительно малой сложности. Однако, качество речи при использовании этого кодека ограничивается помехой, создаваемой при восстановлении высокочастотных компонентов речевого сигнала и ошибками при передаче битов по каналу связи. Благодаря модификации RELP – кодека с целью введения в него некоторых элементов MPE-LTR – кодека скорость нового кодека была снижена с 14,77 до 13,0 кбит/с без потерь качества речи. Наиболее важным введённым в кодек элементом, была петля предсказания.

Рис. 4 Функциональная схема кодера GSM

Предвари- Кратковре- Долговременный анализ ормирование

тельная менный сигнала

обработка анализ возбуждения

Вход

Кодек GSM является довольно сложным и предъявляет высокие требования к источникам питания. Функциональная схема содержит 4 основных блока обработки каждого сегмента речевого сигнала: предварительной обработки, кратковременного анализа (предсказания), долговременного анализа и формирования сигнала возбуждения в виде регулярной последовательности импульсов.

На вход кодера с частотой следования 8 кГц поступают отсчёты речевого сигнала в виде 13-битовых кодовых слов ИКМ.

В первом блоке последовательность отсчётов подвергается предискажениям (фильтрации фильтром высоких частот, в результате чего подавляется постоянная составляющая сигнала и увеличивается уровень высокочастотных компонентов), разбивается на сегменты длительностью 20 мс; отсчёты каждого сегмента умножаются на значения временного окна Хемминга.

Во втором блоке по 160 отсчётам сегмента вычисляются значения оценок параметров фильтра линейного предсказания и значения сигнала ошибки предсказания (точнее, предсказания на один такт или кратковременного предсказания).

В третьем блоке отсчёты ошибки линейного кратковременного предсказания подвергаются дополнительной обработке. Для этого группа из 160 отсчётов ошибки предсказания разбивается на 4 кадра по 40 отсчётов. Для каждого кадра вычисляется взаимная корреляция с предшествующими значениями восстановленной ошибки предсказания, определяется задержка, при которой взаимная корреляция оказывается максимальной. Для полученного значения задержки вычисляется значение нормирующего множителя (коэффициента усиления), равного отношению максимального значения взаимной корреляции к сумме квадратов 40 значений ошибки соответствующих задержке. Полученные значения задержки и коэффициента усиления кодируются и передаются по линии связи.

В четвёртом блоке формируется сигнал возбуждения. Отсчёты ошибки каждого кадра взвешиваются и разделяются на 3 подпоследовательности, каждая из которых рассматривается как кандидат сигнала возбуждения. Отсчёты этой последовательности возбуждения нормируются на значение наибольшего отсчёта, квантуются и передаются при скорости 9,6 кбит/с. В канал передаётся также номер выбранной последовательности.

Дальше каждые 260 битов с выхода кодера речи, соответствующие сегменту речевого сигнала с длительностью 20 мс, проходят канальное кодирование.