
- •3.2 Архитектура мобильной станции
- •Антенный блок
- •Приемник
- •3.3.2 Кодирование речи
- •3.3.2.1 Кодирование формы речевого сигнала
- •3.3.2.2 Вокодеры
- •3.3 Канальное кодирование
- •3.3.1 Блочное кодирование
- •Побайтовое обнаружение ошибки
- •3.3.2 Сверточное кодирование
- •3.4 Перемежение
- •3.5 Gmsk-модуляция
- •3.6 Высокочастотные тракты в мобильной станции
- •Передающий высокочастотный тракт мобильной станции
- •Приемный высокочастотный тракт мобильной станции
- •3.7 Эквалайзер в мобильной станции
- •3.8 Модуль подлинности (sim-карта)
- •3.9 Функции подвижной станции
- •3.10 Электрические параметры подвижной станции
- •Контрольные вопросы и задания
3.3.2.2 Вокодеры
В вокодерах (от английского voice coder) измеряются параметры речевого аппарата человека, по которым на приемной стороне создается аналог такого же аппарата и синтезируется звук. При этом постулируется, что в течение 20…30 мс эти параметры остаются постоянными. Поэтому перед сжатием поток бит ИКМ нарезается на сегменты, содержащие по 160-240 отсчетов для оценки постоянных параметров [6].
Разработка вокодеров основана на использовании различных моделей голосового тракта. На рис. 6 показана однотрубная модель речеобразующего аппарата человека.
Модель представляет собой М последовательно соединенных секций одинаковой длины, имеющих постоянную (в пределах секции) площадь сечения. Если вдувать воздух в такой свисток (подавать сигнал возбуждения), то в зависимости от конфигурации соединения и сигнала возбуждения на выходе формируется тот или иной звук. Таким образом, звук, получаемый с помощью данной модели, можно задать параметрами сигнала возбуждения и М значениями площадей секций свистка.
Рисунок 6 – Модель голосового тракта
Важной
характеристикой сигнала возбуждения
является частота основного тона
.
Поток воздуха из легких человека
прерывается голосовыми связками, и
возникает последовательность импульсов
с частотой следования от 80 до 1200 Гц.
Значения периода основного тона
коррелированны в соседних сегментах
речи. От точности описания основного
тона зависит и степень сжатия, и качество
синтезированной речи.
С помощью вокодеров получены большие коэффициенты сжатия, но синтезированная речь при этом характеризуется низким качеством из-за механической монотонности, отсутствия индивидуальной окраски.
Значительные
успехи в сжатии речевых сигналов при
приемлемом качестве достигнуты в
результате совместного использования
методов линейного предсказания и техники
вокодеров. Выяснено, что площади секций
модели на рис. 6 связаны нелинейными
функциональными соотношениями с
коэффициентами
линейного предсказания (2). Схема речевого
кодека в общем виде показана на рис. 7,
где анализирующий и синтезирующий
фильтры строятся на основе (2).
Алгоритмы
сжатия, описываемые данной схемой, могут
отличаться способом формирования
сигнала возбуждения. Известны следующие
разновидности сигнала возбуждения:
возбуждение от основного тона, от ошибки
предсказания
,
многоимпульсное возбуждение и возбуждение
от кода.
Рисунок 7 – Схема метода линейного предсказания
Самым простым является возбуждение от основного тона. В каждом периоде основного тона формируется один импульс для вокализованного сегмента (содержащего сигнал звука) и шумоподобный сигнал для невокализованного сегмента. На приемную сторону, следовательно, должен передаваться признак вокализованности анализируемого сегмента.
Возбуждение от ошибки предсказания приводит к металлическому оттенку синтезированной речи.
Многоимпульсное возбуждение обеспечивает лучшее качество воспроизведения и не требует классификации сегментов на вокализованные и невокализованные. Сигнал возбуждения определяется положением и амплитудами 8-13 импульсов в анализируемом интервале.