Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metodichka_mobilnaya_stantsia.doc
Скачиваний:
68
Добавлен:
13.04.2015
Размер:
1.56 Mб
Скачать

3.3.2.2 Вокодеры

В вокодерах (от английского voice coder) измеряются параметры речевого аппарата человека, по которым на приемной стороне создается аналог такого же аппарата и синтезируется звук. При этом постулируется, что в течение 20…30 мс эти параметры остаются постоянными. Поэтому перед сжатием поток бит ИКМ нарезается на сегменты, содержащие по 160-240 отсчетов для оценки постоянных параметров [6].

Разработка вокодеров основана на использовании различных моделей голосового тракта. На рис. 6 показана однотрубная модель речеобразующего аппарата человека.

Модель представляет собой М последовательно соединенных секций одинаковой длины, имеющих постоянную (в пределах секции) площадь сечения. Если вдувать воздух в такой свисток (подавать сигнал возбуждения), то в зависимости от конфигурации соединения и сигнала возбуждения на выходе формируется тот или иной звук. Таким образом, звук, получаемый с помощью данной модели, можно задать параметрами сигнала возбуждения и М значениями площадей секций свистка.

Рисунок 6 – Модель голосового тракта

Важной характеристикой сигнала возбуждения является частота основного тона . Поток воздуха из легких человека прерывается голосовыми связками, и возникает последовательность импульсов с частотой следования от 80 до 1200 Гц. Значения периода основного тона коррелированны в соседних сегментах речи. От точности описания основного тона зависит и степень сжатия, и качество синтезированной речи.

С помощью вокодеров получены большие коэффициенты сжатия, но синтезированная речь при этом характеризуется низким качеством из-за механической монотонности, отсутствия индивидуальной окраски.

Значительные успехи в сжатии речевых сигналов при приемлемом качестве достигнуты в результате совместного использования методов линейного предсказания и техники вокодеров. Выяснено, что площади секций модели на рис. 6 связаны нелинейными функциональными соотношениями с коэффициентами линейного предсказания (2). Схема речевого кодека в общем виде показана на рис. 7, где анализирующий и синтезирующий фильтры строятся на основе (2).

Алгоритмы сжатия, описываемые данной схемой, могут отличаться способом формирования сигнала возбуждения. Известны следующие разновидности сигнала возбуждения: возбуждение от основного тона, от ошибки предсказания , многоимпульсное возбуждение и возбуждение от кода.

Рисунок 7 – Схема метода линейного предсказания

Самым простым является возбуждение от основного тона. В каждом периоде основного тона формируется один импульс для вокализованного сегмента (содержащего сигнал звука) и шумоподобный сигнал для невокализованного сегмента. На приемную сторону, следовательно, должен передаваться признак вокализованности анализируемого сегмента.

Возбуждение от ошибки предсказания приводит к металлическому оттенку синтезированной речи.

Многоимпульсное возбуждение обеспечивает лучшее качество воспроизведения и не требует классификации сегментов на вокализованные и невокализованные. Сигнал возбуждения определяется положением и амплитудами 8-13 импульсов в анализируемом интервале.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]