3.3.2.2 Вокодеры

В вокодерах (от английского voice coder) измеряются параметры речевого аппарата человека, по которым на приемной стороне создается аналог такого же аппарата и синтезируется звук. При этом постулируется, что в течение 20…30 мс эти параметры остаются постоянными. Поэтому перед сжатием поток бит ИКМ нарезается на сегменты, содержащие по 160-240 отсчетов для оценки постоянных параметров [6].

Разработка вокодеров основана на использовании различных моделей голосового тракта. На рис. 6 показана однотрубная модель речеобразующего аппарата человека.

Модель представляет собой М последовательно соединенных секций одинаковой длины, имеющих постоянную (в пределах секции) площадь сечения. Если вдувать воздух в такой свисток (подавать сигнал возбуждения), то в зависимости от конфигурации соединения и сигнала возбуждения на выходе формируется тот или иной звук. Таким образом, звук, получаемый с помощью данной модели, можно задать параметрами сигнала возбуждения и М значениями площадей секций свистка.

Рисунок 6 – Модель голосового тракта

Важной характеристикой сигнала возбуждения является частота основного тона . Поток воздуха из легких человека прерывается голосовыми связками, и возникает последовательность импульсов с частотой следования от 80 до 1200 Гц. Значения периода основного тона коррелированны в соседних сегментах речи. От точности описания основного тона зависит и степень сжатия, и качество синтезированной речи.

С помощью вокодеров получены большие коэффициенты сжатия, но синтезированная речь при этом характеризуется низким качеством из-за механической монотонности, отсутствия индивидуальной окраски.

Значительные успехи в сжатии речевых сигналов при приемлемом качестве достигнуты в результате совместного использования методов линейного предсказания и техники вокодеров. Выяснено, что площади секций модели на рис. 6 связаны нелинейными функциональными соотношениями с коэффициентами линейного предсказания (2). Схема речевого кодека в общем виде показана на рис. 7, где анализирующий и синтезирующий фильтры строятся на основе (2).

Алгоритмы сжатия, описываемые данной схемой, могут отличаться способом формирования сигнала возбуждения. Известны следующие разновидности сигнала возбуждения: возбуждение от основного тона, от ошибки предсказания , многоимпульсное возбуждение и возбуждение от кода.

Рисунок 7 – Схема метода линейного предсказания

Самым простым является возбуждение от основного тона. В каждом периоде основного тона формируется один импульс для вокализованного сегмента (содержащего сигнал звука) и шумоподобный сигнал для невокализованного сегмента. На приемную сторону, следовательно, должен передаваться признак вокализованности анализируемого сегмента.

Возбуждение от ошибки предсказания приводит к металлическому оттенку синтезированной речи.

Многоимпульсное возбуждение обеспечивает лучшее качество воспроизведения и не требует классификации сегментов на вокализованные и невокализованные. Сигнал возбуждения определяется положением и амплитудами 8-13 импульсов в анализируемом интервале.

<<< < Предыдущая 1 2 3 45 / 145 6 7 8 9 10 11 12 13 14 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
14.11.2019536.58 Кб16metoda.doc
#
19.11.2019761.34 Кб1Metoda_Em_kursach.doc
#
14.04.20152.64 Mб48Metodichka_EiE_LR.pdf
#
16.11.2019292.86 Кб7Metodichka_Fpnp_Rus.doc
#
12.11.20191.52 Mб23Metodichka_kursovoy_konstruirovanie.docx
#
13.04.20151.56 Mб68Metodichka_mobilnaya_stantsia.doc
#
10.11.20191.15 Mб6Metodichka_na_laby.doc
#
01.04.20252.56 Mб0metodichka_po_KP.doc
#
01.05.20253.22 Mб0Metodichka_po_KP_ES_russk.doc
#
14.04.2015388.34 Кб7Metodichka_po_prakticheskim_temam.pdf
#
01.04.20251.85 Mб0Metodichka_PPs.doc