Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы на билеты.doc
Скачиваний:
25
Добавлен:
05.09.2019
Размер:
1.84 Mб
Скачать

1. Методы кодирования- востановления формы речевых сигналов.

Эти методы являются одними из элементарных подходов к синтезу речи. По существу компьютер в данном случае просто служит устройством для записи и хранения человеческой речи, которая подвергается предварительной обработке (кодированию), а затем преобразованию (восстановлению) и выводится на динамик.

У этих методов есть серьёзный недостаток: для хранения речевых сообщений в их непосредственной форме нужна память большого объёма.

Хотя речь, полученная таким способом, приближается по качеству к очень хорошей, требования к объёму памяти часто оказываются неприемлемыми.

Тем не менее, когда словарь не очень велик (сотни слов или фраз) данный метод весьма привлекателен, так как не требует большого количества дополнительной аппаратуры.

2. Аналоговые методы синтеза формантных частот.

Выше было дано определение формантной частоты речевого сигнала. Для удовлетворительного распознавания и синтеза речи достаточно использовать 3 из 6-и старших формант. Тем не менее, использование формантных частот даёт

неестественное звучание речи, что объясняется особенностью источника речи. В устройствах этого типа естественная речь человека не используется, так как синтез речи основан на электронном моделировании голосового тракта человека, поэтому синтезатор «говорит» голосом робота. Кратко процесс синтеза заключается в следующем.

Орфографический текст разбивается на фонемы, которые преобразуются в фонетическое описание текста, затем формируются последовательности управляющих слов, которые используются для управления собственно синтезатором.

Отличительной особенностью этого метода является принципиальная возможность создания синтезатора с неограниченным словарём, так как в основу его положена элементарная частица речи – фонема. Возможность неограниченного словаря никакому другому типу синтезаторов недоступна. Это в значительной степени искупает основной недостаток синтезатора – неестественное звучание речи.

3. Синтезаторы третьего типа используют метод цифрового моделирования голосового тракта человека.

Наиболее распространённая реализация этого метода известна под названием Линейного Предиктивного Кодирования (ЛПК), а синтезаторы называют ЛПК - синтезаторами (термин «предиктивный» означает предсказательный).

ЛПК синтезаторы обладают по сравнению с другими типами синтезаторов преимуществами, связанными с относительной простотой их реализации в виде цифровых микросхем, меньшей стоимостью их производства и меньшей эквивалентной скоростью передачи информации. Словарь в ЛПК - синтезаторе создаётся (как и в синтезаторах первой группы) с участием говорящего человека. Закодированная таким образом человеческая речь на этапе синтеза не подвергается прямому восстановлению. Она обрабатывается специальным цифровым анализатором, и в результате такого анализа образуются так называемые предикторные коэффициенты – параметры, которые используются непосредственно для управления собственно синтезатором. Предикторные коэффициенты представляют собой частотные и голосовые коэффициенты речи. Такой подход позволяет значительно снизить объём необходимой памяти.