Преобразование текста в синтезированную речь

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Рязанский государственный радиотехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

main (Автосохраненный).docx

Скачиваний:

Добавлен:

22.08.2019

Размер:

1.74 Mб

Скачать

☆

<<< < Предыдущая 1 2 34 / 124 5 6 7 8 9 10 11 12 > Следующая >>>

Преобразование текста в синтезированную речь

Существуют аналогии между вычислительной обработкой звука в процессе речевого ввода и в процессе речевого вывода. Поставщики применяют различные алгоритмы, однако базовые рабочие процессы, используемые всеми необходимыми модулями, остаются одинаковыми.

Задача первого этапа речевого синтеза состоит в том, чтобы избавится от «шума»: кавычек, скобок, апострофов и знаков препинания. Она решается модулем нормализации, который обрабатывает зависящие от конкретного языка сокращения, форматы дат, времени, денежных единиц, телефонных номеров и других специальных обозначений.

Модуль преобразования переводит текст из орфографического в фонетический формат. Для некоторых языков, таких как немецкий, выполнить это легко, так как правила преобразования достаточно просты. В английском же напротив, правила отличаются большой сложностью, а для многих случаев даже не существуют. В русском языке соответствующие правила довольно просты, но также имеются некоторые аномальные случаи.

Модуль анализа выполняет одновременно лексикографическую и синтаксическую обработку для выбора между возможными вариантами произношения, а также ритма и интонации. Лексический анализ применяется для выяснения значения слова с учетом контекста, а синтаксический – для проверки порядка следования слов с целью расстановки акцентов.

Результатом работы модуля анализа является фонетическое представление исходного текста, которое передается на вход фонетического модуля. Здесь данные из входного потока заменяются такими элементами речи, как дифтонги, трифтонги и четырехзвучия. Все они были выделены из естественной человеческой речи, так что в них сохранены межфонемные переходы. Связывание или сцепление вместе этих речевых элементов позволяет получить высококачественную синтезированную речь. Объем требуемой для хранения отдельных образцов речи компьютерной памяти составляет примерно от 1 до 20 Мбайт, в зависимости от языка, конкретного приложения и потребностей рынка, на которые оно ориентировано.

Фонетический модуль обеспечивает разбиение текста на сегменты для формирования ритмического и интонационного рисунка. В контексте компьютерного синтеза речи под этим понятием подразумевается ритмический и интонационный баланс предложения. Для формирования легкой для восприятия и естественно звучащей речи хороший интонационный рисунок очень важен. Он достигается выбором надлежащей длительности воспроизведения каждой фонемы и обеспечением гладкости огибающей звуковой последовательности.

Структура синтезатора речи по тексту

Синтез устной речи по тексту осуществляется на основе лексико-грамматического анализа входного текста путем моделирования процессов речеобразования с учетом правил произношения звуков и интонирования, свойственных данному языку. Орфографический текст документа поступает на вход синтезатора и далее подвергается последовательной обработке рядом специализированных процессоров в соответствии с общей структурой синтезатора речи, представленной на рисунке 3.1. В общем случае синтезатор включает четыре основных модуля: текстовый процессор, просодический процессор, фонетически процессор и акустический процессор. Каждый из этих модулей поддерживается наборами соответствующих баз данных и правил. Рассмотрим основные функции этих модулей.

Рисунок 3.1 – Структура системы синтезатора речи

<<< < Предыдущая 1 2 34 / 124 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.11.201986.53 Кб4look.doc
#
01.07.2025916.48 Кб1LR3-amplitudnay modulyaziya.doc
#
15.04.2015540.86 Кб31LR_1-2.pdf
#
15.04.2015252.93 Кб26LR_AVR_2013_1-2.doc
#
01.05.2025937.47 Кб4m2_5.doc
#
22.08.20191.74 Mб9main (Автосохраненный).docx
#
01.07.202519.89 Mб1main.doc
#
15.04.201563.49 Кб61Makroekonomika_Itogovye_testy_s_otvetami.doc
#
01.03.20253.18 Mб1malenkie.docx
#
15.04.2015791.69 Кб9mal_dial.pdf
#
15.04.201516.95 Кб18Market Economy.docx

Преобразование текста в синтезированную речь

Структура синтезатора речи по тексту