Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпора по ЕЯИС, 2ой семестр (Головня) [8282 вопросов].doc
Скачиваний:
470
Добавлен:
15.06.2014
Размер:
2.3 Mб
Скачать

74. Аллофонный фонетический процессор. Акустический процессор.

Рассмотрим наиболее простой и достаточно качественный тип фонетического процессора – аллофонный фонетический процессор. Ранее указывалось, что фонема в реальной речи никогда не имеет только одну единственную реализацию, это, как правило, множество реализаций одной и той же фонемы. Существует два типа вариативности фонемы: позиционная и комбинаторная. В этих случаях говорят не о фонемах, а об аллофонах как о вариантах звучания одной и той же фонемы. В случае использования компиляционного метода синтеза речи (см. раздел 3) в структуре системы автоматического синтеза речи фонетический процессор будет являться, например, аллофонным. Основные этапы работы аллофонного фонетического процессора приведены на рис. 4.17. Из рисунка видно, что работа аллофонного фонетического процессора достаточно проста. На первом этапе генератор позиционных аллофонов осуществляет подстановку во входной размеченный фонемный текст знаков позиционных аллофонов. При этом используются соответствующие позиционные правила. На втором этапе генератор комбинаторных аллофонов, который использует комбинаторные правила, подставляет знаки комбинаторных аллофонов. На выходе аллофонного процессора получаем аллофонный текст, который отличается от фонемного тем, что в нем на месте фонем проставлены знаки соответствующих аллофонов.

Рисунок 4.17. Аллофонный фонетический процессор

Последний блок системы автоматического синтеза речи по тексту – акустический процессор (рис. 4.18). Акустический процессор может быть реализован различными способами, в зависимости от выбранного метода синтеза речевого сигнала (см. подраздел 3.2).

Рисунок 4.18. Акустический процессор

Задачей акустического процессора является генерация речевого сигнала на основе двух типов входных параметров: • просодических, которые поступают на вход акустического процессора от просодического процессора: Fo(t) – частота основного тона, Т(t) – длительность звуков, А(t) – амплитуда звуков; • фонетических, поступающих от фонетического процессора (в зависимости от метода синтеза речи и, соответственно, типа фонетического процессора, эти параметры могут быть самыми разными: формантными параметрами (F1(t), F2(t), A1(t),…), информацией о сечениях речевого тракта, номерами аллофонов или сегментов и др.). На выходе акустического процессора – синтезированный речевой сигнал. В результате работы акустического процессора мы достигаем конечной цели – работы синтезатора речи по тексту. В соответствии с избранным методом синтеза речевого сигнала акустический процессор может иметь следующие основные модификации: • акустический процессор, реализованный путем аппроксимации геометрии речевого тракта; • акустический процессор на основе формантной модели речевого тракта • акустический процессор, реализованный на основе компиляционных методов синтеза речевого сигнала.

75. Аппроксимация геометрии речевого такта. Акустический процессор, основанный на компиляционных методах синтеза речи.

Первой модификацией акустического процессора является акустический процессор, реализованный путем аппроксимации геометрии речевого тракта (см. пункт 3.2.1), который описывается с помощью набора цилиндрических секций. В этом случае в качестве входных данных для акустического процессора из артикуляторного фонетического процессора передаются функции сечений речевого тракта или наборы артикуляторных команд, отвечающих за образование фонем (см. подраздел 4.1.1). Указанные параметры являются исходными для формирования управляющих параметров Ki артикуляторного акустического процессора (см. рис. 3.16 в пункте 3.2.3). Следует, однако, отметить, что полноценных таких акустических процессоров пока не разработано ввиду того, что до сих пор мало сведений о строении речевого тракта человека. Как указывалось в пункте 3.2.1, акустические процессоры данного типа могли бы обеспечить достаточно высокое качество синтеза, близкое к естественной речи. Поэтому некоторые из разработчиков систем автоматического синтеза речи все еще имеют надежды, что данный метод себя оправдает.В пункте 3.2.5 рассмотрена группа компиляционных методов синтеза речевого сигнала. С точки зрения реализации акустического процессора эти методы являются наиболее простыми, так как в задачи акустического процессора в этом случае будет входить лишь сборка (компиляция) речевого сигнала на основе заранее заготовленных отрезков естественной речевой волны. Как указывалось выше, основными недостатками компиляционных методов являются трудоемкость создания наборов таких отрезков, а также необходимость решения задачи их хранения. Одним из компромиссных вариантов решения указанных проблем является микроволновой метод, который по сравнению с, например, аллофонным, является более экономичным и универсальным. При использовании микроволнового метода синтеза речевого сигнала объем хранимой информации существенно уменьшается и, кроме того, некоторые микроволны могут быть использованы для создания различных аллофонов. На рис. 4.26 представлена обобщенная схема акустического процессора, использующего микроволновой метод синтезатора речевого сигнала.