Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОС 2.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
905.22 Кб
Скачать

78. Основные методы автоматического синтеза речи: формантный синтез, клп-синтез, компилятивный синтез и их современные модификации (по выбору).

Самое широкое разделение стратегий, применяемых при озвучивании речи – это разделение на подходы, которые направлены на построение действующей модели речепроизводящей системы человека, и подходы, где ставится задача смоделировать акустический сигнал как таковой. Первый подход известен под названием артикуляторного синтеза. Второй подход на сегодняшний день более успешный. Внутри него выделяется два основных направления: формантный синтез по правилам и компилятивный синтез.

При компилятивном синтезе имеется словарь речевых единиц, специально подготовленных из реальных элементов речевого материала, наговоренного определенным диктором. Суть его в том, что в библиотеке хранятся отдельные звуки. В речи приходится «сшивать» самые разнородные звуки. При этом грубые «швы» настолько раздражают слух, что речь становится неразборчивой, хотя и составлена из естественных звуков. Все дело в том, что артикуляторные органы работают плавно и форма колебаний одного звука переходит в форму следующего очень постепенно через несколько промежуточных фаз, четкую границу между которыми провести совершенно невозможно. Переходные участки играют исключительно важную роль в восприятии речи человеком. Важной ее частью является просодия – ритмоинтонационные характеристики речи на уровне целых слов или высказываний.

Таким образом, компилятивный синтез осуществляется путем склейки нужных единиц компиляции из имеющегося инвентаря. На этом принципе построено множество систем, использующих разные типы единиц и различные методы составления инвентаря. В таких системах необходимо применять обработку сигнала для приведения частоты основного тона, энергии и длительности единиц к тем, которыми должна характеризоваться синтезируемая речь.

В системах компилятивного синтеза применяются два различных типа алгоритмов обработки сигнала: LP и PSOLA. LP-синтез основан в значительной степени на акустической теории речеобразования, в отличии от PSOLA-синтеза, который действует путем простого разбиения звуковой волны, составляющей единицу компиляции, на временные окна и их преобразования. Алгоритмы PSOLA позволяют добиваться хорошего сохранения естественности звучания при модификации исходной звуковой волны. Компиляционный речевой подход целесообразен при малых словарях. Он обеспечивает хорошее качество и разборчивость речи.

Анализ речевого сигнала на основе коэффициента линейного предсказания (КЛП) заключается в расположении его спектра на две составляющие: сглаженного спектра, представленного в виде модели спектра, характеристика которого содержит только полюсы, и спектры функции возбуждения, содержащего информацию о погрешности предсказания. В идеальном случае порядок фильтра должен быть выбран таким образом, чтобы сигнал погрешности предсказания представлял собой некоррелированную последовательность в случае невокализованных звуков или последовательность равномерно следующих с периодом основного тона импульсов для вокализованных звуков.

Так как на практике точное спектральное представление невокализованных звуков не требует большого числа коэффициентов, необходимых для вокализованной речи, то целесообразно отдельно анализировать низкочастотный и высокочастотный диапазоны с меньшим количеством коэффициентов, позволяющим, тем не менее, точно описать спектр.

Существующая разница между естественной и синтезированной речью полученной на основе методов линейного предсказания, частично определяется ограничениями модели, имеющей только полюса, что наиболее заметно для назальных звуков. Поэтому представляется целесообразным использование полюсной модели линейного предсказания с включением в нее нулей. При использовании КЛП-метода все отобранные спектральные параметры речевого сигнала включены в значения коэффициентов, просчитываемых автоматически в процессе анализа речи. Преимущества использования КЛП-метода в синтезе речи связаны, главным образом, с более доступной и полностью автоматизированной процедурой анализа, а также менее сложной структурой по сравнению с другими методами. Применение КЛП-метода с привлечением формантных параметров позволяет получить более качественную синтезированную речь.

Наиболее перспективное направление – формантный синтез по правилам, позволяет преобразовать произвольный орфографический текст в соответствующий речевой сигнал по схеме: текст-фонема-речь. Но при практически неограниченном словаре такое преобразование пока не обеспечивает хорошего качества синтезированной речи. Поэтому наиболее распространенным остается компилятивный синтез, где при ограниченном словаре достигается хорошее качество речи.

79. Понятие о «праязыке». Принципы реконструкции праязыковых состояний. Внутренняя и внешняя реконструкция. Способы верификации реконструкций.

Когда происходило становление компаративистики, считалось, что праязык – это язык более древний. Родственная общность языков возникает из того, что такие языки происходят от одного языка-основы путем его распадения благодаря дроблению коллектива-носителя. Однако это длительный и противоречивый процесс, а не следствие «расщепления ветви надвое» данного языка, как мыслил А. Шлейхер. Тем самым исследование исторического развития данного языка возможно только на фоне исторической судьбы того населения, которое явилось носителем данного языка или диалекта. А. Мейе отказался от идеи реконструкции праязыка, единственное, что можно установить – это систему фонетических соответствий. Однако, язык-основа – это реальный, исторически существовавший язык, который полностью восстановить нельзя, на основные данные его фонетики, грамматики и лексики восстановить можно.

Языки-потомки за время раздельного существования неизбежно изменяются, но в силу регулярности изменений какие-то черты праязыка сохраняются и в последующих состояниях. Задача исследования – обнаружить эти черты, отделить их от позднейших инноваций и дать их лингвистическую интерпретацию. Этот процесс и называется лингвистической реконструкцией.

При реконструкции праязыка следует пользоваться данными как можно более древнего языкового состояния. Существует несколько источников таких данных:

  1. Древние письменные памятники. Но при работе с древними памятниками важно, во-первых, быть уверенным в правильности чтения, а во-вторых, не попасть в порочный круг: представление о том, как читать древние тексты, во многом основывается на данных современного языка. Важно также уметь отделять архаизмы от инноваций. При использовании фонетики по древним письменным памятникам возникает еще одна проблема, связанная с тем, было ли письмо, создано специально для этого языка, или заимствовано. Так как заимствованная письменность часто отражает фонетику неточно.

  2. Внутренняя реконструкция. В любом языке присутствуют следы более древнего языкового состояния. К ним относятся: большинство морфонологических чередований; многие непродуктивные морфологические модели (например, изменение по лицам и числам глагола to be); нестандартная морфология в устойчивых сочетаниях (на добра коня) дают возможность утверждать, что когда-то краткие формы прилагательных склонялись); устойчивые словосочетания с нестандартным синтаксисом (до-йти до, на-брести на).

  3. Сравнение диалектов: разные диалекты изменялись по-разному и сохраняли разные черты праязыка. Объединение этих черт дает более полную картину древнего языкового состояния, чем любой из диалектов в отдельности.

  4. Анализ заимствований в изучаемый язык из языка с известной фонетикой помогает уточнить, какие звуковые изменения происходили в истории данного языка.

  5. Анализ заимствований из исследуемого языка в язык с известной фонетикой. Рефлексы того, что в изучаемом языке исчезло, могут сохраниться в заимствованиях.

Следующий этап – восстановление исходного праязыкового состояния на основании регулярных соответствий. Здесь большую роль играют данные типологии. Обычно историю некоего языка стараются реконструировать так, чтобы она состояла из наиболее вероятных изменений; фонетические и грамматические системы – так, чтобы они типологические параллели.

Верификация – это проверка на достоверность. Когда мы осуществляем реконструкцию, то мы реконструируем: фонетический облик слова (означающее), значение (означаемое) и морфологический состав, т.е. внутреннюю форму слова.

Реконструкция звуковой оболочки слова. В речи всегда употребляются словоформы. Каждая словоформа состоит из двух частей: неизменяемой части (основа) и изменяемой (окончание). Для реконструкции окончания необходимо предварительно реконструировать морфологию языка. Но на первом этапе можно поставить более легкую задачу: реконструировать основу. Для лексики это вполне приемлемое решение. Хотя, без реконструкции парадигмы слова, мы ее не можем считать полной и завершенной.

Одним из источников верификации реконструкции являются заимствования из других языков. Также можно опереться на данные фонетической типологии. Эти данные можно разделить на:

  • статистические – какие фонемы могут существовать в языке. Например, она дает нам данные о том, что нет систем без смычных, носовых, но зато есть без фрикативных. Вокалические системы состоят как минимум из 2 гласных. Это а, ы.

  • динамические данные дают информацию о том, какие звуки, фонемы являются смежными в фонетическом пространстве. Это фраза имеет смысл только в том случае, если мы предполагаем, что для всех языков мира существует фонематическое пространство и ее заполнение является частным случаем.

Реконструкция значение может опираться на:

  1. Исторически засвидетельствованные факты изменения значений. Но этот источник есть не всегда.

  2. Семантическая типология. Для этого берутся этимологические словари, где встречается семантический переход, который мы фиксируем. Лексико-семантическое пространство едино. Семантическая типология языков мира еще не создана.

Для осуществления реконструкции одного единственного слова, надо его рассматривать на фоне всей системы. Слово надо поместить в систему языка и словообразовательную форму языка: [Pr]- √- S-F (модель индоевропейского слова). Для праиндоевропейского языка не реконструируются приставки. Все индоевропейские языки имеют приставки. Приставочный стык легче рвется, чем суффиксальный. В немецком языке приставка – это вообще отделяемая морфема. Суффикс никогда не отделяется, не уходит в конец предложения. Для проверки правильности реконструкции морфемного облика мы должны осуществить позиционный анализ морфем.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]