Синтез речи VitalVoice обладает целым рядом преимуществ таких как:

Высокая естественность звучания при чтении произвольного текста
Учет фонетических, морфологических и грамматических особенностей русского языка
Технология клонирования естественной интонации и тембра голоса диктора-донора

Правильная расстановка ударений
Правильная расшифровка сокращений, чисел, аббревиатур и специальных знаков
Простота использования и внедрения
Поддержка стандартных протоколов обмена данными и языков разметки (MRCP, SAPI, SSML)
8 различных голосов синтеза
Возможность создания уникального голоса «на заказ»

Существует два основных типа систем синтеза речи — тематически заданный и тематически открытый (универсальный).

5.1 Тематически заданный синтез

Применяется, например, в системах оповещения на вокзалах, автоматический прогноз погоды, информатор точного времени по телефону, компьютерные игры, а также в электронных приборах: часах, навигаторах и т.п. Такой синтез часто называют макрокомпилятивным, поскольку в основе такого синтеза лежит принцип сочетания предварительно записанных больших фрагментов речи, отдельных фраз, которые комбинируются в нужном порядке. Такие системы синтеза создаются для решения конкретных задач и отличаются высоким качеством синтеза. Для некоторых задач такой синтез является идеальным решением, например, говорящие часы, поскольку качество речи не отличается от живого голоса и в то же время, требуемые для такого синтеза ресурсы, минимальны. Для других задач, например, оповещение на вокзалах, в реализации синтеза могут встретиться трудности, вызванные некоторой вариативностью содержания объявлений. При большом разнообразии объявлений размер записываемого материала может стать значительным. Основное ограничение тематически ориентированного синтеза заключается в том, что синтезировать можно только заданные заранее сообщения со строго определенными вариациями.

5.2 Тематически открытый, универсальный синтез

Синтез речи по произвольному тексту, тема которого заранее не задана (открыта), — гораздо более масштабная и сложная задача. При условии, когда текст может быть любым, для решения задачи естественности звучания всевозможных комбинаций словосочетаний в разнообразных интонационных конструкциях нужно располагать обширной базой фонем для всех вариантов.

Исследования показывают, что для получения удовлетворительного качества синтеза голосовая база диктора-донора должна содержать не менее 2 часов речи. Высокое качество синтеза возникает тогда, когда запись голоса диктора приближается к 10 часам.

Качественный синтез речи по произвольному тексту обязательно требует наличия сложного лингвистического процессора, который преобразует последовательность символов, составляющих текст в последовательность транскрипционных знаков, которая в свою очередь далее преобразуется в речевой сигнал. Лингвистический процессор играет роль искусственного интеллекта. Лингвистический процессор решает, где поставить ударение в словах, как расшифровать сокращения, как прочитать аббревиатуру, где поставить паузу и какой она будет длины и еще много других задач, которые далеко не каждый человек сможет правильно решить, читая текст.

С технологической точки зрения, системы синтеза речи разделяются на серверные решения, решения для ПК и мобильных устройств. Каждая из этих реализаций налагает на систему синтеза определенные условия, которые учитываются на уровне применяемых алгоритмов, состава голосовых и лингвистических баз.

<<< < Предыдущая 1 2 3 45 / 65 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.11.2019192 Кб33ПРОГРАММЫ_К аккредитации 2012_05.13.01.doc
#
26.03.201621.16 Mб46Проект Парка Культуры и Отдыха.pdf
#
02.06.2015104.79 Кб6проект программы по информационному праву.docx
#
04.12.2018280.58 Кб71Проект Учебно-контрольный файл.doc
#
02.06.201532.22 Кб24Проект учр.docx
#
30.04.2019369.42 Кб12проект2.docx
#
26.03.201648.67 Кб5ПРОЕКТ_ВКР-Приложения+-+Правка_17_11_14.docx
#
22.11.2019329.22 Кб30Проектно-сметное дело (Афанасьев)+.doc
#
23.04.20197.83 Mб21Пром эл. Экзамен.doc
#
27.12.201930.66 Кб0Прр 1.docx
#
27.12.2019152.58 Кб0Прр 2.doc