Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кривнова_Темы курс_работ-2010-F.doc
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
110.59 Кб
Скачать

Нормализация текста

  1. Типы текстовых объектов, требующих вербализации при синтезе речи по тексту и способы её осуществления (цифры, числа, аббревиатуры, сокращения и пр.). Особенности их нормализации.

  2. Автоматическая расстановка словесных ударений в письменном тексте на базе машинного словаря и правил (стандартные и сложные случаи: омографы, сложные слова, собственные имена, новые слова и т.д.)

Машинный словарь

  1. Детализация, пополнение, корпусная верификация словарной информации в электронной версии Грамматического словаря А.А.Зализняка.

  1. Создание электронного произносительного словаря русского языка с учетом разных стилей и типов произношения слов в речи.

    1. Электронный словарь и акцентуация собственных русских имен и фамилий; новые частотные слова и словоформы.

Задача фонетизации текста:

      1. Макросегментация текста, возможности и проблемы автоматизации: ключи для формирования ритмико-интонационной структуры текста при его озвучивании и др. Синтаксические (частеречные) шаблоны единиц снтонационно-смыслового членения текста.

  1. Правила выбора и локализации синтаксических и смысловых акцентов.

  2. Построение автоматических фонетических транскрипторов (прежде всего сегментных) на основе правил и/или параллельных текстов: орфографического и фонетического. Задача автоматической верификации результатов работы автоматического транскриптора (например, с помощью методов автоматического распознавания речи).

Просодия

  • Возможности и проблемы формализации ритмико-интонационной организации текста задачах автоматического синтеза речи; просодическая параметризация интонационных моделей, интонационных границ и составляющих, акцентов разного типа и пр.

Озвучивание текстов разных типов

  • Особенности озвучивания SMS-сообщений.

  • Оценка качества синтезированной речи с помощью перцептивного эксперимента и методов автоматического распознавания речи.

Автоматическое распознавание речи (Речь-Текст)

  1. «Перцептивные карты» слов в устных текстах разного типа, в разных дискурсивных и произносительных условиях. Контекстная помехоустойчивость звуков разных классов.

  2. Тестовые таблицы для анализа восприятия речи в шуме – легкие=помехоустойчивые и трудные = помехонеустойчивые, проведение контрольных экспериментов.

    1. Кодовые книги как представление акустического пространства русской речи.

  • Кодовые книги для разных языков – английского по ТIМIТ и русского по RuSpeech или другим материалам; для одного языка – но разных групп дикторов, жанров речи….

    1. Типовые фонетические дефекты в русской речи иностранцев: исследование и сбор ресурсов для анализа факторов, влияющих на речепроизводство отдельного говорящего.

      Акустико-фонетические базы данных и другие речевые материалы).

  1. Оценка индивидуальных различий в произношении слов (в изолированном случае) методом динамического программирования (ДП). Оценка различий в звуковых реализациях синтетической и естественной речи методом ДП.

  1. Просодия в задачах автоматического распознавания и аннотирования устных текстов. Паузы как основа для автоматической сегментации звучащей речи на дискурсивные речевые отрезки в разных типах дискурса при его распознавании и аннотировании;

Речевые корпуса и базы данных

  1. Акустические базы данных для исследования и моделирования фразовой просодии (подбор и запись текстов; принципы просодической разметки; инструментарий; имеющийся опыт - система ToBI: Tone and Break Indices), база на основе системы С.В.Кодзасова.