
- •1.1. Распознавание речевых сообщений.
- •1.2. Синтез речевых сообщений.
- •1.3. Документирование речевых сообщений с использованием эффективных систем сжатия информации.
- •1.4. Передача речевых сообщений в компьютерных сетях .
- •2. Общие понятия о системах распознавания речи и обзор современных систем распознавания речи.
- •2. 1. Классификация систем распознавания речи.
- •2.2. Обзор современных систем распознавания речевой информации.
- •2.2.1. Русско-язычные системы распознавания речи.
- •1. Система распознавания речевых команд "Труфалдино",
- •3. Система диктовки русской речи "Горыныч".
- •2.2.2. Англоязычные системы распознавания речи
- •1. Dragon NaturallySpeaking
- •2. DragonDictate for Windows.
- •3. Ibm VoiceType Dictation
- •4. Ibm ViaVoice 98 Executive Edition
- •5. Kurzweil Voice for Windows
- •7. Microsoft Dictation Research Demonstration
- •8. Microsoft Command and Control Engine
- •3. Речевой сигнал и его структура
- •3.1 Фонетическая модель речевого сигнала
- •3.2 . Фонетическая структура речи.
- •3.3. Линейная математическая модель речеобразования.
- •3.4. Математическая модель речеобразования в терминах z-преобразования.
2.2. Обзор современных систем распознавания речевой информации.
2.2.1. Русско-язычные системы распознавания речи.
На российском рынке в настоящее время можно выделить две основных фирмы , поставляющие системы распознавания ограниченного набора команд .
- Iteractive Products, INC (г, Москва) и Центр Речевых Технологий (С,-Петербург)
1. Система распознавания речевых команд "Труфалдино",
Система является разработкой фирмы "Центр Речевых Технологий " (г. С._Петербург)
Функциональные характеристики:
распознает разнообразные наборы речевых команд;
активизируется после произнесения ключевого слова;
работает в режиме распознавания для любого языка;
настраивается на любой новый голос;
владеет функцией речевого ответа для подтверждения принятой команды;
имеет отдельную функцию ограничения доступа к управлению - чтобы ограничить доступ пользователей к некоторым командам.
система ориентирована на распознавание около 100 речевых команд,
Система может быть использована для речевого управления программными комплексами , а также для оперативного ввода цифровой и текстовой информации без использования клавиатуры.
2. Система распознавания команд JUST VOICE 95 PRO (Iteractive Products, INC )
Это профессиональная система управления компьютером с помощью голоса для WINDOWS 95 (есть также версия для WINDOWS 3.XX).
Система относится к классу систем распознавания одиночных команд.
Позволяет запускать с помощью голосовых команд клавиатурные и мышиные макросы в любом приложении, при необходимости выполнять команды макросов с регулируемой задержкой. Имеются возможности голосового ответа компьютера в ответ на поданную команду и дополнительного подтверждения пользователем распознанных голосовых команд. Настраивается на говорящего. Любой язык. Устойчивая работа в шумной обстановке. Встроены голосовое подтверждение, голосовой и звуковой ответ. Отслеживается переключение языков и раскладок клавиатуры. Строки из символов национальных алфавитов могут включаться в состав макросов, вызываемых к исполнению голосовыми командами. Непосредственно из макросов могут напрямую вызываться мультимедийные функции. Надёжность распознавания голосовых команд при размере словаря 200 команд - не менее 97%.
3. Система диктовки русской речи "Горыныч".
Представляет собой конвертор русской речи в текст. Система создана на базе инструментария англо-язычной системы диктовки DRAGON DICTATE, и аналогична ей по своим параметрам. Русско-язычная версия системы имеет словарь размером 10 тысяч слов, который пользователь может редактировать самостоятельно.
Система требует тщательной настройки оборудования и определённой дисциплинированности диктора. Требуются несколько дней, чтобы полностью настроить программу на голос конкретного человека. Однако после этого многие рутинные офисные операции заметно упростятся и ускорятся.
Программа позволяет также осуществлять с помощью голоса управление компьютером - в ней имеется так называемый командный режим.
Русский модуль системы «Горыныч» предназначен для совместной работы с американской программой Dragon Dictates. Система поддерживает работу в 32-разрядном режиме.
Данная система была тестирована в работе с Windows-95 (русской upgrade и стандартной версиями, Pan-European и русифицированной американской версиями), а также Windows 3.xx. Система рассчитана на работу и под Windows NT.
Минимальная конфигурация компьютера, необходимая для успешной работы системы диктовки на русском языке: процессор Pentium 100, оперативная память от 16 Мбайт, звуковая карта, аналогичная Sound Blaster. На жёстком диске система занимает около 50 Мбайт. Система работает на всех платформах Windows. в том числе и Windows NT.