Системы распознавания предложений и связной речи

Средства мультимедиа этой группы делятся на системы раздельной диктовки и системы распознавания связной речи.

Системы раздельной диктовки проще в разработке и технической реализации, но они требуют от пользователя не совсем естественного произнесения фраз — с короткой паузой перед каждым следующим словом. К таким системам относятся, например, ViaVoice корпорации IBM, DragonDictate фирмы DragonSystem. Последняя система позволяет, наряду с прочим, непосредственно надиктовывать текст в программы Word, WordPerfect, InternetExplorer, NetscapeNavigator и т. д. Активный словарь системы насчитывает десятки тысяч слов и может пополняться пользователем, скажем, по его профессиональной тематике. В системе дополнительно анализируются спектральные (частотные) характеристики каждой буквы, выделяются и хранятся ее отдельные фонемы (элементы спектра). На основе этого анализа создаются фонетические модели букв и формируемых из них слов. Точность распознавания достигает 90%, а после проверки по словарю еще значительно повышается.

Наиболее сложные проблемы возникают при распознавании связной речи. При произнесении связной речи больше сказывается эмоциональная составляющая вводимой информации, и при слитном произношении слов несколько изменяется их звучание — все это, безусловно, затрудняет распознавание.

Наиболее совершенными системами распознавания слитных текстов можно считать системы распознавания речи: DragonNaturallySpeaking компании DragonSystems, ViaVoice корпорации IBM и Wildfire фирмы WildfireCommunications, VoiceXpress фирмы Lernout&HauspieSpeechProducts. Названные системы позволяют обычно после длительной «тренировки» программы надиктовывать «своим» ПК тексты и отдельные команды, иногда даже разным операторам. Так, система ViaVoice позволяет многие виды работ на компьютере выполнять в речевом режиме. Можно надиктовывать текст (письма, отчеты, статьи) непосредственно в Windows-приложения, открывать и закрывать компьютерные файлы, ориентироваться в пределах рабочего стола. Такие речевые команды, как filesave, fileprint, scrollup, scrolldown безошибочно выполняются компьютером. Скорость ввода текста достигает 140 слов в минуту, что намного больше средней скорости ввода информации с клавиатуры.

Системы идентификации по образцу речи

Идентификация по образцу речи относится к биометрическим технологиям идентификации человека по его уникальным физическим признакам, таким как отпечатки пальцев, рисунок радужной оболочки глаз. Речь, подобно подписи, характеризуется множеством постоянных физических параметров (которые, кстати, существенно меньше меняются со временем, чем внешность человека). Цель систем идентификации по образцу речи — идентифицировать конкретного известного системе пользователя и выявить самозванца. Взаимодействие пользователя с системой идентификации состоит из трех этапов:

регистрации пользователя с целью запоминания особенностей его голоса и формирования для него речевой модели;
тестирования, во время которого выполняется сравнение поступившего образца речи с запомненной речевой моделью пользователя, а также возможное выявление модели самозванца из базы моделей голосов множества прочих людей;
допуска к работе в системе, если тестирование прошло успешно и пользователь назвал верный пароль.

<<< < Предыдущая 107 108 109 110 111 112 113 114 115 116 117 118119 / 165119 120 121 122 123 124 125 126 127 128 129 130 131 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.04.20191.34 Mб18полное от Линкевич.doc
#
01.04.2015887.85 Кб59Полностью готовый диплом. на 21мая.docx
#
11.09.20195.32 Mб51Полностью.doc
#
23.04.2019363.01 Кб10полный ответы для подготовки.doc
#
28.09.201924.27 Mб13Полный спектр доминирования (Уильям Энгдаль).rtf
#
17.04.201910.83 Mб26Полный текст учебника.docx
#
01.04.2015396.8 Кб19Полный текст.doc
#
01.04.2015517.77 Кб15положение 34 н.rtf
#
14.03.201617.17 Кб22Положение об Олимпиаде.docx
#
01.04.20151.3 Mб11Положение ЦБ РФ 2П.rtf
#
01.04.2015404.15 Кб13Полупанова Курсовая р. ЭМХ.docx