Билет № 20

Основные области практического применения речевых технологий. Конкретные примеры.

Каждый пользователь мечтает о том, что бы иметь возможность подключить микрофон (или диктофон) к компьютеру и видеть весь поток слов в текстовом редакторе или, что бы его слова воспринимались, как команды к исполнению соответствующими устройствами, по его желанию.

4.1. Еще в 1996 г. Компания Lernout & Hauspie Speech Products

предоставила лицензию на разработанную ею технологию распознавания речи (Automatic Speech Recognition, ASR) корейской корпорации LG Group для использования в широком спектре продуктов - бытовой электронике, средствах связи и компьютерных системах.

В частности, устройства Hands Free Phone ("телефон, оставляющий руки свободными"). Пользователи такого телефона могут голосом диктовать требуемый номер и выбирать те или иные функции. LG использует, так же технологию распознавания речи при создании мультимедиа-ПК, в системах автонавигации, в "обучаемых" роботах.

Технология распознавания речи, разработанная Lernout & Hauspie многоязычна. В настоящее время она поддерживает целый спектр языков: американский и британский английский, французский, немецкий, а так же корейский, арабский, китайский и японский. Именно многоязычность послужила решающим фактором при выборе лицензируемой технологии ASR.

Lernout & Hauspie, так же предоставила лицензию на свою технологию ASR компании Acer Sertek, входящей в состав Acer Group

для использования распознавания речи при разработке мультимедиа-приложений, которыми будут комплектоваться ПК и периферийные устройства производства Acer.

4.2. Управление голосом Vocollect

Впервые представленная на мировом рынке около 10 лет назад, технология распознавания речи (или голосовая технология) доказала свою эффективность в широком спектре отраслей. Практика показывает, что использование технологии распознавания речи, например на складах позволяет:

Увеличить производительность более чем на 35%;
Увеличить точность операций по сбору заказов до 99,99%;
Сократить время, необходимое для обучения персонала на 50 %;
Минимизировать дефицит товара на складе.

Фирма Psion Teklogix, например разработала комплексную голосовую систему Vocollect®, включающую в себя терминал Talkman T2, по сути это многофункциональный носимый индустриальный компьютер, управляемый голосом, с поддержкой беспроводной связи.

Терминал Talkman T2 использует систему распознавания речи Vocollect®, интегрированную с технологией синтеза речи, предоставляющую пользователям связь в реальном времени со складом, производством и другими бизнес - системами. Внутренняя архитектура терминала, совместимая со стандартом Wi-Fi, предоставляет возможность интеграции в существующие или новые радиосети.

Как работает система?

Система Voice-Directed Distribution™ принимает выдаваемые центральным компьютерной системой управления (ЦКСУ) задачи (например, список отбора или запрос на пополнение) и передает сотрудникам голосовые пошаговые указания по выполнению их повседневных задач. Терминал Talkman преобразует данные в речевые команды, направляя сотрудника к определенному проходу и ячейке. Сотрудники подтверждают свое местонахождение, произнося в микрофон гарнитуры системы распознавания речи числовой идентификатор (контрольное число).

Система распознавания речи преобразует слова сотрудника в текст и отправляет эти данные по беспроводной сети обратно в ЦКСУ. При выполнении задачи сотрудник общается с ЦКСУ через носимый на ремне терминал Talkman и гарнитуру системы распознавания речи (наушники с микрофоном). Система производит учет количества единиц отобранного товара только после произнесения сотрудником

правильного проверочного числа. В этот момент задание считается завершенным, и пользователь направляется к следующему месту, указанному в задаче.

Все это позволяет:

выполнять работу быстрее, с большей точностью и более высоким уровнем безопасности;
исправлять ошибки инвентаризации сразу при их появлении;
снижать количество ошибок при комплектовании заказа;
контролировать работу персонала;
снижать количество бумажной документации.

Программное обеспечение Vocollect®

Программа VoiceClient установленная на терминале Talkman T2 включает в себя индустриальную систему распознавания речи. Vocollect® организована как базирующаяся на распознавании слов и зависимая от голоса пользователя система, предназначенная специально для зашумленных производственных помещений.

Система может поддерживать пользователей, говорящих на разных языках и распознавать отдельные слова отфильтровывая любые лишние фоновые звуки и шум.

<<< < Предыдущая 8 9 10 11 12 13 14 15 16 17 18 1920 / 3620 21 22 23 24 25 26 27 28 29 30 31 32 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.08.2019614.91 Кб6Ответы к экзамену по Б_Д.doc
#
18.07.201927.73 Mб14Ответы колоквиум.docx
#
01.05.20252.75 Mб0ответы КТОП.doc
#
01.04.2025535.9 Кб1ответы макроэкономика.docx
#
01.03.20251.03 Mб3Ответы мат анализ.doc
#
05.09.20191.84 Mб25Ответы на билеты.doc
#
18.09.2019150.74 Кб24Ответы на вопросы по Менеджменту.docx
#
01.05.2025166.4 Кб4ответы на вопрсы.docx
#
08.12.2018835.07 Кб23ответы на инфу!.doc
#
17.04.2019393.22 Кб22Ответы на программирование.doc
#
18.09.20191.73 Mб53ответы на устный гос.doc