Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы на билеты.doc
Скачиваний:
25
Добавлен:
05.09.2019
Размер:
1.84 Mб
Скачать

Билет № 20

  1. Основные области практического применения речевых технологий. Конкретные примеры.

Каждый пользователь мечтает о том, что бы иметь возможность подключить микрофон (или диктофон) к компьютеру и видеть весь поток слов в текстовом редакторе или, что бы его слова воспринимались, как команды к исполнению соответствующими устройствами, по его желанию.

4.1. Еще в 1996 г. Компания Lernout & Hauspie Speech Products

предоставила лицензию на разработанную ею технологию распознавания речи (Automatic Speech Recognition, ASR) корейской корпорации LG Group для использования в широком спектре продуктов - бытовой электронике, средствах связи и компьютерных системах.

В частности, устройства Hands Free Phone ("телефон, оставляющий руки свободными"). Пользователи такого телефона могут голосом диктовать требуемый номер и выбирать те или иные функции. LG использует, так же технологию распознавания речи при создании мультимедиа-ПК, в системах автонавигации, в "обучаемых" роботах.

Технология распознавания речи, разработанная Lernout & Hauspie многоязычна. В настоящее время она поддерживает целый спектр языков: американский и британский английский, французский, немецкий, а так же корейский, арабский, китайский и японский. Именно многоязычность послужила решающим фактором при выборе лицензируемой технологии ASR.

Lernout & Hauspie, так же предоставила лицензию на свою технологию ASR компании Acer Sertek, входящей в состав Acer Group

для использования распознавания речи при разработке мультимедиа-приложений, которыми будут комплектоваться ПК и периферийные устройства производства Acer.

4.2. Управление голосом Vocollect

Впервые представленная на мировом рынке около 10 лет назад, технология распознавания речи  (или голосовая технология) доказала свою эффективность в широком спектре отраслей. Практика показывает, что использование технологии распознавания речи, например на складах позволяет:

  • Увеличить производительность более чем на 35%;

  • Увеличить точность операций по сбору заказов до 99,99%;

  • Сократить время, необходимое для обучения персонала на 50 %;

  • Минимизировать дефицит товара на складе.

Фирма Psion Teklogix, например разработала комплексную голосовую систему Vocollect®, включающую в себя терминал Talkman T2, по сути это многофункциональный носимый индустриальный компьютер, управляемый голосом, с поддержкой беспроводной связи.

Терминал Talkman T2 использует систему распознавания речи Vocollect®, интегрированную с технологией синтеза речи, предоставляющую пользователям связь в реальном времени со складом, производством и другими бизнес - системами. Внутренняя архитектура терминала, совместимая со стандартом Wi-Fi, предоставляет возможность интеграции в существующие или новые радиосети.

Как работает система?

Система Voice-Directed Distribution™ принимает выдаваемые центральным компьютерной системой управления (ЦКСУ) задачи (например, список отбора или запрос на пополнение) и передает сотрудникам голосовые пошаговые указания по выполнению их повседневных задач. Терминал Talkman преобразует данные в речевые команды, направляя сотрудника к определенному проходу и ячейке. Сотрудники подтверждают свое местонахождение, произнося в микрофон гарнитуры системы распознавания речи числовой идентификатор (контрольное число).

Система распознавания речи преобразует слова сотрудника в текст и отправляет эти данные по беспроводной сети обратно в ЦКСУ. При выполнении задачи сотрудник общается с ЦКСУ через носимый на ремне терминал Talkman и гарнитуру системы распознавания речи (наушники с микрофоном). Система производит учет количества единиц отобранного товара только после произнесения сотрудником

правильного проверочного числа. В этот момент задание считается завершенным, и пользователь направляется к следующему месту, указанному в задаче.

Все это позволяет:

  • выполнять работу быстрее, с большей точностью и более высоким уровнем безопасности;

  • исправлять ошибки инвентаризации сразу при их появлении;

  • снижать количество ошибок при комплектовании заказа;

  • контролировать работу персонала;

  • снижать количество бумажной документации.

Программное обеспечение Vocollect®

Программа VoiceClient установленная на терминале Talkman T2 включает в себя индустриальную систему распознавания речи. Vocollect® организована как базирующаяся на распознавании слов и зависимая от голоса пользователя система, предназначенная специально для зашумленных производственных помещений.

Система может поддерживать пользователей, говорящих на разных языках и распознавать отдельные слова отфильтровывая любые лишние фоновые звуки и шум.