Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Реферат Интелектуальный помошник.docx
Скачиваний:
6
Добавлен:
21.03.2021
Размер:
4.66 Mб
Скачать

Недостатки существующих голосовых ассистентов и актуальность развития сферы

Несмотря на то что такие ассистенты существуют уже достаточно долгое время, они так и не получили широкого распространения из-за существования ряда ограничений и сфер, где они не могут быть применены. К основным недостаткам можно отнести: ориентированность на решения общих задач, зависимость от интернета и облачных сервисов, сложность или в большинстве случаев невозможность интеграции со сторонними сервисами, незащищенность персональных данных.

В последнее время наблюдается бурный рост популярности голосовых помощников. Они начинают использоваться в различных сферах, наиболее перспективной из которых на данный момент являются помощники для систем умного дома. Но их недостатки и ограничения не позволяют применять их в областях, где недопустима зависимость от различной сетевой инфраструктуры, например, в медицине или в сфере безопасности, а также в узконаправленных областях, где применение общих правил не может решить существующие проблемы.

Уже очевидно, что эта область является наиболее перспективной, особенно если рассматривать ее с точки зрения экосистемы будущего искусственного интеллекта, что приводит к пониманию того, что универсальные системы не смогут покрыть необходимую потребность в разных областях. Поэтому создание более специализированных персональных помощников с более узкими задачами и менее требовательных к инфраструктуре, которые в дальнейшем можно объединять в огромную экосистему, является актуальной задачей.

С учетом недостатков существующих систем была разработана локальная система голосового ассистента, обученная на выполнение специфических задач, решающая обсуждаемые выше проблемы. В следующих разделах будет описан способ создания такой системы.

Метод создания интеллектуального голосового ассистента для специфических задач взаимодействия

Для работы с распознаванием голоса целесообразно использовать существующие системы. Например, проект PocketSphinx. В разрабатываемой системе именно он и был выбран в качестве основного средства распознавания голоса.

PocketSphinx – это инструментарий для автоматического распознавания голоса [14], который неплохо работает на различных маломощных встраиваемых системах, таких как Raspberry Pi, а также является кроссплатформенным, что иявляется причиной выбора данного фреймворка.

Для генерации голоса был выбран наиболее используемый движок Festival, который работает на операционных системах Linux и имеет достаточно неплохие характеристики генерации голоса.

Постановка задачи машинного обучения для интеллектуального анализа намерений

Так как в нашем случае выходными характеристиками может быть набор различных классов (т.е. N-лучших гипотез намерений пользователя), то задача будет представлять собой задачу мультиклассовой классификации, где в одном ответе могут содержаться метки из разных классов. Например, в качестве ответа может вернуться «on;light;bathroom», где каждая часть ответа принадлежит одному из нескольких классов.