
- •1) Анализ существующих решений по данной области исследований (прямых и косвенных аналогов).
- •Рекомендации контента
- •Поисковики
- •Маркетинговая автоматизация
- •Соцсети
- •2) Описание существующих моделей и алгоритмов при разработке таких интеллектуальных помощников.
- •Принцип работы голосового ассистента на примере «Алисы» от компании «Яндекс»
- •Недостатки существующих голосовых ассистентов и актуальность развития сферы
- •Метод создания интеллектуального голосового ассистента для специфических задач взаимодействия
- •Список использованных источников
Недостатки существующих голосовых ассистентов и актуальность развития сферы
Несмотря на то что такие ассистенты существуют уже достаточно долгое время, они так и не получили широкого распространения из-за существования ряда ограничений и сфер, где они не могут быть применены. К основным недостаткам можно отнести: ориентированность на решения общих задач, зависимость от интернета и облачных сервисов, сложность или в большинстве случаев невозможность интеграции со сторонними сервисами, незащищенность персональных данных.
В последнее время наблюдается бурный рост популярности голосовых помощников. Они начинают использоваться в различных сферах, наиболее перспективной из которых на данный момент являются помощники для систем умного дома. Но их недостатки и ограничения не позволяют применять их в областях, где недопустима зависимость от различной сетевой инфраструктуры, например, в медицине или в сфере безопасности, а также в узконаправленных областях, где применение общих правил не может решить существующие проблемы.
Уже очевидно, что эта область является наиболее перспективной, особенно если рассматривать ее с точки зрения экосистемы будущего искусственного интеллекта, что приводит к пониманию того, что универсальные системы не смогут покрыть необходимую потребность в разных областях. Поэтому создание более специализированных персональных помощников с более узкими задачами и менее требовательных к инфраструктуре, которые в дальнейшем можно объединять в огромную экосистему, является актуальной задачей.
С учетом недостатков существующих систем была разработана локальная система голосового ассистента, обученная на выполнение специфических задач, решающая обсуждаемые выше проблемы. В следующих разделах будет описан способ создания такой системы.
Метод создания интеллектуального голосового ассистента для специфических задач взаимодействия
Для работы с распознаванием голоса целесообразно использовать существующие системы. Например, проект PocketSphinx. В разрабатываемой системе именно он и был выбран в качестве основного средства распознавания голоса.
PocketSphinx – это инструментарий для автоматического распознавания голоса [14], который неплохо работает на различных маломощных встраиваемых системах, таких как Raspberry Pi, а также является кроссплатформенным, что иявляется причиной выбора данного фреймворка.
Для генерации голоса был выбран наиболее используемый движок Festival, который работает на операционных системах Linux и имеет достаточно неплохие характеристики генерации голоса.
Постановка задачи машинного обучения для интеллектуального анализа намерений
Так как в нашем случае выходными характеристиками может быть набор различных классов (т.е. N-лучших гипотез намерений пользователя), то задача будет представлять собой задачу мультиклассовой классификации, где в одном ответе могут содержаться метки из разных классов. Например, в качестве ответа может вернуться «on;light;bathroom», где каждая часть ответа принадлежит одному из нескольких классов.