Недостатки существующих голосовых ассистентов и актуальность развития сферы

Несмотря на то что такие ассистенты существуют уже достаточно долгое время, они так и не получили широкого распространения из-за существования ряда ограничений и сфер, где они не могут быть применены. К основным недостаткам можно отнести: ориентированность на решения общих задач, зависимость от интернета и облачных сервисов, сложность или в большинстве случаев невозможность интеграции со сторонними сервисами, незащищенность персональных данных.

В последнее время наблюдается бурный рост популярности голосовых помощников. Они начинают использоваться в различных сферах, наиболее перспективной из которых на данный момент являются помощники для систем умного дома. Но их недостатки и ограничения не позволяют применять их в областях, где недопустима зависимость от различной сетевой инфраструктуры, например, в медицине или в сфере безопасности, а также в узконаправленных областях, где применение общих правил не может решить существующие проблемы.

Уже очевидно, что эта область является наиболее перспективной, особенно если рассматривать ее с точки зрения экосистемы будущего искусственного интеллекта, что приводит к пониманию того, что универсальные системы не смогут покрыть необходимую потребность в разных областях. Поэтому создание более специализированных персональных помощников с более узкими задачами и менее требовательных к инфраструктуре, которые в дальнейшем можно объединять в огромную экосистему, является актуальной задачей.

С учетом недостатков существующих систем была разработана локальная система голосового ассистента, обученная на выполнение специфических задач, решающая обсуждаемые выше проблемы. В следующих разделах будет описан способ создания такой системы.

Метод создания интеллектуального голосового ассистента для специфических задач взаимодействия

Для работы с распознаванием голоса целесообразно использовать существующие системы. Например, проект PocketSphinx. В разрабатываемой системе именно он и был выбран в качестве основного средства распознавания голоса.

PocketSphinx – это инструментарий для автоматического распознавания голоса [14], который неплохо работает на различных маломощных встраиваемых системах, таких как Raspberry Pi, а также является кроссплатформенным, что иявляется причиной выбора данного фреймворка.

Для генерации голоса был выбран наиболее используемый движок Festival, который работает на операционных системах Linux и имеет достаточно неплохие характеристики генерации голоса.

Постановка задачи машинного обучения для интеллектуального анализа намерений

Так как в нашем случае выходными характеристиками может быть набор различных классов (т.е. N-лучших гипотез намерений пользователя), то задача будет представлять собой задачу мультиклассовой классификации, где в одном ответе могут содержаться метки из разных классов. Например, в качестве ответа может вернуться «on;light;bathroom», где каждая часть ответа принадлежит одному из нескольких классов.

<<< < Предыдущая 1 2 34 / 54 5 > Следующая >>>

Соседние файлы в предмете Производственная практика

#
07.09.2020149.65 Кб13Отчёт Ясинский МАЗ.docx
#
07.09.2020149.73 Кб5Печать по Отчёту.docx
#
03.07.2021411.17 Кб4Презентация Растяжение полосы, ослабленной эллептичиским отверстием.pptx
#
21.01.202217.39 Кб6Приветствие для защиты Диплома Кириенко.docx
#
20.09.202159.9 Кб27Реферат Гидропривод с разомкнутой и замкнутой циркуляцией рабочей жидкости.doc
#
21.03.20214.66 Mб6Реферат Интелектуальный помошник.docx
#
06.07.2021140.8 Кб63Реферат Сила давления жидкости на криволинейную стенку.doc
#
01.11.202145.27 Кб11Реферат-Отчёт Атомные подводные лодки с Балестическими ракетами.docx
#
21.01.202239.94 Кб15Рецензия Кириенко А.Ю.doc
#
21.01.202239.94 Кб27Рецензия Ясинский И.С.doc
#
21.06.2021133.36 Кб25Стол поворотный СБ.frw