Моделирование процесса распознавания голосовых команд

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пензенский государственный технологический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

практика.docx

Скачиваний:

Добавлен:

01.05.2025

Размер:

297.35 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 54 5 > Следующая >>>

Моделирование процесса распознавания голосовых команд

Обобщенный процесс распознавания голосовых команд представлен на рисунке 1.1. В начале работы на экран выводится главное окно, и пользователь выбирает режим работы программы. После этого на динамик микрофона подается звуковой сигнал, за который отвечает подсистема ввода сигнала. Если выбран режим создания эталона, за который отвечает подсистема хранения базы данных (БД) голосовых команд и их идентификации, то программа обрабатывает и сохраняет входной сигнал с микрофона. Если же выбран режим распознавания, то программа обрабатывает результаты и сравнивает с заранее записанным эталоном в БД, сохраняет входной сигнал и переходит к его распознаванию с помощью программного продукта (Глава 1.4.), результат распознавания выводится на дисплей.

Таким образом, в структуре информационной системы голосового управления персональным компьютером можно выделить подсистемы: ввода информации, цифровой обработки сигналов, идентификации и базы данных голосовых команд – каждой из которых присущи свои задачи, методы, алгоритмы.

Рисунок 1.1 – обобщенное представление процесса распознавания голосовых команд

Моделирование информационной системы распознавания голосовых команд

В данном разделе требуется разработать модель работы информационной системы распознавания голосовых команд средствами UML 8.0 (англ. Unified Modeling Language – унифицированный язык моделирования) – язык графического описания для объектного моделирования в области разработки программного обеспечения.

1.5.1 Бизнес-модель системы

Модель распознавания голосовых команд представлена на рисунке 1.2.

В рамках бизнес-модели были выделены следующие действующие лица:

Пользователь – лицо, которое обладает доступом к основной функциональности системы, т.е. может осуществлять ввод информации в систему, заполнение БД системы, просмотр результата анализа данных.

Администратор расширяет права пользователя, он имеет возможность настраивать систему (изменять БД, конфигурировать аппаратную часть системы, настраивать режимы работы и т.д.).

База данных – является внутренним компонентом системы, представляет собой хранилище эталонов сигналов.

Микрофон – осуществляет прием голосовых команд.

Рисунок 1.2 – бизнес-модель распознавания голосовых команд

Описание вариантов использования (рисунок 1.2 и рисунок 1.3) представлено в таблицах с 1.3 по 1.12.

Таблица 1.3 - Сценарий 1

Вариант использования	Получение голосовых команд
Актеры	Пользователь, микрофон
Цель	Получение данных о текущей команде
Тип	Базовый
Типичный ход событий: На вход АЦП через схемы деления и защиты поступает голосовая команда. Осуществляется преобразование голосовой команды в цифровой код. Цифровые коды голосовой команды поступают в микроконтроллер, который осуществляет их предварительную обработку.

Таблица 1.4 - Сценарий 2

Вариант использования	АЦП голосовых команд
Актеры	Микрофон
Цель	Аналого-цифровое преобразование голосовых команд
Тип	Включенный
Типичный ход событий: Цифровой код голосовой команды поступает в микроконтроллер. Микроконтроллер выполняет обработку значения с помощью процедуры, реализующей цифровой фильтр. Обработанное значение голосовой команды поступает в оперативную память микроконтроллера.

Таблица 1.5 - Сценарий 3

Вариант использования	Цифровая обработка голосовых команд
Актеры	Пользователь
Цель	Шумоочистка сигнала
Тип	Базовый
Типичный ход событий: В потоковом режиме микроконтроллер после получения сигнала производит фильтрацию.

Таблица 1.6 - Сценарий 4

Вариант использования	Фильтрация сигнала
Актеры	Пользователь
Цель	Выделение информативной части сигнала
Тип	Включенный
Типичный ход событий: На полученный сигнал накладываются фильтры для выделения информативной части.

Таблица 1.7 - Сценарий 5

Вариант использования	Архивация результатов обработки
Актеры	Пользователь
Цель	Сохранение обработанных данных
Тип	Базовый
Типичный ход событий: Отфильтрованный сигнал проходит шифрование и затем передается в БД.

Таблица 1.8 - Сценарий 6

Вариант использования	Шифрование данных
Актеры	Пользователь
Цель	Шифрование и дешифрование пакетов данных, передаваемых по каналу связи
Тип	Включенный
Типичный ход событий: Передаваемый пакет данных обрабатывается процедурой шифрования. Получаемый пакет данных обрабатывается процедурой дешифрования.

Таблица 1.9 - Сценарий 7

Вариант использования	Хранение данных (БД)
Актеры	Пользователь
Цель	Формирование библиотеки голосовых команд
Тип	Включенный
Типичный ход событий: Формируется библиотека обработанных голосовых команд, с дальнейшим доступом в нее. Обращение в БД при последующей идентификации голосовых команд.

Таблица 1.10 - Сценарий 8

Вариант использования	Идентификация голосовых команд
Актеры	Пользователь
Цель	Определение вероятности совпадения веденного сигнала с БД
Тип	Базовый
Типичный ход событий: Накопленный массив значений сигнала поступает в программу идентификации, которая реализует расчет вероятности совпадения с помощью нейронной сети.

Таблица 1.11 - Сценарий 9

Вариант использования	Получение вектора признаков
Актеры	Пользователь
Цель	Формирование признаков сигнала
Тип	Включенный
Типичный ход событий: Система идентификации голосовых команд формирует вектор признаков и подает массив значений сигнала на вход обученной нейронной сети.

Таблица 1.12 Сценарий 10

Вариант использования	Аппаратная и программная настройка
Актеры	Пользователь, администратор
Цель	Настройка ПО и аппаратной части системы
Тип	Базовый
Типичный ход событий: Настройка аппаратной части моделируемой системы. Настройка ПО.

1.5.2 Функциональная модель

На основе бизнес-модели системы распознавания голосовых команд и, выделения основных её функций, была разработана функциональная модель.

Данная модель показывает варианты использования проектируемой системы, заключенные в границу системы, и внешних актеров, а также определенные отношения между актерами и вариантами использования.

Модель (рисунок 1.3) позволяет определить общие границы функциональности проектируемой системы в контексте моделируемой предметной области, специфицировать требования к функциональному поведению проектируемой системы, разработать исходную концептуальную модель системы для ее последующей детализации в форме логических и физических моделей, а также подготовить исходную документацию для взаимодействия разработчиков системы с ее заказчиками и пользователями.

Рисунок 1.3 – функциональная модель

Создание системы такого класса следует проводить в соответствии со следующими требованиями:

1) Требования к подсистеме ввода данных

Входными данными для подсистемы сбора является голосовая команда (сигнал) пользователя. Рассматриваются звуковые сигналы с частотой в диапазоне от 300 Гц до 4000 Гц.

Основной задачей при вводе данных является аналого-цифровое преобразование сигнала, а так же передача данных в подсистему цифровой обработки информации. Обосновать технические характеристики АЦП.

2) Требования к подсистеме цифровой обработки данных

В подсистеме цифровой обработки данных необходимо обеспечить:

первичную обработку с помощью фильтра нижних частот;

– обработку винеровским фильтром для выделения более четкого сигнала.

3) Требования к подсистеме идентификации и хранения информации

Подсистема идентификации и хранения информации в активном режиме должна определять вероятность совпадения входного сигнала с заложенной библиотекой голосовых команд; быть оборудована оперативной памятью, используемой для хранения текущих измерений, промежуточных результатов расчетов и анализа.

4) Требования к оптимизации

Провести анализ качества работы информационной системы голосового управления персональным компьютером и определить точность работы подсистемы идентификации. Спланировать и провести эксперимент, позволяющий определить оптимальную оценку отдельных параметров.

5) Требования по экономическому обоснованию

Проанализировать экономическую целесообразность создания предприятия, специализирующегося на выпуске информационной системы распознавания речи. Произвести расчет основных показателей, отображающих экономическую выгоду от привлечения заемных средств для реализации проекта.

6) Требования по безопасности, защищенности и надежности

Система должна удовлетворять требованиям безопасности, надежности и защищенности. В рамках подсистемы ввода данных требования включают обеспечение защищенности и безопасности путем реализации шифрования передачи данных между устройствами.

<<< < Предыдущая 1 2 34 / 54 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.04.20151.32 Mб66Поясниельная записка.docx
#
01.05.20251.24 Mб0Поясниловка.doc
#
01.05.2025148.56 Кб0Пр № 29 Изучение ассортимента пряностей.docx
#
10.04.2015141.82 Кб46право.doc
#
01.05.2025118.27 Кб0практика молоко..doc
#
01.05.2025297.35 Кб0практика.docx
#
01.03.20251.34 Mб2ПРАКТИКУМ часть 1.doc
#
01.03.20252.37 Mб1ПРАКТИКУМ часть 2.doc
#
15.03.2016139.26 Кб56Практическая работа.doc
#
09.12.2018906.75 Кб6Практические работы (Access2007).doc
#
29.08.2019118.14 Кб4ПРАКТИЧЕСКИЕ РАБОТЫ 11 и 12.docx

Моделирование процесса распознавания голосовых команд

Моделирование информационной системы распознавания голосовых команд