
- •Домашнее задание
- •Порядок выполнения работы:
- •Часть 1: Разработка простого алгоритма распознавания речевых команд
- •1.1. Ознакомление с возможностями программ CoolEdit Pro и Spectra_Lab
- •1.2 Запись команд
- •1.3. Обработка записанных треков
- •1.4. Построение ачх каждого слова и занесение данных в программу Excel
- •1.5 Построение векторов признаков
- •Часть 2: Построение нечетко-логического алгоритма распознавания голосовых команд
- •2.1 Общие сведения
- •2.2 Ознакомление с главным окном программы FuzzyLogictoolbox
- •2.3 Создание входных переменных
- •2.4 Формирование выходных переменных и базы правил
- •2.5 Заключение
- •Часть 3: Автоматизация
- •3.1 База данных признаков
- •3.2 Постановка задачи
- •3.3 Построение нечетко-логической модели
- •3.4 Распознавание слова
- •Часть 4: Выполнение первой и второй части с использованием аппроксимации ачх и сравнение решения с третей частью
- •Часть 5: Алгоритм распознавания, построенный на нейронной сети
- •5.1. Построение нейронной сети
- •5.2. Обучение сети
- •5.2. Испытания модели
- •5.2.1. Испытание 1. Обучение нейросети по первому и второму файлу
- •5.2.2. Испытание 3. Обучение нейросети по среднему
- •Направления дальнейшей работы
- •Рекомендуемая литература
Домашнее задание
«Построение программы голосового управления»
Цель домашнего задания:
создание алгоритма и программы распознавания голосовых команд для управления роботом.
Необходимые инструменты:
Микрофон для записи звука;
Программа обработки звука CoolEdit для удаления шума;
Программа Spectra Lab для получения АЧХ;
Программа Excel – обработка результатов.
Теоретическая часть
Распознаванием образа объекта называется процесс, при котором на основании набора признаков (дискрипторов) некоторого объекта определяется его принадлежность к определенному классу. Задачи такого класса требуют активного применения методов искусственного интеллекта и экспертных систем. Кроме того, для эффективного распознавания нужно, чтобы оно проводилось в тех же условиях, что и формирование признаков объекта. Во всяком случае, различия в значениях признаков объекта, полученных на этапе обучения и при распознавании, не должны быть слишком велики.
Условно
все методы распознавания можно разделить
на две группы: теоретические и структурные.
Наиболее распространенные теоретические
методы распознавания используют принципы
теории принятия решений. Рассмотрим
группу, состоящую из M
классов объектов
На этапе описания формируетсяn-мерное
пространство признаков, такое, что
каждому объекту соответствует свой
вектор признаков
Компонентами этого вектора обычно
служат рассмотренные ранее геометрические
признаки объекта. Тогда распознавание
представляет собой процедуру отнесения
данного объекта к одному изM
классов на основании анализа его
вектора признаков. Согласно теории
принятия решений, нужно найти M
дискриминирующих функций
таких,
чтобы для произвольного вектора
принадлежащего
некоторому классу, выполнялось неравенство
вида:
при
всех
Таким
образом, неизвестный объект, обладающий
вектором признаковраспознается (т. е. относится кi-му
классу), если при подстановке
во все дискриминирующие функции функция
будет иметь наибольшее значение. При
построении дискриминирующих функций
обычно используется эталонный вектор
с которым сравниваются векторы признаков
объектов. В качестве эталонного может
быть выбран вектор, все компоненты
которого являются средними арифметическими
значениями соответствующих компонент
всех объектов заданного класса.
В робототехнике обычно рассматривается частный случай распознавания, когда все возможные типы объектов и их классы заранее известны. Тогда процедура распознавания сводится к классификации образов объектов, т.е. отнесению априорно известных объектов к априорно известным классам.
Формирование признаков производится на этапе описания объекта. Выбор описания является очень ответственной задачей: если оно выбрано удачно, то распознавание (идентификация) может быть проведена достаточно легко, и наоборот. Чаще всего формирование признаков производится непосредственно разработчиком системы распознавания или экспертом, хорошо знающим конкретную задачу. Поэтому, универсальных подходов к выбору признаков не существует, и при распознавании объектов велика роль субъективного фактора.
Строго говоря, определить реальное значение признаков объекта невозможно, так как значения различаются при каждом измерении. Поэтому задача распознавания ставится так: определить вероятность того, что объект принадлежит к заданному классу. Поскольку распознавание является вероятностной процедурой, возможны варианты, когда объект идентифицируется как принадлежащий другому классу или как не принадлежащий никакому классу вообще.
При голосовом управлении роботом словарь классов значительно меньше, чем в задачах распознавания речи. Число голосовых команд, как правило, не превышает 10 … 20 слов.