
- •Реферат
- •834 Группы по специальности ортор
- •Оглавление
- •Введение
- •Основная часть.Современные системы распознавания речи
- •Программные ядра для аппаратных реализаций
- •Наборы библиотек для разработки приложений
- •Независимые пользовательские приложения
- •Специализированные приложения
- •Устройства, выполняющие распознавание на аппаратном уровне
- •Теоретические исследования и разработки
- •Перспективы разработки систем распознавания речи
- •Список использованных источников
Выборгский филиал Санкт-Петербургского Государственного Университета Гражданской Авиации
Инженерно-технический факультет
Реферат
Студента I курса очного отделения
834 Группы по специальности ортор
Старкова Артема Артуровича
На тему: « Современные технологии распознавания речи»
Предмет:информатика
Преподаватель: Валерий Федорович Барышников
Рецензия и подпись преподавателя:_____________________________________________
_____________________________________________________________________________
_____________________________________________________________________________
_____________________________________________________________________________
_____________________________________________________________________________
г. Выборг
2013 год.
Оглавление
Введение 3
4
Основная часть.Современные системы распознавания речи 4
Программные ядра для аппаратных реализаций 4
Наборы библиотек для разработки приложений 5
Независимые пользовательские приложения 6
Специализированные приложения 7
Устройства, выполняющие распознавание на аппаратном уровне 7
Теоретические исследования и разработки 8
Перспективы разработки систем распознавания речи 9
Список использованных источников 11
Введение
С момента появления первых ЭВМ одним из наиболее важных вопросов развития компьютерной техники был процесс взаимодействия человека с машиной. Долгое время это было доступно только узким специалистам – технологи «общались» с машиной через посредника-программиста. Такая ситуация просуществовала вплоть до появления диалогового интерфейса, когда пользователь смог лично вводить с клавиатуры адресованную машине команду и получить осмысленный ответ. Дальнейшее появление графического интерфейса, в котором отпала необходимость в знании человеком каких-либо команд, привела к повсеместному распространению персональных компьютеров.
Однако человек всегда стремился к более универсальному и естественному способу взаимодействия с ЭВМ. Еще в эпоху перфокарт в научно-фантастических романах человек с компьютером разговаривал, как с равным себе. Тогда же были предприняты первые шаги по реализации речевого интерфейса. В 1971 г. была начата разработка самого крупного проекта, когда-либо предпринимавшегося на то время в области распознавания речи, после того, как Advanced Research Project Agency (ARPA) министерства обороны США приняло 5-летний проект по созданию машин, которые позволяют «понимать» произносимые слитно предложения и объем словаря которых составлял 1000 слов. В конце 1976 г. было представлено несколько систем, одной из которых была HARPY. Эта система правильно понимала 95% произносимых пятью операторами предложений, используя словарь объемом 1011 слов и строго ограниченную грамматику предложений.
Задача распознавания речи состоит в восстановлении по звуковому сигналу слова естественного языка (из ограниченного словаря), произнесением которого является этот звуковой сигнал. Она обычно решается путем задания эталонов слов словаря и последующего сравнения звуковых сигналов с этими эталонами. Звуковой сигнал представляет из себя целочисленный вектор значений звукового давления, измеренного в равноотстоящие друг от друга моменты времени. Мощность пространства звуковых сигналов огромна (типичное значение мощности множества сигналов длительностью в 1 сек., используемых в компьютерных системах. равно 25611025 .
Для решения задачи распознавания обычно сначала равномерно разбивают сигнал на окна одинаковой длины. Окна преобразуют из временной области в частотную (например, с помощью преобразования Фурье), чтобы близость окон относительно простых метрик (типа Евклидовой) соответствовала близости участков сигнала "на слух”. Затем решается задача нахождения соответствия между окнами звукового сигнала и окнами эталонов слов словаря. Сложность последней задачи заключается в том, что различные участки звукового сигнала в различных произнесениях одного и того же слова отличаются разной степенью сжатия или растяжения (вовсе не пропорционального). Для решения задачи нахождения соответствия между окнами сигналов традиционно используются методы динамического программирования.Создание компьютерных систем распознавания речи связано со множеством объективных трудностей, накладывающих на подобные системы искусственного интеллекта ряд ограничений.
Классификация систем распознавания речи