- •1.1. Распознавание речевых сообщений.
- •1.2. Синтез речевых сообщений.
- •1.3. Документирование речевых сообщений с использованием эффективных систем сжатия информации.
- •1.4. Передача речевых сообщений в компьютерных сетях .
- •2. Общие понятия о системах распознавания речи и обзор современных систем распознавания речи.
- •2. 1. Классификация систем распознавания речи.
- •2.2. Обзор современных систем распознавания речевой информации.
- •2.2.1. Русско-язычные системы распознавания речи.
- •1. Система распознавания речевых команд "Труфалдино",
- •3. Система диктовки русской речи "Горыныч".
- •2.2.2. Англоязычные системы распознавания речи
- •1. Dragon NaturallySpeaking
- •2. DragonDictate for Windows.
- •3. Ibm VoiceType Dictation
- •4. Ibm ViaVoice 98 Executive Edition
- •5. Kurzweil Voice for Windows
- •7. Microsoft Dictation Research Demonstration
- •8. Microsoft Command and Control Engine
- •3. Речевой сигнал и его структура
- •3.1 Фонетическая модель речевого сигнала
- •3.2 . Фонетическая структура речи.
- •3.3. Линейная математическая модель речеобразования.
- •3.4. Математическая модель речеобразования в терминах z-преобразования.
Введение в распознавание речевых сигналов.
В настоящее время в практике разработки информационных систем находят широкое применение технологии, основанные на обработке аудио информации.
Область применения этих технологии чрезвычайно велика. Наибольший интерес и внимание разработчиков направлены на создание технологий обработки речевой информации (речевые технологии).
Речевые технологии включают в себя следующие основные направления:
распознавание речевых сообщений,
синтез речевых сообщений,
документирование речевых сообщений с использованием эффективных систем сжатия информации.
передача речевых сообщений в компьютерных сетях , в том числе компьютерная телефония.
Рассмотрим основные направления и преимущества использования речевых технологии в современных информационных системах.
1.1. Распознавание речевых сообщений.
Применение систем распознавания речевых сообщений позволяет осуществлять взаимодействие с компьютером на естественном языке . При этом возможно решение следующих задач:
речевое управление вычислительным процессом ( например речевой ввод команд WINDOWS
речевое управление различными техническими системами
- автоматический ввод текстовой информации в ПЭВМ для заполнения различных документов, создания баз данных,
Применение распознавания речи обеспечивает :
- повышение оперативности управления за счет использования речевого канала взаимодействия (средний специалист по вычислительным системам с клавиатуры может вводить лишь 10-20 слов/мин, а голосом можно передать 100-200 слов/мин);
не требует сложных средств отображения, в качестве терминала ЭВМ может быть использован обычный телефон;
1.2. Синтез речевых сообщений.
Синтез речевых сообщений является эффективным способом отображения информации в виде речевого сообщения .
Основные направления использования речевого синтеза в состоят в следующем:
создание системы поддержки внимания оператора к главным событиям и чрезвычайным ситуациям. При этом учитывается, что речевое сообщение является более эффективным для оператора, работающего с экранными пультами многоцелевого отображения, чем видео сообщения с точки зрения скорости реакции;
организации системы информационной поддержки оператора. Такая системы может рассматриваться как база данных текстовых документов с возможностью речевого озвучивания. Эффективной структурой такой системы может быть гипертекстовая организация, позволяющая создать эффективную справочную систему.
1.3. Документирование речевых сообщений с использованием эффективных систем сжатия информации.
Система цифровой регистрации речевых сообщений, обеспечивает решение задач документирования работы операторов и руководителей информационных комплексов путем фиксации речевой обстановки .с использованием цифровой записи речевого сигнала . Использование цифровых регистраторов имеет существенное преимущество по сравнению с аналоговыми, состоящее в том, что цифровая регистрация позволяет обеспечить эффективный доступ к речевым файлам с привязкой по времени и по дополнительным признакам, обеспечивает возможность совмещение документирования речевых сообщений путем подключения к ним текстовых ,графических и видео файлов. Также обеспечивается возможность включения звуковых файлов в соответствующие документальные файлы, хранящиеся в базах данных. Основной проблемой при создании системы цифрового документирования является необходимость обеспечения эффективного сжатия речевых файлов .
1.4. Передача речевых сообщений в компьютерных сетях .
Организация передачи речевых сообщений в компьютерной сети обеспечивает взаимодействие между пультами операторов путем использования стандартных компютерных аудио-карт. . Это позволяет исключить дополнительные телефонные каналы взаимодействия между операторами .
Настоящая работа посвящена проблемам взаимодействия с компьютером на основе распознавания речевых сигналов. Указанное направление применения речевых технологий является в настоящее время наиболее быстро развивающимся и находит широкое профессиональное и бытовое применение.
В работе рассмотрены общие проблемы построения систем распознавания речи, вопросы построения моделей речевого сигнала, методы предварительной обработки и и непосредственно распознавания речевых команд. Реализована программная система предаварительной обработки речевых сигналов, а также демонстрационный программный макет системы распознавания .