Скачиваний:
104
Добавлен:
01.05.2014
Размер:
282.62 Кб
Скачать

Введение в распознавание речевых сигналов.

В настоящее время в практике разработки информационных систем находят широкое применение технологии, основанные на обработке аудио информации.

Область применения этих технологии чрезвычайно велика. Наибольший интерес и внимание разработчиков направлены на создание технологий обработки речевой информации (речевые технологии).

Речевые технологии включают в себя следующие основные направления:

  • распознавание речевых сообщений,

  • синтез речевых сообщений,

  • документирование речевых сообщений с использованием эффективных систем сжатия информации.

  • передача речевых сообщений в компьютерных сетях , в том числе компьютерная телефония.

Рассмотрим основные направления и преимущества использования речевых технологии в современных информационных системах.

1.1. Распознавание речевых сообщений.

Применение систем распознавания речевых сообщений позволяет осуществлять взаимодействие с компьютером на естественном языке . При этом возможно решение следующих задач:

  • речевое управление вычислительным процессом ( например речевой ввод команд WINDOWS

  • речевое управление различными техническими системами

- автоматический ввод текстовой информации в ПЭВМ для заполнения различных документов, создания баз данных,

Применение распознавания речи обеспечивает :

- повышение оперативности управления за счет использования речевого канала взаимодействия (средний специалист по вычислительным системам с клавиатуры может вводить лишь 10-20 слов/мин, а голосом можно передать 100-200 слов/мин);

  • не требует сложных средств отображения, в качестве терминала ЭВМ может быть использован обычный телефон;

1.2. Синтез речевых сообщений.

Синтез речевых сообщений является эффективным способом отображения информации в виде речевого сообщения .

Основные направления использования речевого синтеза в состоят в следующем:

  • создание системы поддержки внимания оператора к главным событиям и чрезвычайным ситуациям. При этом учитывается, что речевое сообщение является более эффективным для оператора, работающего с экранными пультами многоцелевого отображения, чем видео сообщения с точки зрения скорости реакции;

  • организации системы информационной поддержки оператора. Такая системы может рассматриваться как база данных текстовых документов с возможностью речевого озвучивания. Эффективной структурой такой системы может быть гипертекстовая организация, позволяющая создать эффективную справочную систему.

1.3. Документирование речевых сообщений с использованием эффективных систем сжатия информации.

Система цифровой регистрации речевых сообщений, обеспечивает решение задач документирования работы операторов и руководителей информационных комплексов путем фиксации речевой обстановки .с использованием цифровой записи речевого сигнала . Использование цифровых регистраторов имеет существенное преимущество по сравнению с аналоговыми, состоящее в том, что цифровая регистрация позволяет обеспечить эффективный доступ к речевым файлам с привязкой по времени и по дополнительным признакам, обеспечивает возможность совмещение документирования речевых сообщений путем подключения к ним текстовых ,графических и видео файлов. Также обеспечивается возможность включения звуковых файлов в соответствующие документальные файлы, хранящиеся в базах данных. Основной проблемой при создании системы цифрового документирования является необходимость обеспечения эффективного сжатия речевых файлов .

1.4. Передача речевых сообщений в компьютерных сетях .

Организация передачи речевых сообщений в компьютерной сети обеспечивает взаимодействие между пультами операторов путем использования стандартных компютерных аудио-карт. . Это позволяет исключить дополнительные телефонные каналы взаимодействия между операторами .

Настоящая работа посвящена проблемам взаимодействия с компьютером на основе распознавания речевых сигналов. Указанное направление применения речевых технологий является в настоящее время наиболее быстро развивающимся и находит широкое профессиональное и бытовое применение.

В работе рассмотрены общие проблемы построения систем распознавания речи, вопросы построения моделей речевого сигнала, методы предварительной обработки и и непосредственно распознавания речевых команд. Реализована программная система предаварительной обработки речевых сигналов, а также демонстрационный программный макет системы распознавания .

Соседние файлы в папке Lecture13