Скачиваний:
129
Добавлен:
01.05.2014
Размер:
434.69 Кб
Скачать

Методы распознавание речи

1.3.1. Классификация систем распознавания речи

По характеру распознавания и потребности употребления, СРР могут быть подразделены следующим образом:

1) относительно дикторовна зависимые и независимые, т. е. с подстройкой и без подстройки к диктору;

2) относительно потока информациипри распознавании. Признаками являются фонемы, слова как единицы распознавания, параметры слова на основе признаков фонем, параметры фраз из многих слов, параметры фраз совместно с данными синтаксиса и лексики;

3) относительно использования ЭВМ:

а) использование аналоговой ЭВМ как для выделения параметров представления эталонов, так и для сравнения входного сигнала с эталонами и представления результатов сравнения;

б) применение аналоговой ЭВМ только для выделения параметров, а составление эталонов, сравнение с эталонами и распознавание при помощи цифровой ЭВМ;

в) использование цифровой ЭВМ на всех этапах распознавания;

4) относительно рода обратной связи:

а) без обратной связи, то есть устройство распознавания действует на управляемый объект и может только видеть или чувствовать результаты распознавания;

б) визуальная обратная связь (экран, таблица);

в) акустическая обратная связь либо при помощи акустического сигнала, либо при помощи синтезатора речи;

5) относительно характера управляемого объекта. Происходит управление механизмом выдачи справок или архивных данных, слежение за текущими параметрами процесса и их изменением, ввод массовой информации;

6) относительно важности управления:

а) управление ведется только по устным командам (фонетическая пишущая машинка);

б) лишь часть операций производится по устным командам (управление производственными процессами, управление самолетом).

Существуют различные методы распознавания речи, однако, в последнее время основным стал метод сопоставления с эталоном. Это связано главным образом с прогрессом в области электронных компонентов, в частности, с увеличением вычислительной мощности процессоров и объемов памяти. При сопоставлении с эталоном, описания речевых сигналов сравниваются с заранее запасенными эталонными описаниями, и вычисляется степень их подобия. Результатом распознавания является наиболее похожий эталонный образ.

При распознавании речи путем сопоставления возникает несколько проблем, среди которых наиболее типичными являются следующие:

  • временные изменения характерных речевых сигналов. Причиной изменений является различная скорость произнесения одних и тех же звуков, то есть непостоянство длительности. Даже одни и те же слова, произносимые одним и тем же человеком, каждый раз меняются по длительности.

  • влияние размеров органов речи. Размеры органов речи у людей различны. Поэтому, даже если слова произносятся органами одинаковой формы, их резонансные частоты могут различаться.

Первая проблема связана с необходимостью подстраивать временные интервалы при сопоставлении (временная нормализация). Известно много способов согласования длительностей, которые сильно различаются по эффективности и объему вычислений. В некоторых допускаются пропуски некоторых элементов эталона, в некоторых разрешены пропуски элементов реализации, иногда накладывается ограничение на множество вариантов растяжения реализации и эталона, позволяющие учесть ограничения на вариации темпа произнесения слова [19].

Проблема изменений, связанных с говорящим, чрезвычайно сложна. В настоящее время наметился ряд путей ее частичного решения. Некоторые из них будут рассмотрены ниже.

Соседние файлы в папке Lecture16