- •Методы обработки речевых сигналов в задаче распознавания
- •1. Основные этапы обработка звукового сигнала в системе распознавания речи.
- •2. Регистрация речевых сигналов с использованием звуковых карт.
- •Частота дискретизации
- •Разрядность представления звуковых данных
- •Монофонический и стереофонический звук
- •Формат wav-файла
- •2.2. Окно и шаг анализа
- •2.3. Некоторые основные методы анализа речевых сигналов
- •2.4. Влияние метода анализа на надежность распознавания
- •1.2.5. Недостатки существующих методов первичного описания
- •1.2.6. Обработка речевого сигнала в условиях шума
- •1.2.7. Выделение начала и конца слова
Методы обработки речевых сигналов в задаче распознавания
1. Основные этапы обработка звукового сигнала в системе распознавания речи.
Задачу обработки сигнала можно представить следующем образом:
источник
информации
преобразование
информации
представление
Распознавание
обработка
анализ
Вывод
|
|
Получение информации от источника ( человек).
Предполагает преобразование в электрический сигнал.(Микрофон).
Переход от аналогового сигнала к цифровой форме, пригодной для обработки на ЭВМ.(АЦП). Зависит от используемого типа АЦП. Обработка сигнала - преобразование сигнала к форме, пригодной для его анализа и распознавания. (Выделение информативной составляющей). Анализ - поиск возможных вариантов отнесения образа к тому или иному типу.Сушественно зависят от принятого алгоритма.
Определение конечного результата.
Представление результатов.
|
2. Регистрация речевых сигналов с использованием звуковых карт.
Компьютерная обработка звуковой информации представляет собой сравнительно новую дисциплину. Только несколько лет назад появилась относительно недорогая аппаратура, позволяющая обрабатывать звуковые сигналы с помощью компьютера на основе использования звуковых карт типа Sound Blaster.
В естественном мире звук образуется волнами. Характеристики волны определяют высоту и громкость звука. Например, звуковые волны, которые вибрируют быстро, создают более высокий звук. Слышимый нами звук является аналоговым. Это непрерывно изменяющийся звук, образованный в реальном мире. Однако компьютеры являются цифровыми и оперируют дискретными инструкциями. Звуковые платы осуществляют преобразования между аналоговыми и цифровыми звуками.
В мире компьютеров наиболее распространены два типа звуков, применяемых в плате SB и почти во всех других звуковых платах. Это WAV-файлы (сигнальные файлы) и MIDI-звуки.
MIDI-файлы содержат инструкции, указывающие звуковой плате, как синтезировать звучание конкретных музыкальных инструментов.
WAV-файлы представляют собой цифровые записи аналоговых звуков.
Достоинство сигнальных файлов состоит в том, что они, будучи реальными записями, звучат реалистически. Их легко редактировать для создания специальных эффектов, например эха, или смешивать несколько файлов для создания смешных или странных звуков.
Главный недостаток WAV-файлов состоит в том, что они требуют для хранения значительного дискового пространство, однако в последнее время созданы весьма эффективные методы сжатия речевых файлов .
Факторы, влияющие на качество звука
На качество звука влияют несколько значимых его элементов.