Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Аналитический обзор Швайченко Черняк.docx
Скачиваний:
1
Добавлен:
12.09.2019
Размер:
60.78 Кб
Скачать

Аналитический обзор

Речевой сигнал, как средство передачи информации, используется для создания естественных интерфейсов связи с машиной, что упрощает решение многочисленных задач в разнообразных приложениях. Основная задача систем обработки речевого сигнала заключается в распознавании произнесенной фразы и извлечении смысла принятого сообщения.

Первичной процедурой в задаче обработки речевого сигнала является акустическая обработка, которая заключается в сопоставлении каждому фрагменту сигнала некоторого набора признаков, в которых закодирована фонетическая информация, содержащаяся в данном фрагменте сигнала.

Большинство существующих систем обработки речевых данных построены по модульному принципу, поэтому получаемая с помощью процедуры акустического кодирования информация в том или ином виде используется всеми остальными процедурами, и ошибки, допущенные на начальном этапе обработки, приводят к снижению эффективности работы системы в целом. Результат работы методов акустического кодирования определяет качество работы всей системы, поэтому особое внимание уделяется разработке методов, чувствительных к изменениям фонетической структуры, и в то же время устойчивых к шумовым искажениям сигнала.

Устойчивость к шумовым искажениям означает, что изменение уровня помех не приводит к существенному изменению вычисляемых признаков. В случаях, когда в структуре помехи наблюдается некоторая закономерность, достаточно легко подобрать метод компенсации такой помехи в сигнале и отфильтровать ее на этапе предобработки сигнала. В случаях, когда данные о помехе отсутствуют, и компенсирующий алгоритм подобрать затруднительно, фильтрация сводится к отбрасыванию всех данных кроме тех, которые соответствуют полезному сигналу. Фильтрация помех также является задачей акустической обработки.

Известно, что необходимая фонетическая информация в речевом сигнале в значительной степени представлена его вокализованной частью. Таким образом, важной задачей алгоритмов акустической обработки является кодирование фонетической информации для вокализованных фрагментов. речевого сигнала, устойчивое к наличию в нем вариаций произношения, а также помех.

Современные методы обработки вокализованных сигналов подразумевают использование линейных параметрических моделей, позволяющих эффективно моделировать гармоническую структуру сигнала. В данном случае параметры модели рассматриваются как акустические признаки. С параметрическими моделями тесно связана задача определения порядка модели. Неверные значения порядка приводят к потере полезной либо к внесению паразитной информации в оценки параметров, что отрицательно сказывается как на оценках вычисленных признаков, так и на качестве работы использующих их методов в целом. Существующие в настоящее время методы определения порядка модели дают, как правило, заниженные значения и не обеспечивают требуемой точности решения, поэтому в большинстве существующих систем используются некоторые усредненные значения порядков, установленные экспериментально.

Таким образом, важной задачей акустической обработки сигнала является формирование устойчивых акустических признаков на основе линейной параметрической модели.