Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОТОВЫЕ ШПОРЫ_экз_2012.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
9.91 Mб
Скачать
  1. Оценивание начала и конца слова по кратковременным характеристикам Энергии, среднего значения и числа переходов через нуль.

Определение начала и конца слова является важным фактором в распознавании речи. При автоматизированной обработке это позволяет обрабатывать те участки, где есть слова. Это трудная задача. Отличить речь от шума сложно, если только речь не произносится в изолированной среде, где шума нет.

Пример:

Слово eight – имеет след график:

Слово six (вообще это 1 график, но нарисован на 4ех графиках):

По виду графика нельзя определить начало и конец слова. Исп-ют совместную кратковременную энергию и функцию перехода через 0. Первый алгоритм заключается в следующем:

Д иктор произносит слово в спец комнате, сигнал на всем интервале дискретизируется и заносится для последующей обработки. Цель: найти начало слова, чтобы исключить шумы из сегмента речи. В кач-ве параметров используются переходы через 0 в течение 10 мс. Первые 100мс не содержат речи. Поэтому часто определяют среднее значение, дисперсию шума. По этим данным высчитывают пороги для кода и энергии сигнала. Конец и начало слова лежат вне первого фрагмента.

Когда знач превышает верх предел, опр-ют первое знач-е. Момент N1 считается началом слова. Осн задача: нач и кон слова нах-ся вне интервала. После N1 и N2 смещаются влево и вправо соотв-но и сравнивают число переходов через 0 с порогами. Если есть превышения в 3 и более раз, то начало слова сдвигается вправо и влево. Достоинство: простота.

4 6. Оценка основного тона по медианному усреднению.

При сглаживании сигнала исп нелинейная фильтрация. Если сигн содержит ошибки, то линейная Ф эти ошибки не устранит, а учтет и это может привести к тому, что получим переход от вокализированного к невокализированному.

Лучше использовать нелинейную обработку, она позволит устранить ошибку. Идеального способа устарнить погрешность сигнала не существует.

Если комбинировать методы, то это значительно уменьшит влияние шумовых компонентов.

Нелинейное сглаживание разделяет сигналы на гладкие и шумоподобные, а линейное позволяет разделять их по частоте.

х(п)=S[ х(п)] + R[х (п)] - S-гладкая компонента, R-шумоподобная

Мi[х(п)] – медиана;

х(п)…Х(п-L+1)

Медиана обладает след св-ми:

1. Мi[a*x(n)] = a*Мi[х(п)] - линейность

2.Медиана не смазывает основные разрывы в сигнале

3. Медиана повторяет тренд низкого порядка

Мi[x1(n) + x2(n)] ≠ М[x1(n) + М[ x2(n)]

Схема нелинейного сглаживания:

Медианное сглаживание

Лин

сглаж

X (n) g(n) w(n)

Медианное сглаживание

Лин

сглаж

-

Z(n)

+ S(R(x(n)))

g(n)=S(x(n))

z(n)=x(n)-g(n)=R(x(n))

w(n)=S(x(n))+ S(R(x(n)))

Если z(n) точно представляет шум, то S(R(x(n)))=0

Надо учитывать, что медианное сглаживание дает задержку (L-1)/2 отсчетов, а линейная – в зав-ти от ее имп переходной функции.

Предполагается периодически повторять послед-ть сигналов.

Для сравнения перейдем к графику:

н улевая пер-я

линейное

медианное

Оценка периода основного тона

исходн сигнал

медианный сигнал