Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОТОВЫЕ ШПОРЫ_экз_2012.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
9.91 Mб
Скачать

44. Кратковременные функции энергии, среднего значения, числа переходов через нуль.

- кратковременная ф-ция энергии

М.б. представлена как:

X

квадратор

h(n) =w2(n) =

(n) Х2(n) Е(n)

По величине кратковременной энергии можно дать заключение о сигнале, но есть большая чувствительность к шуму

MN=сумма по m -∞+∞ (|x(n)|*w(n-m))

X

Модуль

h(n) =|w(n)| =

(n) |x(n)| MN

Основное значение энергии Е (n) состоит в том, что она может служить хорошей мерой отличия вокализи­рованных и невокализированных участков речи. Как можно видеть из рис, на невокализированных участках величина Е(n) намного меньше, чем для вокализированных. Кроме того, чем меньше N, тем мень­ше ошибка определения точного положения границ, где невокализированная речь переходит а вокализировапную и обратно. Более того, применительно к высококачественной речи энергию можно использо­вать для отделения невокализированных участков речи от паузы.

Поскольку полоса частот примерно совпадает с полосой пропускания фильтра, то нет необх-ти дискретизировать сигнал, используют исходный речевой сигнал. Для 20мс достаточно ок. 100Гц. Значит значитальная часть инф-ции о сигнале теряется. Динамический диапазон сохраняется.

E(n) и М(n) позволяют дать начальное представление о сигнале (вокализованный или нет). Реч сигнал обычно дискретизируется частотой 10кГц. За 10 мс получаем 100 отсчетов сигнала, каждый отсчет 6 бит, т.о. скорость 60000бит/с.

Еще один весьма простой способ анализа временных параметров сигнала основан на измерении числа пере­ходов через нуль.

График z(n) для вокализированных более узкий, чем для невокализированных.

Число переходов через ноль зависит от длительности шума, АЦП, интенсивности помех.

Применение оценки среднего пересечения нуля предполагает наличие окна. В лучшем случае оно оказывается окном ФНЧ. Если окно имеет свой част диапазон ,то возможно применение полосового фильтра.

Хорошо известно, что энергия вокализированной речи обычно концентрируется в диапазоне ниже 3 kHz, тогда как энергия фрикативных звуков в основном сосредоточена выше 3 kHz. На этом осно­вании результаты измерений числа переходов через нуль (наряду с информацией об энергии) часто исполь­зуются для принятия решения о том, вокализированный или невокалинзированный характер имеет данный участок речи. Если частота пересечений высока, то это свидетельствует о невокализироваином характере речи, если же она мала, то весьма вероятно, что анали­зируется вокализированный участок. В сочетании с детектором основного тона речи измерения числа пе­реходов через нуль оказываются весьма полезными при оценке параметров возбуждения. Они также успешно применяются для представления речевых сигналов при решении задачи по распознаванию речи.

При цифровой реализации измерений числа пере­ходов через нуль следует учитывать ряд важных об­стоятельств. Хотя в соответствии с основным алгорит­мом требуется произвести лишь сравнение знаков двух следующих друг за другом отсчетов, необходимо также весьма тщательно выполнять и саму процедуру дискретизации. Большие искажения в результаты измерений числа переходов через нуль вносят наличие шума, смещение уровня постоянного тока и напряже­ние фона с частотой питающей сети 60 Hz. Поэтому для ослабления мешающего влияния указанных фак­торов перед устройством дискретизации вместо фильтра нижних частот ставится полосовой фильтр. Кроме того, поскольку временное разрешение при измерении числа переходов через нуль определяется периодом дискретизации Т, его повышение сопря­жено с увеличением частоты дискретизации. Вместе с тем для неискаженной передачи информации о числе переходов через нуль можно применить чрезвы­чайно грубое двухуровневое квантование.