3.8. Методика разделения речевого сигнала на участки шума, пауз и речи.

На основе вычисления кратковременной энергии и числа пересечений нуля каждое временное окно можно отнести к типам: 1)Пауза; 2)Вокализованная речь; 3)Невокализованная речь.

Энергия речи в окне t из N отсчётов:

Число пересечений нуля:

Простейший алгоритм определения типа окна содержит этапы:

1)Разделение потоков отсчётов на интервалы – фреймы

2)Вычисление и

3)Установка текущих пороговых значений и

4)Сравнение значений кратковременной энергии и числа пересечений нуля с пороговыми значениями по схеме:

– пауза

Следует отметить что при попадании в сегмент как вокализованного, так и невокализованного участка достоверность оценки уменьшается. Для уменьшения вероятности ошибки уменьшают размер сегмента и анализируют поведение сигнала не только в текущем, но и в нескольких предыдущих сегментах.

Определение состояния канала речь\шум может производиться не только в целях качественного определения параметров, но и с целью экономии энергетических ресурсов и ресурсов канала связи.

Статистические измерения показывают, что в процессе диалога речевая активность абоненте не превышает 40% времени длительности обмена. Это позволяет в 2 раза снизить речевую нагрузку, вводимую в сеть за счёт формирования и передачи речевых пакетов, т.е. используя прерывистую передачу (система DTX).

DTX – эффективный способ увеличения спектральной эффективности в подвижных системах передачи речи. Основной принцип DTX – включение передатчика только на те периоды когда есть речь для передачи.

Недостатком DTX является потенциальное снижение качества речи: идентификация речи как шума, следовательно потеря информации; идентификация шума как речи, следовательно уменьшение эффективности самой DTX.

Даже точная идентификация ведёт к ухудшению качества, т.к. приводит к резким изменениям уровня фонового шума. Способом устранения этого является генерация комфортного шума.

Основным элементом DTX является детектор активности речи VAD. Реализация алгоритмов VAD базируется на положениях:

1)Речь – нестационарный сигнал. Форма её спектра обычно меняется через 20-30мс.

2)Фоновый шум обычно стационарен на более длинном отрезке времени, немного изменяясь.

3)Уровень речевого сигнала обычно выше уровня фонового шума. В противном случае речь неразборчива.

Основной принцип VAD – сравнение с порогом, т.к. шумовая обстановка меняется, то порог должен быть адаптивным. Существуют приложения в которых уровень шума м.б. высок и быстро изменяться во времени, что делает неэффективным применение простого энергетического порога. В любом случае порог должен вычисляться исходя из анализа сегмента сигнала, на котором присутствует только шум. Для этого проверяются спектральные характеристики сигнала.

Структурная схема VAD с обработкой в частотной области, применяемая в GSM имеет вид:

Работа схемы основана на различии спектральных характеристик сигнала и шума. VAD определяет спектр отклонения входного воздействия от спектра фонового шума. Это осуществляется инверсным фильтром, коэффициенты которого устанавливаются применительно к воздействию на входе только фонового шума.

При наличии (речь+шум) инверсный фильтр осуществляет подавление компонент шума и снижает его мощность. Далее сигнал подвергается пороговой обработке. Превышение порога сигнализирует о наличии речевой активности

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 2817 18 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.11.201896.26 Кб0Царствование Павла.doc
#
27.11.2019338.43 Кб20Цепи Маркова.doc
#
01.07.2025988.38 Кб0ци.docx
#
17.09.2019553.98 Кб17цифра моя.doc
#
01.03.20252.2 Mб4ЦОС(готовый).doc
#
01.04.20256.03 Mб3ЦОС, УПОиС (Витязев В.В.).doc
#
11.09.2019647.17 Кб33ЦУ курсовая АЦП ЦАП.doc
#
06.05.20194.34 Mб150части - Цифровые радиопередающие устройства.doc
#
01.07.20251.53 Mб0часть 1.doc
#
01.07.2025367.1 Кб0часть 2.doc
#
15.04.201538.91 Кб14часть ЛК2.doc