3.3.5 Избыточность, связанная с неактивностью речи

Анализ телефонных переговоров показал, что активная часть разговора в типовом случае состаляет около 40% его длительности. Большая часть неактивных участков является результатом того, что один человек слушает, когда другой говорит. В результате этого обычное дуплексное соединение (при коммутации каналов) существенно недоиспользуется. Метод TASI(TimeAssignmentSpeechInterpolation) реализует улучшение использования каналов дорогих аналоговых линий. Термин "цифровое статистическое уплотнение речевого сигнала" представляет собой термин, применяемый, когда речь идет об аналоге методаTASIдля цифровых каналов. По сути, цифровое статистическое уплотнение речевого сигнала включает в себя: определение речевой активности, занятие канала, кодирование и передачу отрезков речи и освобождение канала по завершению каждого отрезка.

Очевидно, что цифровое статистическое уплотнение речевого сигнала можно применить к цифровым системам запоминания речи, где длину паузы можно закодировать и передать более эффективно, чем саму паузу. Однако в записанных сообщениях длительности пауз, как правило, невелики, так как здесь нет "полудуплексного" разговора. Цифровое статистическое уплотнение речевого сигнала было предложено для многочисленных систем передачи, описанных в гл. 8.

3.3.6 Неравномерный усредненный спектр

Виды избыточности во временной области, описанные в предыдущих разделах, указывают на такие характеристики в частотной области, которые можно в определенной мере использовать для уменьшения скорости передачи кодированного сигнала. Избыточность в частотной области не является независимой от избыточности во временной области. Способы, основанные на обработке в частотной области, просто являются другим подходом к анализу и обработке избыточности.

Полностью независимый или непредсказуемый сигнал во временной области создает плоский частотный спектр во всей полосе, представляющей интерес. Таким образом, для сигнала, в котором дискреты не коррелированы во временной области, полоса используется в максимальной степени. С другой стороны, неравномерный спектр сигнала соответствует неэффективному использованию полосы и указывает на избыточность в сигнале во временной области. На рис. 3.24 представлен спектр речевого сигнала, усредненный для мужчин и женщин [17]. Отметим, что уровни мощности на верхних частотах полосы шириной 3 кГц, предоставляемой телефонной сетью, значительно уменьшаются. Пониженные уровни мощности на верхних частотах являются прямым следствием рассмотренной выше корреляции между дискретами во временной области. Сигналы с большими амплитудами не могут быстро изменяться, поскольку в среднем в них преобладают низкочастотные составляющие.

Подход, обеспечивающий более эффективное кодирование в частотной области, включает в себя уплощение спектра перед кодированием сигнала. Уплощение может быть получено в результате прохождения сигнала через цепь, осуществляющую подъем верхних частот. Исходный сигнал восстанавливается при передаче декодированного сигнала через цепь, имеющую дополняющую характеристику с подъемом низких частот. Важным аспектом этого процесса является то, что цепь с подъемом верхних частот имеет во временной области такие же характеристики, как и дифференцирующая цепь, а цепь с подъемом низких частот во временной области имеет характеристики, аналогичные характеристикам интегратора. Таким образом, процесс уплощения спектра, по существу, означает, что на передающей стороне кодируются крутизна сигнала, а на приемной сигнал восстанавливается путем интегрирования – это та же процедура, которая была описана ранее для устранения корреляции между дискретами во временной области.

При изучении рис. 3.24 обычно считают, что существенное снижение уровня энергии сигнала на высоких частотах (от 2 до 3,4 кГц) означает, что для передачи речевого сигнала предоставляется полоса, большая, чем необходимо в действительности. Ошибочность такого вывода заключается в том, что существует разница между содержанием энергии и информации в спектре речевого сигнала. Как вскоре узнает любой начинающий программист, содержание переменных в программе может быть сохранено, даже если их обозначения сокращаются за счет удаления всех гласных. В речи гласные требуют большей части энергии и занимают в основном нижнюю часть полосы частот. Согласные, с другой стороны, содержат большую часть информации, но имеют намного меньшую энергию и в общем случае более высокие частоты. Следовательно, простого воспроизведения большей части исходной энергии речевого сигнала недостаточно для цифровых систем передачи и запоминания речи.

<<< < Предыдущая 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 5556 / 6356 57 58 59 60 61 62 63 > Следующая >>>

Соседние файлы в папке METOD

#
07.02.2016518.14 Кб17lab4.doc
#
07.02.2016204.8 Кб16lab5.doc
#
07.02.2016147.46 Кб16lab6.doc
#
07.02.20161.81 Mб54zstm-rus.doc
#
07.02.20162.26 Mб18zstm-ukr-met.doc
#
07.02.20162.18 Mб231Сведения--zстm.doc