2.3. Степень ухудшения качества сигнала при квантовании

Один QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры PCM. Согласно рекомендациям ITU-T, для международных вызовов величина QDU не должна превышать 14. Следует отметить, что передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU. При передаче разговора по национальным сетям должно теряться не более 5 QDU. Значения QDU для некоторых алгоритмов: ADPCM (32кбит/с), LD-CELP (16кбит/с) и CS‑ACELP (8кбит/с) – 3.5, ADPCM (24кбит/с) – 7. Следовательно, для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов, предъявляемым к сетям, подключенным к ТфОП.

В результате обзора услуг провайдеров IP-телефонии можно сделать вывод, что в настоящее время наибольшую популярность приобрели алгоритмы MP-MLQ и CS-ACELP, выполненные по стандартам ITU-T G.723.1 и G.729 Annex A, соответственно.

Анализ последних разработок показал, что в первую очередь учитываются скорость алгоритма и оценка качества речи, причем именно в указанной последовательности.

Минимизация скорости привела к появлению методов, основанных на интерполяции спектрально-временных алгоритмов параметрического компандирования [5,7].

Но большинство разработок ведется в области гибридных методов. В последних разработках кодеров применяются:

алгоритмы долговременного и кратковременного предсказания;
кодовые книги, хранящие различные виды сигналов возбуждения;
подавление пауз, которые обычно занимают до 60% длительности разговора;
переменная скорость кодирования, учитывающая:

разделение сегментов речевого сигнала на основе фонетической или энергетической классификации;
возможность применения различных систем кодирования на разных сегментах;

настройка на говорящего абонента.

В составе кодеров можно выделить по крайней мере двух общих для большинства алгоритмов функциональных блоков:

блок предсказания;
блок спектрально-временного преобразования.

Последний блок представляет наибольший интерес, поскольку используется для решения различных задач. Спектральное представление сигнала позволяет:

уменьшить объем передаваемых данных;
осуществить частотную фильтрацию – селекцию желаемой полосы частот в обрабатываемом сигнале:

подавлять шумы обнулением компонент на нежелательных частотах;
выделить достаточную полосу частот для воспроизведения разборчивой речи и особенностей (тембра) говорящего, т.е. содержащую три первых формантных частоты (как правило, используется полоса частот от 300 до 3400Гц) [5];
выделять один период спектра для восстановления непрерывного сигнала;

выполнить классификацию сегмента сигнала (вокализованный, невокализованный глухой, невокализованный фрикативный звук, шум) [5] и др.

Следует отметить, что в некоторых случаях операцию фильтрации целесообразнее выполнять путем свертки исходных данных с фильтрующей последовательностью, т.е. без проведения анализа в частотной области.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 2512 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>