Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
METOD_2 / metod_2.doc
Скачиваний:
135
Добавлен:
21.03.2016
Размер:
2.12 Mб
Скачать

2.3. Степень ухудшения качества сигнала при квантовании

Один QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры PCM. Согласно рекомендациям ITU-T, для международных вызовов величина QDU не должна превышать 14. Следует отметить, что передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU. При передаче разговора по национальным сетям должно теряться не более 5 QDU. Значения QDU для некоторых алгоритмов: ADPCM (32кбит/с), LD-CELP (16кбит/с) и CS‑ACELP (8кбит/с) – 3.5, ADPCM (24кбит/с) – 7. Следовательно, для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов, предъявляемым к сетям, подключенным к ТфОП.

В результате обзора услуг провайдеров IP-телефонии можно сделать вывод, что в настоящее время наибольшую популярность приобрели алгоритмы MP-MLQ и CS-ACELP, выполненные по стандартам ITU-T G.723.1 и G.729 Annex A, соответственно.

Анализ последних разработок показал, что в первую очередь учитываются скорость алгоритма и оценка качества речи, причем именно в указанной последовательности.

Минимизация скорости привела к появлению методов, основанных на интерполяции спектрально-временных алгоритмов параметрического компандирования [5,7].

Но большинство разработок ведется в области гибридных методов. В последних разработках кодеров применяются:

  • алгоритмы долговременного и кратковременного предсказания;

  • кодовые книги, хранящие различные виды сигналов возбуждения;

  • подавление пауз, которые обычно занимают до 60% длительности разговора;

  • переменная скорость кодирования, учитывающая:

    • разделение сегментов речевого сигнала на основе фонетической или энергетической классификации;

    • возможность применения различных систем кодирования на разных сегментах;

  • настройка на говорящего абонента.

В составе кодеров можно выделить по крайней мере двух общих для большинства алгоритмов функциональных блоков:

  • блок предсказания;

  • блок спектрально-временного преобразования.

Последний блок представляет наибольший интерес, поскольку используется для решения различных задач. Спектральное представление сигнала позволяет:

  • уменьшить объем передаваемых данных;

  • осуществить частотную фильтрацию – селекцию желаемой полосы частот в обрабатываемом сигнале:

    • подавлять шумы обнулением компонент на нежелательных частотах;

    • выделить достаточную полосу частот для воспроизведения разборчивой речи и особенностей (тембра) говорящего, т.е. содержащую три первых формантных частоты (как правило, используется полоса частот от 300 до 3400Гц) [5];

    • выделять один период спектра для восстановления непрерывного сигнала;

  • выполнить классификацию сегмента сигнала (вокализованный, невокализованный глухой, невокализованный фрикативный звук, шум) [5] и др.

Следует отметить, что в некоторых случаях операцию фильтрации целесообразнее выполнять путем свертки исходных данных с фильтрующей последовательностью, т.е. без проведения анализа в частотной области.