- •Министерство образования и науки Российской Федерации
- •Содержание
- •1. Методы сокращения информационной избыточности цифровых изображений
- •1.1. Представление цифровых изображений
- •1.2. Классификация методов сжатия. Основные характеристики
- •3. Время преобразования
- •1.3. Алгоритмы сжатия изображений без потерь
- •1.3.1. Сжатие способом кодирования серий (rle)
- •1.3.2. Сжатие по методу Хаффмана
- •1.3.3. Алгоритм Лемпеля-Зива (lz-compression)
- •1.3.4. Алгоритм Лемпеля-Зива-Велча (Lempel-Ziv-Welch -lzw)
- •1.3.5. Алгоритм jbig
- •1.3.6. Алгоритм Lossless jpeg
- •1.4. Алгоритмы сжатия с потерями
- •1.4.1. Метод усеченного блочного кодирования (убк)
- •1.4.2. Сжатие по стандарту jpeg
- •1.4.3. Сжатие по методу wic (Wavelet Image Compression)
- •1.4.4. Фрактальное сжатие изображений
- •2. Алгоритмы сжатия аудиосигналов
- •2.1. Параметры звукового сигнала
- •2.1.1. Критические полосы слуха
- •2.1.2. Пороги слышимости при маскировке
- •2.1.3. Цифровой звук
- •2.2. Основные виды алгоритмов сжатия аудиосигналов
- •2.3. Степень ухудшения качества сигнала при квантовании
- •2.4. Алгоритмы сжатия аудиосигналов
- •2.4.1. Дифференциальная импульсно-кодовая модуляция
- •2.4.2. Кодирование в частотных поддиапазонах
- •2.4.3. Аудио mpeg-1
- •2.5. Общая схема аудиокодера и аудиодекодера мреg
- •2.6. Анализ возможностей алгоритмов сжатия аудиосигналов
- •3. Стандарты сжатия видеоданных
- •3.1. Особенности сжатия видеоданных
- •3.2. Основные процедуры сжатия видеоданных
- •3.2.1. Цветовые пространства и их преобразование
- •3.2.2. Форматы семплирования
- •3.2.3. Устранение пространственной статистической избыточности
- •3.3. Модель dpcm/dct видеокодека
- •3.4. Анализ возможностей современных методов сжатия видеоданных
- •Последовательность №1. Flight
- •Последовательность №2. Monkeys
- •Последовательность №3. Discussion
- •Последовательность №4. Space ship
- •Литература
- •Кафедра вычислительной техники
2.3. Степень ухудшения качества сигнала при квантовании
Один QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры PCM. Согласно рекомендациям ITU-T, для международных вызовов величина QDU не должна превышать 14. Следует отметить, что передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU. При передаче разговора по национальным сетям должно теряться не более 5 QDU. Значения QDU для некоторых алгоритмов: ADPCM (32кбит/с), LD-CELP (16кбит/с) и CS‑ACELP (8кбит/с) – 3.5, ADPCM (24кбит/с) – 7. Следовательно, для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов, предъявляемым к сетям, подключенным к ТфОП.
В результате обзора услуг провайдеров IP-телефонии можно сделать вывод, что в настоящее время наибольшую популярность приобрели алгоритмы MP-MLQ и CS-ACELP, выполненные по стандартам ITU-T G.723.1 и G.729 Annex A, соответственно.
Анализ последних разработок показал, что в первую очередь учитываются скорость алгоритма и оценка качества речи, причем именно в указанной последовательности.
Минимизация скорости привела к появлению методов, основанных на интерполяции спектрально-временных алгоритмов параметрического компандирования [5,7].
Но большинство разработок ведется в области гибридных методов. В последних разработках кодеров применяются:
алгоритмы долговременного и кратковременного предсказания;
кодовые книги, хранящие различные виды сигналов возбуждения;
подавление пауз, которые обычно занимают до 60% длительности разговора;
переменная скорость кодирования, учитывающая:
разделение сегментов речевого сигнала на основе фонетической или энергетической классификации;
возможность применения различных систем кодирования на разных сегментах;
настройка на говорящего абонента.
В составе кодеров можно выделить по крайней мере двух общих для большинства алгоритмов функциональных блоков:
блок предсказания;
блок спектрально-временного преобразования.
Последний блок представляет наибольший интерес, поскольку используется для решения различных задач. Спектральное представление сигнала позволяет:
уменьшить объем передаваемых данных;
осуществить частотную фильтрацию – селекцию желаемой полосы частот в обрабатываемом сигнале:
подавлять шумы обнулением компонент на нежелательных частотах;
выделить достаточную полосу частот для воспроизведения разборчивой речи и особенностей (тембра) говорящего, т.е. содержащую три первых формантных частоты (как правило, используется полоса частот от 300 до 3400Гц) [5];
выделять один период спектра для восстановления непрерывного сигнала;
выполнить классификацию сегмента сигнала (вокализованный, невокализованный глухой, невокализованный фрикативный звук, шум) [5] и др.
Следует отметить, что в некоторых случаях операцию фильтрации целесообразнее выполнять путем свертки исходных данных с фильтрующей последовательностью, т.е. без проведения анализа в частотной области.