- •1. Краткая история развития теории и техники цос
- •3. Дискретизация речевого сигнала
- •4. Прореживание и интерполяция дискретизированного сигнала.
- •5. Скалярное квантование речевого сигнала.
- •6. Векторное квантование речевого сигнала.
- •7. Гомоморфная обработка речи.
- •8. Дискретное косинус-преобразование
- •9 Виды избыточности речевого сигнала.
- •10. Структура кодера для компрессии звуковых сигналов.
- •11. Психоакустическая модель слуховой системы в частотной области
- •1.Спектральный анализ и нормализация уровня звукового давления сигнала.
- •12. Искажения звука при сжатии аудиоданных
- •13. Методы повышения качества и разборчивости речи
- •14 Сжатие аудиосигнала на основе стандарта mp3
- •15. Субъективные методы
- •16. Психоакустические методы оценки качества
- •17. Объективные методы оценивания качества воспроизведения речи
- •18. Типы изображений
- •19. Избыточность изображений
- •Статистическая избыточность изображений
- •Визуальная избыточность изображений
- •20. Дискретизация непрерывных изображений
- •21. Квантование изображений
- •22. Препарирование изображений
- •23. Фильтрация изображений. Оптимальная линейная фильтрация
- •24. Масочная фильтрация изображений
- •25. Медианная фильтрация изображений
- •26. Применение фильтра Винера для некаузальной двумерной фильтрации
- •27. Сглаживание цветных изображений
- •28. Особенности зрительного анализатора. Свойства системы зрения человека
- •29. Порядок операций при компрессии изображений
- •30. Двумерное дискретно-косинусное преобразование изображений
- •31. Стандарт сжатия jpeg 2000 и система roi.
- •32. Алгоритм сжатия jpeg 2000 и его отличия от jpeg
- •33. Особенности сжатия видеоданных в формате mpeg
- •34. Структура потока данных mpeg
- •36. Методы и средства компьютерной обработки звуков и изображений
- •37. Интегральноевейвлет-преобразование речи и изображений
- •38. Дискретноевейвлет-преобразование речи и изображений
- •39. Критерии оценивания качества воспроизведения изображений. Мультиразмерная ошибка
- •40. Критерии оценивания качества воспроизведения изображений. Индекс качества изображения
- •41. Критерии оценивания качества воспроизведения изображений. Мера качества видео на основе дискретного косинусного преобразования.
- •42. Критерии качества восстановления изображений
29. Порядок операций при компрессии изображений
Шаг 1. Сдвиг по яркости (DC levelshift).
В JPEG-2000 предусмотрен сдвиг яркости (DC levelshift) кадой компоненты (RGB) изображения перед преобразованием в YUV. Это делается для выравнивания динамического диапазона (приближения к U гистограммы частот), что приводит к увеличению степени сжатия. Формулу преобразования можно записать как:
Шаг 2. Изменение цветового пространства (RGB – YUY).
Переводим изображение из цветового пространства RGB. с компонентами, отвечающими за красную (Red), зеленую (Green) и синюю (Blue) составляющие цвета точки, в цветовое пространство YUV. Этот шаг аналогичен JPEG, за тем исключением, что кроме преобразования с потерями, предусмотрено также и преобразование без потерь.
Шаг 3. Дискретное wavelet преобразование (DWT).
Дискретное вэйвлет(wavelet)-преобразование (DWT) может быть двух видов: для случая сжатия с потерями и для сжатия без потерь.
Шаг 4. Квантование.
Так же, как и в алгоритме JPEG, после DWT применяется квантование. Коэффициенты квадрантов делятся на заранее заданное число. При увеличении этого числа снижается динамический диапазон коэффициентов, они становятся ближе к U, и мы получаем большую степень сжатия. Варьируя эти числа для разных уровней преобразования, для разных цветовых компонент и для разных квадрантов, мы очень гибко управляем степенью потерь в изображении. Рассчитанные в компрессоре оптимальные коэффициенты квантования передаются в декомпрсссор для однозначной распаковки.
Шаг 5. Арифметическое сжатие.
Для сжатия получающихся массивов данных в JPEG 2000 используется вариант арифметического сжатия, называемый MQ-кодер, прообраз которого (QM-кодер) рассматривался еще в стандарте JPEG, но реально не использовался из-за патентных ограничений. Ввиду этого, используется не QM-кодер разработки IBM, а чуть худший, MQ-кодер, специально разработанный для JPEG2000. Кодирование ведется не всего изображения в целом и даже не отдельных субполос, а более мелких объектов - кодируемых блоков. Размер кодируемого блока может быть не более 4096 пикселов, высота не менее 4 пикселов. Такое разбиение хотя и снижает несколько коэффициент сжатия, но повышает устойчивость сжатого потока к ошибкам канала связи: ошибка испортит лишь небольшой блок. Кодирование блоков ведется в три этапа, битовыми плоскостями.
30. Двумерное дискретно-косинусное преобразование изображений
ДКП (DCT – discretecosinetransform) является унитарным преобразованием, так как масштабирующие множители являются одинаковыми для прямого и обратного преобразования.
Прямое и обратное дискретное косинусное преобразование последовательности отсчетов одномерного сигнала x(n) может быть представлено в виде
, (11.13)
, (11.14)
где
,
,
,
–
множество отсчетов одномерного сигнала
x(n),
–
множество ДКП-коэффициентов,
Вычислительная
сложность ДКП –
.
Одной из особенностей является то, что практически невозможно выполнить ДКП для всего изображения сразу. В качестве решения этой проблемы было предложено разбивать изображение на блоки размером 8x8 точек.
Увеличивая размеры блока дискретного косинусного преобразования, можно добиться некоторого увеличения результатов сжатия. Ограничения в коэффициенте сжатия объясняются малой вероятностью того, что удаленные на значительное расстояние точки изображения имеют одинаковые атрибуты.
Дискретное косинусное преобразование представляет собой преобразование информации без потерь и не осуществляет никакого сжатия. Напротив, дискретное косинусное преобразование подготавливает информацию для этапа сжатия с потерями или округления.
Прежде чем отбросить определенный объем информации, компрессор делит каждое выходное значение ДКП на "коэффициент квантования", округляя результат до целого. Чем больше коэффициент квантования, тем больше данных теряется, поскольку реальное ДКП -значение представляется все менее и менее точно. Каждая из 64 позиций выходного блока ДКП имеет собственный коэффициент квантования. Причем термы большего порядка квантуются с большим коэффициентом, чем термы меньшего порядка. Кроме того, для данных яркости и цветности применяются отдельные таблицы квантования, позволяющие квантовать данные цветности с большими коэффициентами, чем данные яркости.
Поскольку ДКП-коэффициенты не являются равнозначными, то и шаг квантования может быть выбран разным для разных коэффициентов.Он должен быть меньшим для низкочастотных составляющий пространственного спектра отсчетов и большим для высокочастотных.
