Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
METOD_2 / metod_2.doc
Скачиваний:
135
Добавлен:
21.03.2016
Размер:
2.12 Mб
Скачать

9

Министерство образования и науки Российской Федерации

Федеральное агентство по образованию

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ

А.Ю. Тропченко, А.А. Тропченко

МЕТОДЫ СЖАТИЯ ИЗОБРАЖЕНИЙ, АУДИОСИГНАЛОВ И ВИДЕО

Учебное пособие

по дисциплине «Теоретическая информатика»

Санкт-Петербург

2009

Тропченко А.Ю., Тропченко А.А. Методы сжатия изображений, аудиосигналов и видео: Учебное пособие – СПб: СПбГУ ИТМО, 2009. – 108 с.

Учебное пособие охватывает основные методы сжатия изображений, аудиосигналов и видео, которые составляют отдельную важную группу методов обработки данных. Материал пособия разбит на 4 раздела, включая введение. В каждом разделе, кроме введения, приведены теоретические сведения об используемых для решения соответствующих задач математических методах. Пособие может быть использовано при подготовке магистров по направлению 230100.68 «Информатика и вычислительная техника», а также инженеров по специальности 23.01.01.65.

Рекомендовано Советом факультета Компьютерных технологий и управления 10 ноября 2009 г., протокол №4

В 2007 году СПбГУ ИТМО стал победителем конкурса инновационных образовательных программ вузов России на 2007–2008 годы. Реализация инновационной образовательной программы «Инновационная система подготовки специалистов нового поколения в области информационных и оптических технологий» позволит выйти на качественно новый уровень подготовки выпускников и удовлетворить возрастающий спрос на специалистов в информационной, оптической и других высокотехнологичных отраслях экономики.

Санкт-Петербургский государственный университет информационных технологий, механики и оптики, 2009

 Тропченко А.Ю., Тропченко А.А., 2009

Содержание

стр.

Введение 4

1. МЕТОДЫ СОКРАЩЕНИЯ ИНФОРМАЦИОННОЙ

ИЗБЫТОЧНОСТИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ 5

1.1. Представление цифровых изображений 5

1.2. Классификация методов сжатия. Основные характеристики 8

1.3. Алгоритмы сжатия изображений без потерь 15

1.3.1. Сжатие способом кодирования серий (RLE) 15

1.3.2. Сжатие по методу Хаффмана 15

1.3.3. Алгоритм Лемпеля-Зива (LZ-compression) 16

1.3.4. Алгоритм Лемпеля-Зива-Велча (Lempel-Ziv-Welch -LZW) 17

1.3.5. Алгоритм JBIG 17

1.3.6. Алгоритм Lossless JPEG 18

1.4. Алгоритмы сжатия с потерями 18

1.4.1. Метод усеченного блочного кодирования (УБК) 18

1.4.2. Сжатие по стандарту JPEG 20

1.4.3. Сжатие по методу WIC(WaveletImageCompression) 26

1.4.4. Фрактальное сжатие изображений 31

2. АЛГОРИТМЫ СЖАТИЯ АУДИОСИГНАЛОВ 43

2.1. Параметры звукового сигнала 43

2.1.1. Критические полосы слуха 44

2.1.2. Пороги слышимости при маскировке 45

2.1.3. Цифровой звук 47

2.2. Основные виды алгоритмов сжатия аудиосигналов 48

2.3. Степень ухудшения качества сигнала при квантовании 54

2.4. Алгоритмы сжатия аудиосигналов 56

2.4.1. Нелинейная ИКМ 56

2.4.2. Кодирование в частотных поддиапазонах 61

2.4.3. Аудио MPEG-1 62

2.5. Общая схема аудиокодера и аудиодекодера МРЕG 63

2.6.Анализ возможностей алгоритмов сжатия аудиосигналов 69

3. СТАНДАРТЫ СЖАТИЯ ВИДЕОДАННЫХ 74

3.1. Особенности сжатия видеоданных 74

3.2. Основные процедуры сжатия видеоданных 77

3.2.1. Цветовые пространства и их преобразование 78

3.2.2. Форматы семплирования 81

3.2.3. Устранение пространственной статистической избыточности 85

3.3. Модель DPCM/DCTвидеокодека 86

3.4. Анализ возможностей современных стандартов

сжатия видеоданных 91

Литература 105

Введение

Бурное развитие средств вычислительной техники привело к появлению различных мультимедийных приложений и программ, в которых используются тексты, изображения, анимированные фрагменты и звук. Для хранения звука требуется места меньше, чем для видео, но больше, чем для текста и изображений.

В системах связи и радиовещания ограничены возможности выбора свободных частот диапазонов, поэтому остро стоит задача понижения скорости цифровых аудио и видео потоков без снижения субъективного качества воспроизведения.

В области цифровой звукозаписи для повышения качества воспроизведения звука требуется повышение частоты дискретизации и числа разрядов без увеличения размеров носителя и сокращения времени записи [4].

Эти и другие задачи привели к созданию алгоритмов сжатия аудио сигналов, основанных на различных моделях слухового восприятия.

В настоящее время кодирование звука используется в европейских цифровых системах радиовещания DAB (Digital Audio Broadcasting – цифровое аудио вещание), DRM (Digital Radio Mondiale – всемирное цифровое радио), американской Dolby AC-3 (ATSC, Advanced Television System Committee – комитет по улучшенным телевизионным системам), оптических дисках системы DVD-Audio, магнитооптических мини-дисках, звуковых дисках системы MP3, в сети Internet для передачи высококачественного звука.

Наиболее широкое распространение получили следующие алгоритмы компрессии цифровых аудио данных, используемых в новейших системах цифрового радиовещания и звукового сопровождения телевидения:

  • MPEG-1 ISO/IEC 11172-3;

  • MPEG-2 ISO/IEC 13818-3 и 13818-7 AAC;

  • MPEG-4 ISO/IEC 14496-3;

  • ATSC Dolby AC-3 (A/52).

Успехи цифровой видеоиндустрии (прежде всего широковещательного цифрового видео и DVD-видео) базировались на международном стандарте ISO/IEC 13818, широко известном под аббревиатурой MPEG-2 (назван так по имени рабочей группы экспертов по движущимся изображениям, разработавшей этот стандарт, - Moving Picture Experts Group). Необходимость лучшего сжатия породило разработку дальнейших стандартов видеосжатия, известных под названиями ISO/IEC 14496 Part 2 (MPEG-4 Visual) и Рекомендация организации ITU-E H.264/ISO/IEC 144496 Part 10 (сокращенно H.264). Стандарты MPEG-4 Visual и H.264 имеют общее происхождение и многие общие черты. Они оба были разработаны на основе более ранних стандартов сжатия. Однако они развивают старые стандарты в существенно различных направлениях.