1 / Salmon_sjatie_dannyh_izobrajeniy_i_zvuka[torrents.ru]
.pdf350 Глоссарий
выступает код ASCII. Многие новые приложения поддерживают ко довый стандарт UNICODE, а более старый стандарт EBCDIC все еще применяется в компьютерах IBM.
Коды Грея
Двоичные коды для представления натуральных чисел. Коды лю бых двух последовательных чисел различаются ровно на 1 бит. Эти коды используются при разделении изображений с градацией серо го на битовые слои, каждый из которых становится двухуровневым изображением. (См. также Изображение с градацией серого цвета.)
Коды переменной длины
Используются в статистических методах сжатия. Эти коды долж ны удовлетворять свойству префикса (§ 1.2) и они присваиваются входным символам в соответствии с их вероятностями. (См. также Свойство префикса, Статистические методы.)
Конференция по сжатию данных (Data Compression Con ference, DCC)
Конференция для исследователей и разработчиков в области сжатия данных. DCC происходит ежегодно в городе Сноуберд, штат Юта, США. Она происходит в марте и длится три дня.
Корреляция
Статистическая мера линейной зависимости между двумя парны ми величинами. Эта величина меняется от -1 (совершенная отри цательная зависимость), через О (отсутствие зависимости) и до +1 (совершенная положительная зависимость).
Коэффициент сжатия
Важная величина, которая постоянно используется для определения эффективности метода сжатия. Она равна частному
Коэффициент сжатия = |
размер выходного файла |
з — • |
|
|
размер входного файла |
Коэффициент 0.6 означает, что сжатые данные занимают 60% от исходного размера. Значения большие 1 говорят о том, что выход ной файл больше входного (отрицательное сжатие).
Иногда величина равная 100 х (1 — коэффициент сжатия) исполь зуется для определения качества сжатия. Значение, равное 60, озна чает, что выходной поток занимает 40% от объема исходного по тока (то есть, при сжатии освободилось 60% объема). (См. также Фактор сжатия.)
Глоссарий 351
Коэффициент усиления слсатия
Это число определяется формулой
контрольный размер
Коэффициент усиления сжатия
сжатый размер
где контрольный размер - это либо размер входного потока, либо размер сжатого файла, произведенного некоторым эталонным ме тодом сжатия.
Методы LZ
Все словарные методы сжатия основаны на работах Я.Зива (J.Ziv) и А.Лемпэла (A.Lempel), опубликованных в 1977 и 1978 гг. С тех пор эти методы принято подразделять на методы LZ77 и LZ78. Эти замечательные идеи вдохновили многих исследователей, кото рые обобщали, улучшали и комбинировали их, например, с методом RLE или со статистическими алгоритмами. В результате появилось огромное число известных адаптивных методов сжатия текстов, изображений и звука. (См. Словарное сжатие. Сжатие скользящим окном).
Методы LZSS
Это вариант метода LZ77 (см. § 2.2) был разработан Сторером (Storег) и Сжимански (Szymanski) в 1982 [Storer 82]. Базовый алгоритм был улучшен по трем направлениям: (1) буфер упреждения сохра нялся в циклической очереди, (2) буфер поиска (словарь) хранился в виде дерева двоичного поиска и (3) метки имели два поля, а не три. (См. Методы LZ).
Методы LZW
Это популярная версия алгоритма LZ78 (см. § 2.4) была разработана Терри Уэлчем (Terry Welch) в 1984. Его главной особенностью явля ется удаление второго поля из метки. Метка LZW состоит только из указателя на место в словаре. В результате такая метка всегда кодирует строку из более чем одного символа.
Модель с ж а т и я LZW
Модель является методом предсказания (или прогнозирования веро ятности) данных, которые необходимо сжать. Эта концепция весь ма важна при статистическом сжатии данных. При использовании статистического сжатия модель необходимо построить до начала процесса сжатия. В простейшей модели происходит чтение всего входного потока и подсчет частоты появления каждого символа.
^ 5 2 Глоссарий
После этого входной поток считывается повторно, символ за симво лом, и производится сжатие с учетом информации о вероятностной модели. (См. также Статистические методы. Статистические мо дели.)
Важная особенность арифметического кодирования состоит в возможности отделения статистической модели (таблицы частот и вероятностей) от операций кодирования и декодирования. Напри мер, легко закодировать первую половину потока данных с помо щью одной модели, а вторую - с помощью другой модели.
Метод SPIHT
Прогрессирующий метод кодирования, который эффективно кодиру ет изображения после применения вейвлетных фильтров. Этот ме тод является вложенным и имеет естественное сокращение инфор мации. Его легко реализовывать, он работает быстро и дает пре красные результаты при сжатии любых типов изображений. (См. также Методы LZW, Прогрессирующее сжатие изображений. Дис кретное вейвлетное преобразование.)
Непрерывно-тоновое изображение
Цифровое изображение с большим числом цветов, в котором сосед ние области окрашены в непрерывно меняющиеся цвета, то есть разность значений соседних пикселов мало и незаметно глазу. При мером может служить изображение с 256 градациями серого цвета. Если соседние пикселы такого изображения имеют соседние значе ния, то они будут восприниматься глазом, как непрерывно меня ющиеся оттенки серого цвета. (См. также Двухуровневое изобра жение. Дискретно-тоновое изображение. Изображение с градацией серого цвета.)
Отсчеты
Коэффициенты вейвлетного преобразования. (См. также Дискрет ное вейвлетное преобразование.)
Пел
Наименьшая единица факсимильного изображения, точка. (См. так же Пиксел.)
Пиксел
Наименьшая единица цифрового изображения, точка. (См. также Пел.)
Глоссарий 353^
Предсказание
Приписывание некоторых вероятностей символам алфавита.
Преобразование изо6ра:жений
Изображение можно сжать с помощью перевода его пикселов (кото рые бывают коррелированными) в другое представление, которое является декоррелир ованным. Сжатие достигается, если новые зна чения меньше, в среднем, чем исходные величины. Сжатие с поте рями можно получить, если дополнительно квантовать преобразо ванные значения. Декодер получает преобразованные величины из сжатого потока и реконструирует (точно или приближенно) исход ные данные с помощью применения обратного преобразования. (См. также Дискретное косинус-преобразование, Дискретное вейвлетное преобразование.)
Прогрессирующее сжатие изображений
Метод компрессии изображений, при котором сжатый поток состо ит из нескольких «слоев», причем каждый следующий слой несет все более детальную информацию об изображении. Декодер может бы стро показать весь образ с грубым разрешением, а затем улучшать качество картинки по мере приема и декодирования следующих сло ев. Зритель, наблюдающий на экране декодируемое изображение, сможет получить представление о нем после разжатия всего 5-10% образа. Улучшение качества изображения можно добиться с помо щью (1) повышения резкости, (2) добавления цветов или (3) увели чения разрешения.
Психоакустическая модель
Математическая модель маскирования звуков близких частот при восприятии органами слуха человека (ухо-мозг).
Свойство префикса
Один из принципов построения кодов переменной длины. Если не которая последовательность битов выбрана в качестве кода опре деленного символа, то никакой другой код не может начинаться с этой же последовательности битов (не должен быть префиксом дру гого кода). Например, если строка «1» назначена кодом символа ai, то никакой другой код не может начинаться с 1 (т.е., все другие коды будут начинаться с 0). Если код «01» присвоен символу а2, то в начале другого кода не должна стоять последовательность 01 (они могут начинаться с 00). (См. также Коды переменной длины. Статистические методы.)
354 Глоссарий
Сжатие без потерь
Метод сжатия, при котором выход декодера всегда тождественно совпадает с исходными данными, поступившими на вход кодера. (См. также Сжатие с потерями.)
Сжатие видео
Сжатие видеоданных основано на двух принципах. Первый состоит в использовании пространственной избыточности, которая присут ствует в каждом отдельном кадре. Второй базируется на том свой стве, что текущий кадр часто бывает близок или похож на соседние кадры. Это свойство называется временной избыточностью. Типич ный алгоритм сжатия видеоряда начинает со сжатия первого кадра с применением некоторого эффективного метода сжатия изображе ний, после чего каждый следующий кадр будет представляться раз ностью с одним из своих предшественников, причем кодироваться будет только эта разность.
Сжатие с потерями
Метод сжатия, при котором выход декодера отличается от исход ных данных, сжатых кодером, но результат, тем не менее, устра ивает пользователя. Такие методы применяются при сжатии изо бражений и звука, но они приемлемы при компрессии текстовой ин формации, в которой потеря хоть одной буквы может привести к двусмысленному и непонятному тексту (например, при сжатии ис ходных текстов компьютерных программ). (См. также Сжатие без потерь.)
Сжатие скользящим окном
Метод LZ77 (§ 2.1) использует часть ранее полученного потока дан ных в качестве словаря. Кодер строит окно во входных данных, в которое задвигаются справа налево поступающие символы для ко дирования. Этот метод основан на скользящем окне. (См. также Методы LZ.)
Символ
Наименьшая единица в сжимаемых данных. Обычно, символом слу жит один байт, но им может быть один бит, или элемент из множе ства {0,1,2}, или еще что-то.
Глоссарий 355J
Скалярное квантование
В словаре термин «квантование» определяется как «сокращение не которой точной величины до ограниченного, дискретного множе ства значений». Если данные, которые необходимо сжать состоят из больших чисел, то при квантовании они переводятся в меньшие числа. Результатом является сжатие с потерей. Если необходимо сжать аналоговые данные (например, электрический сигнал пере менного напряжения), то квантование означает оцифровывание. Та кое квантование часто применяется в методах сжатия звука. (См. также Векторное квантование.)
Словарное сакатие
Метод компрессии данных (см. главу 2), которые сохраняют неко торые образцы данных в специальной структуре, называемой «сло варем» (обычно, это дерево). Если строка новых данных на входе тождественна некоторому образцу из словаря, то в выходной по ток или файл записывается указатель на этот образец. (См. также Методы LZ.)
Стандарт JFIF
Полное название этого метода (§ 3.7.8) - JPEG File Interchange Format (формат обмена файлами стандарта JPEG). Это формат графических файлов, который позволяет компьютерам обменивать ся сжатыми изображениями стандарта JPEG. Главная особенность этого формата состоит в использовании трехбайтового цветового пространства YCbCr (или однобайтового для образов с градацией серого). Кроме того в файл добавляются некоторые атрибуты, кото рых нет в формате JPEG, а именно, разрешение изображения, гео метрический размер пиксела и некоторые другие параметры, спе цифические для конкретных приложений.
Стандарт JPEG
Весьма изощренный метод сжатия с потерями для компрессии цвет ных изображений (не анимации). Он отлично работает с непре рывно тоновыми изображениями, в которых соседние пикселы име ют близкие значения. Достоинство метода состоит в использова нии большого числа легко настраиваемых параметров, которые да ют пользователю возможность контролировать долю отбрасывае мой информации (то есть, степень сжатия образа) в весьма широких пределах. Имеется две основные моды: с потерей информации (ба зовая мода) и без потери информации (которая дает коэффициент сжатия порядка 2:1 и выше). Большинство популярных приложений
,356 Глоссарий
поддерживают только базовую моду. Эта мода врслючает прогрес сирующее кодирование и иерархическое кодирование.
Главная идея стандарта JPEG состоит в том, что изображения создаются для того, чтобы люди на них смотрели, поэтому при сжа тии допустимо отбрасывание части информации изображения, ко торое не заметно или не воспринимается глазом человека.
Аббревиатура JPEG означает Joint Photographic Experts Group (объединенная группа по фотографии). Проект JPEG был иниции рован совместно комитетом CCITT и организацией ISO в июле 1987 года. Этот стандарт был признан во всем мире. Он широко исполь зуется в представлении графических образов, особенно на страни цах всемирной паутины. (См. также JPEG-LS, MPEG.)
Стандарт JPEG-LS
Мода без потерь стандарта JPEG является неэффективной и поэто му ее редко реализуют в конкретных приложениях. Поэтому ISO приняло решение разработать новый стандарт для сжатия без по терь (или почти без потерь) непрерьшно тоновых изображений. В ре зультате появился известный стандарт JPEG-LS. Этот метод не является простым расширением или модификацией JPEG. Это но вый метод, простой и быстрый. В нем не используется ни DCT, ни арифметическое кодирование, но зато применяется весьма ограни ченное квантование (в моде с почти без потерями). JPEG-LS прове ряет несколько предыдущих соседей текущего пиксела и использует их в качестве контекста этого пиксела. С помощью контекста де лается прогноз текущего пиксела и выбирается некоторое распре деление вероятностей из имеющегося семейства распределений. На основе выбранного распределения определяется код ошибки прогно за с помощью специального кода Голомба. Существует также мо да кодирования длины повторов, в которой кодируются длины по вторяющихся последовательностей одинаковых пикселов. (См. так же JPEG.)
Статистическая модель
См. Модель компрессии.
Статистические методы
Эти методы (глава 1) выполняют присвоение символам из потока данных кодов переменной длины, причем более короткие коды на значаются символам или группам символов, которые чаще встреча ются во входном потоке (имеют большую вероятность появления). (См. также Коды переменной длины, Свойство префикса, Кодиро вание Хаффмана, Арифметическое кодирование.)
Глоссарий 357J
Теория информации
Математическая теория, которая придает точный количественный смысл понятию информация. Она определяет, как измерить инфор мацию и ответить на вопрос: сколько информации содержится в том или ином массиве данных? Ответом выступает точное число. Теория информация была создана в 1948 в работах Клода Шеннона.
Факсимильное сжатие
Передача типичной страницы между двумя факс-машинами по те лефонным линиям связи без использования компрессии может за нять от 10 до 11 минут. По этой причине комитет ITU разработал несколько стандартов сжатия факсимильных сообщений. Обп1;епринятыми стандартами на сегодняшний день являются (см. § 1.6) Т4 и Т6, которые еш,е называются Group 3 и Group 4, соответственно.
Фактор сжатия
Величина, обратная коэффициенту сжатия. Определяется по фор
муле
размер входного файла Фактор сжатия = размер выходного файла
Значение, большее 1, означает сжатие, а меньшее 1 - расширение. (См. также Коэффициент сжатия.)
Энтропийное кодирование
Метод сжатия без потери информации, при котором данные сжима ются так, что среднее число битов на символ стремится к энтропии входного источника символов.
Потребность -вот мать со1сатия.
— Эзоп (перефразированное)
Сообщество сжатия данных
Читатели, которые заинтересовались проблемами сжатия информа ции, могут присоединиться к «Сообществу сжатия данных». Мож но также поучаствовать в Конференция по сжатию данных (Data Compression Conference), которая проходит ежегодно в Сноуберде, штат Юта, США. Она проводится в марте и длится три дня. Более подробную информацию можно обнаружить на сайте конференции http://www.cs.brandeis.edu/ dec/index.html. На этой странице также находятся сведения об организаторах конференции и ее гео графическом положении.
Помимо выступлений приглашенных докладчиков и технических сессий, на конференции проводятся «промежуточные встречи», на которых обсуждаются текущие научные проблемы и выставляются стенды участников конференции. После докладов происходит не формальное общение лекторов и слушателей в очень приятной и дружеской атмосфере.
Каждый год на конференции присуждается премия имени Капочелли за самую интересную студенческую работу в области сжатия данных.
Из программы конференции можно узнать «who's who» в сжа тии данных, но две центральных фигуры - это профессор Джеймс Сторер (James Storer) и профессор Мартин Кон (Martin Cohn). Пер вый является председателем конференции, а второй - председателем программного комитета.
Публикуемые материалы конференции по традиции выходят под редакцией Сторера и Кона. Эти труды издаются в IEEE Computer Society (http: //www. computer. org/).
Полная библиография (в формате TfeX) статей, опубликованных на последних конференциях DCC находится по следующему адресу http://www . cs . mu . oz . au/Slistair/dccrefs . bib .