Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3. Форматы графических данных.docx
Скачиваний:
24
Добавлен:
09.02.2015
Размер:
33.82 Кб
Скачать

3. Форматы геоданных

3.1. Основные понятия информационных систем

Напомним несколько основных понятий информационных систем, чтобы лучше понять что такое форматы данных.

Информация - это данные на любом носителе. Информационная система - это система, состоящая из трех элементов (программные, технические средства, персонал) и выполняющая следующие основные функции: хранение,) и выполняющая следующие основные функции: хранение, поиск, представление, сбор, обработка, защита, распространение, передача.

Самые основные: хранение, поиск, представление.

3.2. Понятие формата

С понятием формата наиболее связаны хранение и передача (обмен данными) данных. Хранение связано с объемом, передача со скоростью (передача объема во времени).

Хранение определенного объема данных и их передача по каналу передачи информации стоят достаточно дорого. Поэтому разработчики файла стремятся к уменьшению объема памяти, занимаемого файлом, что сокращает стоимость хранения и передачи данных.

Для сокращения занимаемого объема памяти файла используют различные способы сжатия файла для уменьшения его объема при обеспечении минимума потерь информации.

Стремление уменьшить существующий объем файла для его хранения и увеличение скорости его передачи привело к понятию формат файла.

Формат графического файла способ представления и расположения графических данных на внешнем носителе.

Если говорить точнее, то формат — это некоторое описание (спецификация) того, что именно, где и в каком виде должно быть представлено в файле.

Пользователю графической программы не требуется знать, как именно в том или ином формате хранится информация о графических данных. Однако умение разбираться в особенностях форматов имеет большое значение для эффективного хранения изображений и организации обмена данными между различными приложениями.

Различают векторные и растровые форматы.

3.3. Векторные форматы

Файлы векторного формата содержат описания рисунков в виде набора команд для построения простейших графических объектов (линий, окружностей, прямоугольников, дуг и т. д.). Кроме того, в этих файлах хранится некоторая дополнительная информация. Различные векторные форматы отличаются набором команд и способом их кодирования.

Растровые форматы

В файлах растровых форматов запоминаются:

• размер изображения — количество видеопикселей в рисунке по горизонтали и вертикали

• битовая глубина — число битов, используемых для хранения цвета одного видеопикселя

• данные, описывающие рисунок (цвет каждого видеопикселя рисунка), а также некоторая дополнительная информация.

В файлах растровой графики разных форматов эти характеристики хранятся различными способами.

Методы сжатия делятся на две категории:

• сжатие файла с помощью программ — архиваторов;

• сжатие, алгоритм которого включён в формат файла.

В первом случае специальная программа считывает исходный файл, применяет к нему некоторый сжимающий алгоритм (архивирует) и создаёт новый файл. Выигрыш в размере нового файла может быть значительным. Однако этот файл не может быть использован ни одной программой до тех пор, пока он не будет преобразован в исходное состояние (разархивирован). Поэтому такое сжатие применимо только для длительного хранения и пересылки данных, но для повседневной работы оно неудобно. В системах DOS и WINDOWS наиболее популярными программами сжатия файлов являются ZIP, ARJ, RAR и другие.

Если же алгоритм сжатия включён в формат файла, то соответствующие программы чтения правильно интерпретируют сжатые данные. Таким образом, такой вид сжатия очень удобен для постоянной работы с графическими файлами большого размера. Например, пусть в CorelDRAWполучен рисунок, который нужно разместить в документе, созданном в программеAdobe PhotoShop.TIFF— один из растровых форматов, с которыми может работатьAdobe PhotoShop.При формировании файла форматаTIFFвыполняется сжатие графических данных. Именно это обстоятельство учитывается соответствующей программой чтения. Поэтому для достижения поставленной цели можно поступить следующим образом:

• сохранить рисунок, созданный в CorelDRAW, в файле форматаTIFF;

• импортировать этот файл в программу Adobe PhotoShop.

 Алгоритмы сжатия, используемые при создании файлов, делятся на два класса: обеспечивающие сжатие без потери информации и допускающие некоторую ее потерю. Сжатие без потерь основано на удалении избыточности исходного представления информации, т. е. на применении более экономного кодирования. Такое сжатие еще называют обратимым. Сжатие с потерями базируется на удалении некоторой части информации. В ряде случаев эти потери оказываются практически незаметными для зрения или вполне допустимыми. Это относится главным образом к изображениям типа фотографии. Опыт показывает, что довольно часто за счет незначительной потери качества такого изображения можно существенно сократить объем файла. Сжатие с потерями называют также необратимым.

Допустим, исходная информация представлена в виде следующей последовательности букв: ААААББВВВААААААА. Само собой напрашивается более экономное представление этой информации: А4Б2ВЗА7. Здесь число указывает количество повторений буквы, указанной слева от числа. Алгоритм декодирования этой последовательности очевиден: каждую букву необходимо записать столько раз, сколько указано числом справа от нее. В данном случае мы сократили объем данных в 2 раза, причем без потерь, поскольку есть декодирующий алгоритм, полностью восстанавливающий исходные данные.

Простейшие алгоритмы сжатия, называемые также алгоритмами оптимального кодирования, основаны на учете распределения вероятностей элементов исходного сообщения (текста, изображения, файла). На практике обычно в качестве приближения к вероятностям используют частоты встречаемости элементов в исходном сообщении. Вероятность — абстрактное математическое понятие, связанное с бесконечными экспериментальными выборками данных, а частота встречаемости — величина, которую можно вычислить для конечных множеств данных. При достаточно большом количестве элементов в множестве экспериментальных данных можно говорить, что частота встречаемости элемента близка (с некоторой точностью) к его вероятности.

Если вероятности неодинаковы, то имеется возможность наиболее вероятным (часто встречающимся) элементам сопоставить более короткие кодовые слова и, наоборот, маловероятным элементам сопоставить более длинные кодовые слова. Таким способом можно уменьшить среднюю длину кодового слова. Оптимальный алгоритм кодирования делает это так, чтобы средняя длина кодового слова была минимальной, т. е. при меньшей длине кодирование станет необратимым. Такой алгоритм существует, он был разработан Хаффменом и носит его имя. Этот алгоритм используется, например, при создании файлов в формате JPEG.