
- •Понятие информации предмет и задачи информатики
- •1.1 Понятие информации.
- •1.2 Свойства информации.
- •1.3 Понятие количества информации.
- •1.4 Основные характеристики информационных процессов.
- •1.5 Предмет, задачи, структура информатики.
- •Структура информатики
- •1.5.2 Предмет и задачи информатики.
- •Методы представления данных.
- •2.1 Двоичное кодирование
- •2.2 Представление чисел.
- •2.2.1 Системы счисления.
- •2.2.2 Представление целых чисел.
- •2.2.3 Представление вещественных чисел.
- •2.2.4 Понятие типа данных.
- •2.3 Представление текстовых данных.
- •Представление звуковых данных.
- •2.5 Представление графических данных.
- •2.5.1 Модель rgb.
- •2.5.2 Модель cmyk.
- •2.5.3 Оцифровка изображения.
- •2.5.4 Понятие сжатия информации
- •3 Структуры данных.
- •3.1 Линейная структура.
- •3.2 Табличная структура данных.
- •3.3 Иерархическая структура.
- •3.4 Упорядочение структур данных.
- •3.5Хранение данных. Файлы.
- •3.5.1 Происхождение файловых систем
- •3.5.2 Принципы хранения документов.F
- •3.5.3 Форматы файлов.
- •Собственно сохраняемые данные
- •Заголовок(служебная информация)
- •Форматы графических файлов.
- •3.5.5 Принцип умолчания
Собственно сохраняемые данные
Заголовок(служебная информация)
Часто заголовок файла включает идентификатора формата файла. Например, в файлах формата .gif первыми символами скорее всего будут GIF89a, а в файл формата .pdf включается первая строка вида %PDF–1.2. Программы, которые предназначены для просмотра файлов определенного типа, могут начинать свою работу с чтения идентификатора и проверки, могут ли они воспринимать формат предложенного им файла.
До сих пор в наших примерах мы обсуждали проблему хранения достаточно однородных данных. Однако современные интегрированные программные системы позволяют одновременно использовать разные виды информации, а это требует разработки очень сложных форматов. Например, работая с программой MS Word мы можем включать в один документ текст, картинки, таблицы, созданные в Excel, и многое другое. Комбинации этих элементов в своем числе бесконечны и придумать простой формат, который позволил бы хранить все это вместе, невозможно. Например, для хранения документов MS Office строятся так называемые структурированные хранилища — фактически целые файловые системы, спрятанные в едином с точки зрения пользователя файле.
Подавляющей части пользователей практически ничего не нужно знать о внутреннем устройстве файлов, с которыми они работают. Этот уровень абстракции интерфейса операционных систем — одно из самых больших достижений компьютерных технологий.
В заключении отметим, что наличие разных форматов для хранения информации одного и того же типа затрудняет переносимость данных из среды одного приложения в среду другого. Проблема обычно решается использованием специальных программ, называемых конверторами.
Форматы графических файлов.
Приведенные рассуждения конкретизируем на примере графических изображений, для хранения которых разработано особенно большое число форматов. Во-первых, для разных типов изображений естественными являются разные способы хранения. Во-вторых, для уменьшения объема файлов могут быть применены разные методы сжатия графических данных, использование которых также определяется типом изображения. И, наконец, потребность в новых форматах возникает как следствие постоянного развития аппаратных средств.
Файлы графических изображений (графические файлы) имеет блочную структуру и состоят, по крайней мере, из двух основных частей: заголовка и данных. В начале заголовка ставятся несколько символьных знаков, которые определяют тип файла (“магические числа”). Далее следует заголовок файла. Он содержит общие сведения о файле: ширина и высота изображения, цветное оно или монохромное (двухградационное или полутоновое), использовалось ли сжатие данных и т.п. Если при оцифровке изображения использовалась палитра, то файл дополнительно содержит таблицу цветов, в соответствии с которой элементам изображения присваиваются значения RGB-троек.
Специалисты, работающие с графикой, обычно выделяют три вида изображений. Наиболее простые двухцветные изображения (bi-level), чаще всего черно-белые, могут содержать текст, чертежи и т.п. Простые контурные изображения (line art) используются в комиксах. Наиболее сложные графические картины называют изображениями фотографического качества. В них используются мягкие переходы оттенков и полутонов. Они могут быть как цветными, так и чернобелыми.
1. Форматы GIF (Graphics Interchhange Format) и PNG (Portable Network Graphics).
Формат (спецификация GIF87a) был разработан в 1987 году фирмой CompuServe для обмена данными с помощью электронной почты. В gif-файлах применяет сжатие данных без потерь (без снижения качества изображения) с помощью алгоритма LZW (Лемпеля-Зива-Уэлча). Способ кодирования позволяет быстро воспроизводить изображение. Формат допускает постепенную прорисовку interlacing). Основной недостаток — небольшая глубина цвета, так как палитра изображения может содержать не более 256 цветов.
В новой версии формата, разработанной в 1989 году (спецификация GIF89a) появилась возможность анимации. Для файлов, содержащих несколько картинок, имеется блок управления графикой, в котором содержится информация для программы просмотра, определяющая как сменять одно изображение другим.
Как следует из названия, формат PNG предназначен специально для передачи изображений по сетям. Сокращение PNG произносится как "пинг", программисты в шутку расшифровывают его как "Png's Not Gif", то есть "PNG — это не GIF".
Разработчики ставили своей целью создать новый графический формат, который включал бы все лучшее формата GIF и смог бы вытеснить его с места основного формата графики для WWW. Формат поддерживает сжатие без потерь, чересстрочность (до 7 проходов, за которые изображение проявляется на экране), прозрачность цвета (transparency), хранение пользовательских данных (например, комментариев). Но самое главное, что, в отличие от GIF, он может сохранять изображения в режиме TrueColor (до 48 бит на пиксель). Полутоновые изображения с градациями серого цвета могут иметь глубину 16 бит на пиксель.
Одно из неудобств формата GIF состоит в том, что разработчики программ, читающих и записывающих файлы в формате GIF, должны платить за лицензию фирме Unisys, владеющей правами на алгоритм сжатия LZW. PNG не использует патентованных алгоритмов и потому лишен этого недостатка.
Хотя PNG позволяет хранить изображения с огромной глубиной цвета, но для них он не обеспечивает хорошего сжатия. Поэтому для полноцветных изображений пока альтернативы формату JPEG.
2. Формат JPEG (Joint Photographics Experts Group).
Международная организация "Объединенная экспертная группа по фотографии" была создана для поиска наилучшего способа хранения изображений фотографического качества. Она обобщила опыт исследований во многих областях, связанных с изучением зрения и компьютерной графикой. Разработанный ими формат получил название JFIF (JPEG File Interchange Format), однако пользователи обычно называют его jpeg. На самом деле в этом названии JPEG — это название метод сжатия, применяемого в файлах данного формата.
Формат JPEG отличается от рассмотренных ранее тем, что в нем реализована модель, включающая алгоритм сжатия с потерей информации. Этот алгоритм может частично определить и удалить ту информацию, которая несущественна для восприятия изображения. Большинство программ, создающих такие файлы, позволяет задавать степень сжатия с помощью параметра "качество " (quality). Чем выше значения этого параметра, тем более точно хранится изображение. Однако при этом растет объем получаемых файлов.
Заголовок файлов формата .jpeg (иначе .jpg) всегда начинается с двух числовых кодов 255 и 232 (шестнадцатеричные значения FF и D8).
Если необходимо включить графику в документ, предназначенный для распространения через Интернет, то сразу возникает вопрос: какой формат выбрать для вставляемого изображений? Файлы даже небольших графических изображений всегда достаточно велики. При загрузке через Web это может стать источником проблем, так как многие пользователи не станут долго дожидаться, пока изображение проявится на экране. Сейчас наиболее распространенными являются форматы GIF и JPEG. Каким из них лучше воспользоваться? Когда как. Это зависит прежде всего от типа изображения и допустимого размера файла.
Наилучшим способом хранить фотографии и картинки, с цветами, переходящими друг в друга, является JPEG. С другой стороны, если на картинке большие однотонные области или четкие контуры, то изображение сохранить в формате GIF.
Главная причина, по которой JPEG-формат больше подходит для сложных цветовых картин фотографического качества, в том, что этот формат способен хранить изображения с миллионами цветов, в то время как GIF ограничен 256 цветами. Кроме того, JPEG позволяет достичь более высокой степени сжатия, чем GIF, что дает возможность ускорить загрузку изображений.
Однако у JPEG есть недостаток. В основе используемого им алгоритма сжатия лежит дискретное косинус-преобразование, которое хорошо приспособлено для передачи плавных переходов цветов. Если необходимо сохранить двухцветное или контурное изображение, где нужно отображать четкие граничные контуры, формат JPEG не подходит — после сжатия изображения будут выглядеть разорванными (фрагментированными).
Далее, вывод GIF-картинок может происходить сначала с низким разрешением, а затем с его повышением до полного качества, позволяя пользователю быстро понять, что изображено на картинке и стоит ли ждать окончания загрузки. JPEG позволяет выводить изображения только одним способом — построчно и сверху–вниз. Еще одно преимущество формата GIF в том, что фон изображения можно сделать прозрачным, т.е. видеть под картинкой те цвета, которые были на этом месте экрана до загрузки изображения. И, наконец, GIF позволяет анимировать изображения, а JPEG — нет.