Графика
Графические изображения, как любые другие данные, представлены в компьютере в виде двоичных чисел. Однако в зависимости от природы этих изображений (графического формата) числа играют разную роль.
Существует два типа графических форматов: векторный и растровый.
Изображение в растровом формате в памяти компьютера представлено совокупностью точек, каждая из которых имеет атрибуты (такие как цвет и маска). Если каждая точка вместе с атрибутами кодируется 32-битовым кодом (4 байта), то нетрудно посчитать, что рисунок размером 320 на 200 точек потребует для хранения 320*200*4 = 256 000 байта. Таким образом, растровый формат хранения изображений является весьма ресурсоемким. В то же время, с учетом того, что каждая точка хранится отдельно, имеется возможность ее отредактировать и скорректировать. Таким образом, там, где важно достоверно воспроизвести или откорректировать сохраненную графическую информацию, например, фотоизображение, растровый формат незаменим.
Изображение в векторном формате представляет собой графический объект, составленный из примитивов, а именно: точек, отрезков, прямых, дуг, окружностей, прямоугольников, кривых. Эти примитивы могут быть описаны математическими формулами и выражены числами, обозначающим и координаты точек начала и конца отрезка, опорных узлов кривых, радиусом и координатой центра окружности, и т.д. Даже если добавить к этим описаниям несколько чисел, кодирующих цвет, толщину тип линий, все равно очевидно, что в сравнении с растровым форматом такого рода изображения можно хранить гораздо более компактно. Тот же самый рисунок размером 320 на 200 точек, содержащий на первый взгляд очень сложный чертеж, может в памяти компьютера занимать мало места. Например, изображение машины в векторном формате занимает 41 Кбайт, а в растровом – 305 Кбайт, разница почти в 10 раз.
Двоичное кодирование текстовой информации
Для кодирования текстовых данных используются специально разработанные таблицы кодировки, основанные на сопоставлении каждого символа алфавита с определенным целым числом. Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле (2.1) можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак: N = 21 => 256 = 21 => 28 = 21 => I = 8 битов.
Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Каждому знаку необходимо поставить в соответствие уникальный 8-битовый двоичный код, значения которого находятся в интервале от 00000000 до 11111111 (в десятичном коде от 0 до 255).
Присвоение знаку конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Но не все так просто, и существуют определенные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время, наоборот, вызваны изобилием одновременно действующих и противоречивых стандартов. Практически для всех распространенных на земном шаре языков созданы свои кодовые таблицы. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, что до сих пор пока еще не стало возможным. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле (2.1) можно определить количество символов, которые можно закодировать: N = 2/ - 216 = 65 536.
Для кодирования цветных графических изображений применяется принцип декомпозиции (разложения) произвольного цвета на основные составляющие. При этом могут использоваться различные методы кодирования цветной графической информации. Например, на практике считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешивания основных цветов. В качестве таких составляющих используют три основных цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, В). Такая система кодирования называется системой RGB.
На кодирование цвета одной точки цветного изображения надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,5 млн. различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).
Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть цвет, дополняющий основной цвет до белого. Соответственно дополнительными цветами являются: голубой (Суйп, С), пурпурный (Magenta, M) и желтый (Yellow, Y). Такой метод кодирования принят в полиграфии, но в полиграфии используется еще и четвертая краска – черная (Black,, К). Данная система кодирования обозначается CMYK, и для представления цветной графики в этой системе надо иметь 32 двоичных разряда. Такой режим называется полноцветным (True Color).
Если уменьшать количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.
