Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lections.doc
Скачиваний:
253
Добавлен:
13.03.2016
Размер:
1.4 Mб
Скачать

7.3. Символы

Текстовые данные рассматриваются как последовательность отдельных символов, каждому из которых ставится в соответствие двоичный код некоторого неотрицательного целого числа. Существуют разные способы кодирования символов. Наиболее распространенной до последнего времени была кодировка ASCII(AmericanStandardCodeforInternationalInterchange). При использовании этой кодировки для представления символа используется 1 байт (8 разрядов). Таким образом, имеется возможность закодировать 256 различных символов.

Для отображения текстового документа с разбивкой его на строки, выравниванием и другими элементами форматирования, в него наряду с обычными символами включаются специальные (управляющие) символы.

В системе ASCIIзакреплены две таблицы кодирования базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная от 128 до 255. Первые 32 кода базовой таблицы, начиная с нулевого, содержат управляющие коды. Они не выводятся на экран, но с их помощью можно управлять выводом других данных. С 32 по 127 код размещены символы английского алфавита, цифры, знаки арифметических операций и т. п. Расширенная часть системы кодированияASCIIсодержит национальные системы кодирования, т. е. коды с 128 по 255 будут содержать русский алфавит, а также символы псевдографики.

ASCIIпозволяет закодировать только 256 символов, но в некоторых языках символов больше, поэтому разрабатываются другие коды. Наиболее перспективным являетсяUnicode. В этом коде каждый символ состоит из 16 битов (2 байта), что позволяет кодировать 65536 различных символов. Для каждого алфавита определены свои кодовые позиции. Например, 0100-017F– европейские латинские символы , 0400-04FF– кириллица и т. д. Около 29000 позиций пока не заняты, но зарезервированы для использования. Таким образом,Unicodeдопускает обмен данными на разных языках, каждому коду соответствует единственный символ, коды для разных языков не пересекаются.

На Unicodeпостроена ОСWindowsNT. УWindows95-98 16-битное наследство, поэтому вся внутренняя работа в этой ОС построена на использованииANS-строк (ANSII–AmericanNationalStandardInstitute), в которых символ записан в один байт.ANSI-текст (или текстASCII) - это текст без форматирования (с ним работает приложение «Блокнот» вWindows9x).

Если для представления информации в разных информационных системах используются разные кодировки, то данные, подготовленные в одной системе, не смогут быть использованы в другой.

7.4. Кодирование графической информации

Способ кодирования графических изображений, отображаемых на экране, называют матричным. При этом экран рассматривается как двумерный массив отдельных точек (пикселов). Такой метод кодирования графической информации называется растровым. Для каждой точки рассматриваются ее линейные координаты и яркость, которые задаются в виде целых неотрицательных чисел. Общепринятым на сегодняшний день является представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета. Таким образом, для кодирования яркости любой точки будет достаточно одного байта, т. е. восьмиразрядного двоичного числа.

Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три цвета: красный (Red, R), зеленый (Green,G), синий (Blue,B). На практике считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех цветов. Такая система кодирования называется системойRGB- по первым буквам основных цветов.

Если для кодирования яркости каждой из основных составляющих использовать по 256 значений (8 двоичных разрядов), то на кодирование одной точки придется затратить 24 разряда, при этом система кодирования обеспечивает однозначное определение 16,5 миллионов различных цветов. Режим представления цветной графики с использованием 24 разрядов называется полноцветным (TrueColor).

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, т. е. цвет, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов: голубой (Cyan, C), пурпурный (Magenta,M), желтый (Yellow,Y). Принцип декомпозиции произвольного цвета на составляющие компоненты можно применить не только для основных цветов, но и для дополнительных, т. е. любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющих. Такой метод кодирования принят в полиграфии, но там используется еще и четвертая краска – черная (Black, К). Поэтому данная система кодирования обозначается четырьмя буквами -CMYK. Для представления цветной графики в этой системе надо иметь 32 двоичных разряда. Такой режим тоже называется полноцветным (TrueColor).

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом HighColor.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]