6. Информация. Единицы измерения информации.
Понятие «информация» столь широко, что невозможно дать конкретное определение этому понятию. Но если попытаться дать общее определение, то информация – знания, которые человек получает от всех источников
Знания:
1. Декларативные, т.е. знаешь что делать (данные).
2.Процедурные, т.е. знаешь, как делать (программные).
Данные – это зарегистрированные сигналы любой физической природы
Программа – набор инструкций на машинном языке, хранящихся в виде файла на магнитном диске, откуда по команде загружается в ПК для выполнения (форма представления алгоритма для исполнения его машиной). В ЭВМ информация представлена в виде двоичного кода.
Кодирование информации – представление информации, с какой – либо последовательностью сигнала.
При двоичном кодировании каждая цифра называется битом (1 бит имеет 2 любых состояния 0 и 1), с помощью 2 бит кодируется четыре, в бите 8 состояний.
В общем случае n – бит 2 состояний.
1 байт = 8 бит – единицы измерения количества информации. Именно 8 бит требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры ПК (256 = 28).
1 Кбайт = 1024 байт (210 байт) 1 Терабайт = 1024 Гбайт (240 байт)
1 Мбайт = 1024 Кбайт (220 байт) 1 Петабайт = 1024 Тбайт (250 байт)
1 Гбайт = 1024 Мбайт. (230 байт) 1 Экзабайт = 1024 Пбайт (260 байт)
7. Кодирование текстовых данных.
Если каждому символу алфавита сопоставить определенное целое число, то с помощью двоичного кода можно кодировать текстовую информацию. Восьми битов достаточно для кодирования 256 различных символов. Общепринятой системой кодирования текстовых данных является кодировка ASCII (American Standard Code Information Interchange – стандартный код информационного обмена США). В данной системе закреплены 2 таблицы кодирования: базовая и расширенная. Базовая таблица определяет значения кодов от 0 до 127 и содержит коды символов англ.алфавита, знаков препинания, цифр, знаков арифметических действий и т.д. Расширенная таблица определяет значения кодов от 128 – 255 и включает в себя национальные системы кодирования.
8. Кодирование графических данных.
При рассмотрении черно - белого графического изображения, можно увидеть совокупность мельчайших точек, образующий характерный узор, называемый растром.
Т.к. линейные координаты и яркость каждой точки можно выразить с помощью целых чисел, то, следовательно, для представления графических данных можно использовать двоичное кодирование. Общепринятым является представление черно – белых иллюстраций в виде комбинаций точек с 256 градациями серо цвета. Т.о. для кодирования любой точки достаточно 3 байт (по одному для кодирования яркости и линейных координат по оси Х и У).
Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие, производящиеся на основе 2 методов.
Первый метод предполагает наличие 3 основных цветов:
R (Red) – красный,
G (Green) – зеленый,
B (Blue) – синий.
Любой другой цвет получается путем механического смещения 3 основных цветов. Данная система называется RGB.
Второй метод подразумевает наличие 4 основных цветов:
C (Cyan) – голубой,
M (Magenta) – пурпурный,
Y (Yellow) – желтый,
K-Black – черный.
Для представления цветной графики в системе CMYK необходимо иметь 4 байта на определение цвета каждой точки. Оба режима кодирования RGB и CMYK называются полноцветными (True Color).