Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2012_1-ИНФОРМАЦИЯ.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
181.25 Кб
Скачать

Измерение информации

Системы счисления. Для записи чисел люди используют различные системы счисления. Система счисления показывает, по каким правилам записываются числа и как выполняются арифметические действия над ними.

Обычно мы используем десятичную систему записи чисел, при которой число записывается с помощью 10 цифр (0, 1, ..., 9). Для счета времени в часах используется двенадцатеричная система счисления, в минутах и секундах — шестидесятеричная.

В компьютере для записи чисел используется двоичная система счисления, т.е. любое число записывается в виде сочетания двух цифр: 0 и 1, которые называются двоичными цифрами (binary digit, или сокращенно bit).

Единицы информации. Бит (bit) — это наименьшая единица информации, распознаваемая компьютером.

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, истина или ложь, черное или белое и т.д.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия. Тремя битами можно закодировать восемь различных значений.

Байтом (byte) называется группа из восьми битов, необходимая для представления одного символа информации. Нажатие одной клавиши на клавиатуре эквивалентно отправке одного байта информации центральному процессору компьютера. Байт — это стандартная единица измерения памяти в компьютере. Обычно ее объем выражается в килобайтах (Кбайт) или мегабайтах (Мбайт).

Единицы компьютерной памяти и их значения:

бит — наименьшая единица информации, сокращение для binary digit (двоичной цифры);

байт — 8 бит (один символ равен 8 бит);

1 килобайт (Кбайт) = 1 024 байт.

1 мегабайт (Мбайт) = 1 048 576 байт (приблизительно миллион байтов, или 1 024 Кбайт, или 210 Кбайт);

1 гигабайт (Гбайт) = 1 073 741 824 байт (приблизительно миллиард байтов, или 1 024 Мбайт, или 210 Мбайт);

1 терабайт (Тбайт) = 1 024 Гбайт (или 210 Гбайт).

Системы кодирования данных

Принцип кодирования числовой информации {представление чисел через 0 и 1) заключается в переводе чисел в двоичную систему счисления. Перевести число из десятичной системы в двоичную можно, разложив его по степеням двойки. Например, 1510 = 1 • 10' + 5 • 10° = 1 • 23 + 1 • 22 + 1 • 2' + 1 • 2° = 11112. Один бит памяти может находиться только в двух состояниях (1 или 0). Количество символов, которое можно закодировать с помощью 8 битов (одного байта), можно посчитать как 28 = 256. Ясно, что с помощью 1 байта таким образом можно закодировать числа от 0 до 255, либо от -128 до 127. Для кодирования больших (или меньших, а также нецелых) чисел можно использовать большее число байтов. 16 бит позволяют закодировать целые числа от 0 до 65 535, а 24 бит — более 16,5 млн различных значений.

Для кодирования символьной информации каждой букве, цифре, знаку ставится в соответствие числовой код размером в 1 байт. Всего, таким образом, можно закодировать 256 (28) символов. Например, буква латинского алфавита «А» обычно кодируется в персональном компьютере (ПК) как двоичное число 01000001 (десятичное 65).

Во всем мире в качестве стандарта принята таблица ASCII (American Standart Code for Information Interchange), которая кодирует латинский алфавит и ряд служебных символов с помощью чисел от 0 до 127 (базовая таблица). Вторая половина кодовой таблицы (128—255) предназначена для символов национальных алфавитов, псевдографических символов, математических знаков и т. п.(расширенная таблица)

Кодировка символов русского языка, известная как кодировка Windows-1251, была введена компанией Microsoft. Учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Кодировка символов русского языка закреплена в расширенной таблице кодирования системы ASCII с 192-го по 255-й код.

Поскольку одному байту соответствует один символ, для представления строки из четырех символов необходимо 4 байт. Вот как выглядит, например, группа символов А12В, состоящая из букв и цифр, в кодировке ASCII:

А 1 2 В

01000001 00110001 00110010 01000010

А вот как выглядит двоичное представление шести символов слова «binагу»:

B I N A RY

01000010 01001001 01001110 01000001 01010010 01011001

! Следует всегда помнить, что компьютеры — это только машины, они не понимают единиц и нулей, зато они способны интерпретировать электрическое напряжение, воспринимая его наличие как 1, а отсутствие — как 0. Эта технология и позволяет компьютерам обрабатывать информацию.

Простой принцип кодирования графической информации может заключаться в представлении картинки в виде матрицы точек, каждая из которых имеет свои координаты и цвет. Максимальное количество точек (пикселей) изображения по горизонтали и вертикали определяет размер матрицы.

Цветовая гамма кодируется с помощью чисел. В модели индексированных цветов каждый цвет имеет свой номер. В матрице, представляющей собой картинку, хранятся в этом случае номера цветов.

Напечатанное на бумаге черно-белое графическое изображение состоит из мельчайших точек — пикселов (picture element — элемент изображения), образующих характерный узор, называемый растром.

Растровое кодирование позволяет использовать двоичный код для представления графических данных, поскольку линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с помощью целых чисел. Общепринятым на се­годняшний день считается представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета. Следовательно, для кодирования яркости любой точки обычно достаточно 8-разрядного двоичного числа.

Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки, хранящимся в видеопамяти. Цветные изображения могут иметь различную глубину цвета, задаваемую количеством бит для кодирования цвета точки. Так, для глубины цвета 8 количество отображаемых цветов составляет 28= 256.

Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.

Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).

Для кодирования цветных графических изображений применя­ется принцип декомпозиции произвольного цвета на основные составляющие. Считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешивания этих трех основных цветов: красного (Red), зеленого (Green) и синего (Blue). Такая система кодирования получила название RGB (по первым буквам основных цветов).

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается.

Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек в строке и строк растра. Обычно в мониторах используют разрешающую способность экрана 800x600, 1 024x768 или 1 280x960. Рассчитаем необходимый объем видеопамяти для одного из графических режимов, напри­мер разрешением 1 024x768 и качеством цветопередачи 32 бит на точку. Необходимый объем видеопамяти составит:

32х 1 024x768 = 25 165 824 бит = 3 145 728 байт = 3 072 Кбайт = 3 Мбайт.

При кодировании звуковой информации в каждый момент времени задается частота звучания. Звук – волна с непрерывно изменяющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота, тем выше тон.

В процессе кодирования звукового сигнала производится его временная дискретизация – непрерывная волна разбивается на отдельные маленькие временные участки.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации. Частота дискретизации – количество измерений уровня сигнала в единицу времени. Количество уровней громкости определяет глубину кодирования. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. При этом количество уровней громкости равно N = 2I = 216 = 65536.

Существует много принципов кодирования различной информации. Способ кодирования информации в файле называется форматом этого файла.

Отметим особо, что для правильного декодирования информации, размещенной в некотором байте, необходимо знать, что именно там закодировано и по какому принципу.