Кодирование информации
.pdfСистемы счисления
Шестнадцатеричная система счисления
Обозначение первых десяти можно взять из десятичной системы счисления, а для остальных шести решили использовать первые шесть букв латинского алфавита:
10 - A, 11 - B, 12 - C, 13 - D, 14 - E, 15 - F.
Переведём число А1F8 из шестнадцатеричной системы в десятичную:
А1F816 = 8×160 + 15×161 + 1×162 + 10×163 = 8 + 240 + 256 + 40960 = 41464
В обратную сторону: число 196 из десятичной системы в шестнадцатеричную:
196 : 16 = 12 (4) , т.е. 19610 = С416
Системы счисления
Связь между числами двоичной и шестнадцатеричной систем
Системы счисления
Правила перевода из одной системы счисления в другую:
•Чтобы перевести число из десятичной системы счисления в любую другую, надо делить с остатками это число на основание новой системы счисления. В результат записывается последнее частное и все остатки от деления в обратном порядке (от последнего к первому).
•Чтобы перевести число из произвольной системы счисления в десятичную, надо разложить его по степеням основания этой системы счисления (цифры - коэффициенты) и выполнить арифметические действия.
•Чтобы перевести число из восьмеричной системы в двоичную, надо каждую цифру восьмеричного числа заменить на три цифры её двоичного кода.
•Чтобы перевести число из двоичной системы в восьмеричную, надо разбить это двоичное число на тройки цифр, начиная с конца (при необходимости, в начале числа добавить нули), а затем, пользуясь таблицей, каждую тройку цифр заменить соответствующей цифрой восьмеричной системы.
•Чтобы перевести число из шестнадцатеричной системы в двоичную, надо каждую цифру шестнадцатеричного числа заменить на четыре цифры её двоичного кода.
•Чтобы перевести число из двоичной системы в шестнадцатеричную, надо разбить это двоичное число на четвёрки цифр, начиная с конца (при необходимости, в начале числа добавить нули), а затем, пользуясь таблицей, каждую четвёрку цифр заменить соответствующей цифрой шестнадцатеричной системы
Двоичное кодирование
Двоичное кодирование – это кодирование всех видов информации с помощью двух знаков (обычно 0 и 1).
Передача электрических сигналов:
U |
сигнал с помехами |
U |
сигнал с помехами |
|
|
|
5 В |
|
«1» |
|
|
|
|
|
1 |
0 |
1 |
полезный |
полезный |
|
«0» |
сигнал |
сигнал |
|
время |
|
|
||
|
время |
|
|
14
Двоичное кодирование
|
|
|
|
|
|
|
|
|
|
|
символы |
|
|
|
|
|
|
|
|||
|
|
|
|
кодировщик |
|
|
|
|
101011011101110110101 |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
||
рисунки |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
• в такой форме можно закодировать все виды информации
•нужны только устройства с двумя состояниями
•практически нет ошибок при передаче
•компьютеру легче обрабатывать данные
• человеку сложно воспринимать двоичные коды
15
Кодирование символов
Текстовый файл
•на экране (символы)
•в памяти – двоичные коды
10000012 |
10000102 |
10000112 |
10001002 |
|
|
|
|
65 |
66 |
67 |
68 |
В файле хранятся не изображения символов, а их числовые коды в двоичной системе!
Кодирование символов
1. Сколько символов надо использовать
одновременно? 256 или 65536 (UNICODE)
2. Сколько места надо выделить на символ:
256 = 28 8 бит на символ
3.Выбрать 256 любых символов (или 65536) - алфавит.
4.Каждому символу – уникальный код 0..255 (или 0..65535). Таблица символов:
коды |
65 |
66 |
67 |
68 |
|
|
|
|
|
|
|
|
|
|
|
|
… |
A |
B |
C |
D |
… |
|
|
|
|
|
|
|
|
|
5. Коды – в двоичную систему.
Кодировка 1 байт на символ
|
0 |
1 |
127 |
|
|
128 |
254 |
255 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
таблица ASCII (международная) |
кодовая страница |
ASCII = American Standard Code for Information Interchange
0-31 управляющие символы:
7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc.
32 пробел
знаки препинания: специальные знаки: 48-57 цифры 0..9
. , : ; ! ?
+ - * / () {} []
65-90 заглавные латинские буквы A-Z
97-122 строчные латинские буквы a-z
Кодовая страница (расширенная таблица ASCII)
для русского языка:
CP-866 для системы MS DOS CP-1251 для системы Windows КОИ8-R для системы UNIX (Интернет)
Кодировка UNICODE (2 байта на символ)
•Windows, MS Office, …
•16 бит на символ
•65536 или 216 символов в одной таблице
• можно одновременно использовать символы разных языков
• размер файла увеличивается в 2 раза
Два типа кодирования рисунков
• растровое кодирование
точечный рисунок, состоит из пикселей
фотографии, размытые изображения
• векторное кодирование
рисунок, состоит из отдельных геометрических фигур
чертежи, схемы, карты