Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.56 Mб
Скачать

Кодирование информации

Код – это правило отображения одного набора объектов или знаков в другой набор знаков без потери информации. При этом можно всегда однозначно возвратиться к прежнему набору объектов или знаков.

Например, любую информацию можно передать русским языком с помощью 33 букв русского алфавита и добавочных знаков препинания.

Кодирование – это представление, моделирование одного набора знаков другим с помощью кода.

Кодовая таблица – это соответствие между набором знаков и их кодами, обычно разными числами.

Первые 32 кода 0–31 отведены под управляющие символы, отвечающие за форматирование текста и другие вспомогательные функции. Например, символ конца абзаца, получающийся при нажатии клавиши <Enter>, имеет код 13. Эти «символы» обычно в таблицах не рисуются.

Символы с кодами 32–126 являются аски-кодами.

Остальные коды 128–255 соответствуют символам других национальных алфавитов.

Аски-коды (ASCII) состоят из следующих четырех групп символов.

1. Прописных и строчных букв английского алфавита – 52 символа.

2. 10 цифр 0–9.

3. 33 знаков препинания и 22 специальных символов (в том числе пробела).

Символы набираются на клавиатуре и кодируются в соответствие с кодовой таблицей. Кодовая таблица обычно рисуется в виде таблицы из 16 строк. В кодовой таблице содержится 256 символов с кодами 0–255, потому что при наборе каждый символ кодируется одним байтом.

В двоичной системе десятичный диапазон 0–25510 кодов символов кодовой таблицы запишется в виде диапазона 00000000–111111112, в шестнадцатеричной – 00–FF16. При наборе на клавиатуре обычно пользуются кодами символов в десятичной системе.

При передаче русских текстов с компьютера на компьютер, особенно в Интернете, возникает проблема перекодировки кириллицы. Три русские кодировки win, koi8 и dos одновременно присутствуют на современных персональных компьютерах PC, распространенных в России. Эти кодировки существенно отличаются друг от друга расположением русских букв в соответствующих им кодовых таблицах.

Единицы измерения информации

Бит – минимальная единица количества информации, равная одному двоичному разряду.

Бит можно представить как выбор ответа «да» или «нет» на поставленный вопрос. Электронным представлением бита на компьютере является ситуация «есть сигнал/нет сигнала». В математических науках и информатике обычно «да» обозначается цифрой 1, «нет» – цифрой 0.

Одним битом можно закодировать два объекта.

Для пользователей компьютеров бит как единица информации слишком мала, поэтому при работе на компьютере используется другая более распространенная единица количества информации, производная от бита – байт.

Байт – наименьшая единица памяти компьютера, равная 8 битам, или 8-значному двоичному числу. 8 первый компьютерный инвариант, и 1 байт = 8 бит.

Одним байтом можно закодировать 256 объектов, приписав каждому из 256 объектов одно из 256 8-значных двоичных чисел. Запомните второй компьютерный инвариант 256 = 28.

Работая с информацией на современных компьютерах, следует знать следующие единицы, производные от байта, при составлении которых используется третий компьютерный инвариант 1024 = 210.

1 килобайт = 1 Кб = 1 К = 1024 байта; 1 мегабайт = 1 Мб = 1 М = 1024 Кб;

1 гигабайт = 1 Гб = 1 Г = 1024 Мб; 1 терабайт = 1 Тб = 1 Т = 1024 Гб.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]