Лекция 4-5. Кодирование информации в компьютере

Кодирование информации - это процесс формирования определенного представления информации.

В более узком смысле под термином "кодирование" часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1). Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком.

Кодирование текстовой информации

В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др.

Традиционно, для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):

К = 2^I = 2⁸ = 256,

т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.

Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255 (часто код представляют также в 16-ричном виде 00-FF) .

Соответствие между символом и его кодом, вообще говоря, может быть выбрано совершенно произвольно. Однако на практике необходимо иметь возможность прочесть на одном компьютере текст, созданный на другом. Поэтому таблицы кодировок стараются стандартизовать. Практически все использующиеся сейчас таблицы основаны на коде ASCII (American Standard Code for Information Interchange). Этот стандарт определяет значения для нижней половины кодовой таблицы - первых 127 кодов (32 управляющих кода, основные знаки препинания и арифметические символы, цифры и латинские буквы). В результате, эти символы отображаются верно, какая бы кодировка не использовалась на конкретном компьютере. Хуже обстоит дело с "национальными" символами и "типографскими" знаками. А особенно не повезло языкам, использующим кириллический алфавит (русскому, украинскому, белорусскому, болгарскому и т.д.). Например, для русского языка сейчас широко используются пять таблиц кодировок:

CP1251 (Windows-кодировка) - на PC-совместимых при работе под Windows 3.1 и Windows 9x
KOI-8r - самая старая из использующихся до сих пор кодировок. Применяется на компьютерах, работающих под UNIX, является фактическим стандартом для русских текстов в сети Internet.
CP866 (DOS-альтернативная) - на PC-совместимых компьютерах при работе с операционными системами DOS и OS/2, а также в любительской международной сети Фидо (Fidonet).
Macintosh Cyrillic - как видно из названия, предназначена для работы со всеми кириллическими языками на Макинтошах (кроме украинского).
ISO-8859 - эта кодировка задумывалась как международный стандарт для кириллических текстов, однако на территории России практически не применяется.

Впрочем, в большинстве случаев о перекодировке текстовых документов заботится не пользователь, а специальные программы - конверторы, которые встроены в приложения.

Начиная с 1997 г. последние версии Microsoft Windows & Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а поэтому, можно закодировать не 256 символов, а 65536 различных символов.

<<< < Предыдущая 1 2 3 4 56 / 416 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.05.201951.4 Кб0индивидуалка.docx
#
20.09.20192.81 Mб1Индивидуальная работа.docx
#
20.09.201966.4 Кб4ИНДИВИДУАЛЬНОЕ ЗАДАНИЕ.docx
#
21.09.2019319.49 Кб18Индивидуальные задания модуля 3.doc
#
19.11.2019806.68 Кб1ИНФОРМАТИКА БИЛЕТЫ.docx
#
17.04.20191.15 Mб13Информатика Конспект лекций.doc
#
26.03.20161.27 Mб51Информатика ЛР № 4 OO Impress .pdf
#
26.03.20163.59 Mб160Информатика ЛР № 5 MS Visio.pdf
#
08.08.2019142.2 Кб6Информатика.ответы на ЭКЗАМЕН.docx
#
07.07.20191.31 Mб4Информация_метода.doc
#
21.11.2019166.56 Кб3искусств.rtf