Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTI-shpory.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
276.48 Кб
Скачать

21. Кодирование информации

Кодирование информации — это процесс формирования определенного представления информации. Кодирование — переход от одной формы представления информации к другой, более удобной для хранения, передачи и обработки. Компьютер может обрабатывать информацию, представленную только в числовой форме. Другая информация (видео, звук) должна быть преобразована в такую форму. При обработке текстовой информации каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран, монитор) для восприятия человеком по этим числам строится изображение букв. Соответствие между набором букв и числами называется кодировкой символов. Для этого используется двоичные системы исчисления. Преимущества двоичной системы: 1Для ее реализации используются технические элементы с двумя возможными состояниями (есть ток/ нет тока) 2 Представление информации посредством двух состояний надежны и помехоустойчивы 3 Для выполнения логических преобразований информации возможно применение булевой алгебры

Единицей измерения информации является бит. Для передачи и хранения информации применяют 8-битовые коды (байты), которые позволяют закодировать любой символ. Для работы с большими числами используют слова (16-битные коды) и двойные слова (32-битные коды). Соответствие между байтами и символами задается с помощью кодовой таблицы, которая для каждого кода указывает свой символ.

Для работы компьютера в алфавитно-цифровом режиме MS DOS начертания символов загружается в специальную область видео-адаптера, называемую таблицей знако-генератора. В системе, использующей графический режим видео-адаптера (Windows), каждый символ прорисовывается программным способом (по точкам), поэтому однозначное соответствие кода символа его внешнему виду нет. Так, например, в разных шрифтах один и тот же код будет иметь разный вид (разные символы).

Для того, чтобы текст, подготовленный на одном компьютере (на одной ОС), мог быть прочитан и обработан на другом компьютере или в другой системе, необходимо использование одной и той же кодовой таблицы. В противном случае необходима перекодировка документа. Для того, чтобы обеспечить одинаковый вид документа, необходимо на обоих компьютерах иметь один и тот же набор шрифтов.

22. Кодирование русского текста

В первых ЭВМ для кодирования текста было отведено 7 бит (128 символов). Этого количества вполне хватило для кодирования всех строчных и прописных букв латинского алфавита, 10 цифр и некоторых знаков. Такая кодированная таблица называется ASCII — американский стандартный код для обмена информацией. Когда появилась необходимость кодировать национальный алфавит, то этот код ASCII (ASC-код) был расширен до 8 бит. Т.о., в кодовой таблице символы располагались в следующем виде:

0-31 — служебные символы

32-128 — латинский алфавит

Остальные — национальный алфавит.

Такой ASC-код называли расширенным.

Основные кодировки для русских букв:

MS DOS (CP 866) используются в ОС MS DOS для IBM-совместимых компьютеров.

MS Windows (1251) — используются в ОС MS Windows

ISO 8859-5 данная кодировка используется в ОС UNIX. Принята международной организацией стандартизации и имеет 10 расширений кодовой таблицы. ISO 8859-5 поддерживает кириллический алфавит. Стандартизация данной кодировки является важнейшим моментом при разработке системы передачи, обработки и хранении информации. Поэтому данная кодировка получила широкое распространение в программных продуктах, в устройствах ввода и отображения информации крупных производителей программного обеспечения и вычислительной техники. Кроме того, кодировка широко используется в основных международных и индустриальных стандартах средств обработки и передачи информации.

Koi 8-R — (называется сетевая кодировка русских букв) получила распространение с развитием сетевых технологий. Часто происходило, что материал, отправленный по электронной почте, обрабатывался программой, которая работала 7-битной кодировкой. В этом случае происходило обнуление 8 бита. Поэтому необходимо было повысить устойчивость текстовой информации к такого рода преобразованиям. Для этого русские буквы расположили на местах фонетических аналогов английских букв. В таком случае, если программа обнуляла 8 бит, текст можно было прочитать.

Сегодня все большее число программ поддерживают стандарт Unicode. С помощью него можно закодировать практически все языки мира. Для кодировки информации отводится 2 байта (65 535 символов).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]