21. Кодирование информации

Кодирование информации — это процесс формирования определенного представления информации. Кодирование — переход от одной формы представления информации к другой, более удобной для хранения, передачи и обработки. Компьютер может обрабатывать информацию, представленную только в числовой форме. Другая информация (видео, звук) должна быть преобразована в такую форму. При обработке текстовой информации каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран, монитор) для восприятия человеком по этим числам строится изображение букв. Соответствие между набором букв и числами называется кодировкой символов. Для этого используется двоичные системы исчисления. Преимущества двоичной системы: 1Для ее реализации используются технические элементы с двумя возможными состояниями (есть ток/ нет тока) 2 Представление информации посредством двух состояний надежны и помехоустойчивы 3 Для выполнения логических преобразований информации возможно применение булевой алгебры

Единицей измерения информации является бит. Для передачи и хранения информации применяют 8-битовые коды (байты), которые позволяют закодировать любой символ. Для работы с большими числами используют слова (16-битные коды) и двойные слова (32-битные коды). Соответствие между байтами и символами задается с помощью кодовой таблицы, которая для каждого кода указывает свой символ.

Для работы компьютера в алфавитно-цифровом режиме MS DOS начертания символов загружается в специальную область видео-адаптера, называемую таблицей знако-генератора. В системе, использующей графический режим видео-адаптера (Windows), каждый символ прорисовывается программным способом (по точкам), поэтому однозначное соответствие кода символа его внешнему виду нет. Так, например, в разных шрифтах один и тот же код будет иметь разный вид (разные символы).

Для того, чтобы текст, подготовленный на одном компьютере (на одной ОС), мог быть прочитан и обработан на другом компьютере или в другой системе, необходимо использование одной и той же кодовой таблицы. В противном случае необходима перекодировка документа. Для того, чтобы обеспечить одинаковый вид документа, необходимо на обоих компьютерах иметь один и тот же набор шрифтов.

22. Кодирование русского текста

В первых ЭВМ для кодирования текста было отведено 7 бит (128 символов). Этого количества вполне хватило для кодирования всех строчных и прописных букв латинского алфавита, 10 цифр и некоторых знаков. Такая кодированная таблица называется ASCII — американский стандартный код для обмена информацией. Когда появилась необходимость кодировать национальный алфавит, то этот код ASCII (ASC-код) был расширен до 8 бит. Т.о., в кодовой таблице символы располагались в следующем виде:

0-31 — служебные символы

32-128 — латинский алфавит

Остальные — национальный алфавит.

Такой ASC-код называли расширенным.

Основные кодировки для русских букв:

MS DOS (CP 866) используются в ОС MS DOS для IBM-совместимых компьютеров.

MS Windows (1251) — используются в ОС MS Windows

ISO 8859-5 данная кодировка используется в ОС UNIX. Принята международной организацией стандартизации и имеет 10 расширений кодовой таблицы. ISO 8859-5 поддерживает кириллический алфавит. Стандартизация данной кодировки является важнейшим моментом при разработке системы передачи, обработки и хранении информации. Поэтому данная кодировка получила широкое распространение в программных продуктах, в устройствах ввода и отображения информации крупных производителей программного обеспечения и вычислительной техники. Кроме того, кодировка широко используется в основных международных и индустриальных стандартах средств обработки и передачи информации.

Koi 8-R — (называется сетевая кодировка русских букв) получила распространение с развитием сетевых технологий. Часто происходило, что материал, отправленный по электронной почте, обрабатывался программой, которая работала 7-битной кодировкой. В этом случае происходило обнуление 8 бита. Поэтому необходимо было повысить устойчивость текстовой информации к такого рода преобразованиям. Для этого русские буквы расположили на местах фонетических аналогов английских букв. В таком случае, если программа обнуляла 8 бит, текст можно было прочитать.

Сегодня все большее число программ поддерживают стандарт Unicode. С помощью него можно закодировать практически все языки мира. Для кодировки информации отводится 2 байта (65 535 символов).

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 189 10 11 12 13 14 15 16 17 18 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.03.2016642.05 Кб152otchet_tsinkovanie.doc
#
23.04.2019178.13 Кб6OTChYeT_PO_TYeHNOLOGIYaM1.docx
#
01.05.20254.04 Mб1Otchyot_ASU-семейко - для слияния.docx
#
28.09.2019568.83 Кб19Otchyot_moy.doc
#
01.05.2025782.44 Кб0OTChYoT_Yulya.docx
#
01.05.2025276.48 Кб0OTI-shpory.doc
#
08.11.2019225.89 Кб1otvety_k_4-y_kontrolnoy.docx
#
01.03.20254.89 Mб1Otvety_k_ekzamenu_AIS.doc
#
30.08.201968.7 Кб1otvety_k_GOSu.docx
#
01.05.20252.36 Mб0Otvety_na_vse_voprosy_1.rtf
#
26.03.20155.61 Mб31P3кеп.docx