Добавил:

SVS sofyvits@ya.ru на позитиве Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский экономический институт

Предмет:

Программирование

Файл:

Экзамен инф и программ / информаматика-пособие.doc

Скачиваний:

295

Добавлен:

10.01.2016

Размер:

1.47 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 455 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Представление информации в эвм

Информация в ЭВМ кодируется в двоичной системе счисления.

Система счисления– это способ наименования и изображения чисел с помощью символов, имеющих определенные количественные значения.

В зависимости от способа изображения чисел системы счисления делятся на позиционные и непозиционные.

В позиционной системе счисления количественное значение каждой цифры зависит от ее места (позиции) в числе. В непозиционной системе счисления цифры не меняют своего количественного значения при изменении их расположения в числе.

Количество (Р) различных цифр, используемых для изображения числа в позиционной системе счисления, называется основанием системы счисления.

Значения цифр лежат в пределах от 0 до Р-1.В общем случае запись любого смешанного числа в системе счисления с основанием Р будет представлять собой ряд вида:

a_m-1P^m-1+ a_m-2P^m-2+ . . . + a₁P¹+ a₀P⁰+ a_-1P^-1+ a_-2P^-2 + . . . a_-sP^-s,

где нижние индексы определяют местоположение цифры в числе (разряд):

положительные значения индексов – для целой части числа (тразрядов);
отрицательные значения – для дробной (s разрядов).

Пример. Позиционная система счисления – арабская десятичная система, в которой: основание Р=10, для изображения чисел используются 10 цифр (от 0 до 9). Непозиционная система счисления – римская, в которой для каждого числа используется специфическое сочетание символов (XIV, CXXVII и т.п.).

Максимальное целое число, которое может быть представлено в т разрядах:

N_max= P^m-1.

Минимальное значащее (не равное 0) число, которое можно записать в s разрядах дробной части:

N_min= P^-s.

Имея в целой части числа т, а в дробной s разрядов, можно записать всего Р^m⁺^s разных чисел.

Двоичная система счисления имеет основание Р = 2 и использует для преставления информации всего две цифры: 0 и 1. Существуют правила перевода чисел из одной системы счисления в другую, основанные в том числе и на соотношении (1).

Пример.

101110,101₍₂₎= 1∙2⁵+0∙2⁴+1∙2³+1∙2²+1∙2¹+0∙2⁰+1∙2^-1+0∙2^-2+1∙2^-3= 46,625₍₁₀₎,

т.е. двоичное число 101110,101 равно десятичному числу 46,625.

Вся информация (данные) представлена в ЭВМ в виде двоичных кодов. Для удобства работы введены следующие термины, обозначающие совокупности двоичных разрядов (табл. 1.1). Эти термины обычно используются в качестве единиц измерения объемов информации, хранимой или обрабатываемой в ЭВМ.

Таблица 1.1. Двоичные совокупности

Количество двоичных

разрядов в группе

8*1024

8*1024²

8*1024³

8*1024⁴

Наименование единицы

измерения информации

Бит

Байт

Килобайт (Кбайт)

Мегабайт (Мбайт)

Гигабайт (Гбайт)

Терабайт (Тбайт)

Последовательность нескольких битов или байтов часто называют полем данных. Биты в числе (в слове, в поле и т.п.) нумеруются справа налево, начиная с 0-го разряда.

Для обработки на компьютере текстовой информации обычно при вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или принтер) для восприятия человеком по этим числам строятся соответствующие изображения букв. Соответствие между набором букв и числами называется кодировкой символов. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого достаточно, чтобы различными комбинациями восьми битов выразить все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы.

Технически это выглядит очень просто, однако всегда существовали достаточно веские организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а так же противоречий корпоративного характера.

При разработке IBM PC фирма IBM заложила в знакогенераторы видеоконтроллеров кодировку символов, разработанную Институтом стандартизации США (ANSI – American National Standard Institute). Производители принтеров и других устройств также стали следовать предложенной фирмой IBM кодировке, так что она стала фактическим стандартом, получив название таблицы ASCII (American Standard Code for Information Interchange – Американский стандартный код для обмена информацией). В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255. Базовая таблица является международной и используется для кодирования управляющих символов, цифр и букв латинского алфавита; в расширении стандарта кодируются символы псевдографики и буквы национального алфавита (естественно, в разных странах разные).

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем как производиться вывод прочих данных.

Начиная с кода 32 по 127 размещены коды символов английского алфавита, знаков препинания, арифметических действий и некоторых вспомогательных символов.

Аналогичные системы кодирования текстовых данных были разработаны в других странах. Так, например. в СССР в этой области действовала система кодирования КОИ-7 (код обмена информации семизначный). Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось "отступить" во вторую, расширенную часть системы кодирования. определяющую значения кодов со 128 по 255. Отсутствие единого стандарта в этой области привело к существованию множества одновременно действующих кодировок.

Так фирма Microsoft разработала для Windows новую кодовую таблицу, получившую название ANSI-кодировка. В русской версии Windows используется модифицированная «русская» версия ANSI-таблицы, известная как кодировка Windows-1251. Учитывая широкое распространение операционных систем и других программ компании Microsoft в России, кодировка Windows-1251 глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows.

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией восьмизначный) – ее происхождение относится ко временам действия Совета Экономической взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.

Международный стандарт в котором предусмотрена кодировка символов русского алфавита, носит название кодировки ISO (International Standard Organization – Международный институт стандартизации). На практике данная кодировка используется редко.

На компьютерах, работающих в операционных системах MS-DOS, могут действовать еще две кодировки (кодировка ГОСТ и кодировка ГОСТ-альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники, но вторая используется и по сей день.

В связи с изобилием систем кодирования текстовых данных, действующих в России, возникает задача международного преобразования данных – это одна из распространенных задач информатики.

Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время очевидно. что если кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система основанная на 16-разрядном кодировании символов, получила название универсальной – UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов – этого поля достаточно для размещения в одной таблице символов большинства языков планеты.

Несмотря на очевидность такого подхода. простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники ( в системе кодирования UNICODE все текстовые документы становятся вдвое длиннее). Во второй половине 90-х годов технические средства достигли необходимого уровня обеспечения ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования.

<<< < Предыдущая 1 2 3 45 / 455 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке Экзамен инф и программ

#
10.01.20161.47 Mб295информаматика-пособие.doc
#
10.01.20163.74 Mб1471Тесты по информатике с пояснениями.doc
#
10.01.2016256.51 Кб125экзамен ИиПр 2011-2012 ос сем.doc
#
10.01.2016129.02 Кб142Экзамен Информатика и программирование 2010-11(вопросы и задачи).doc