Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Otvety_po_oit.rtf
Скачиваний:
174
Добавлен:
11.02.2015
Размер:
1.04 Mб
Скачать

2. Представление числовой и текстовой информации

Система счисления - способ записи чисел с помощью специальных знаков (цифр).

Классификация систем счисления

Позиционные

Вес каждой цифры изменяется в зависимости от ее положения (позиции) в последовательности цифр, изображающих число. Например, в числе 757,7 первая семерка означает 7 сотен, вторая – 7 единиц, а третья – 7 десятых долей единицы.

Сама же запись числа 757,7 означает сокращенную запись выражения:

700+50+7+0,7==7*102+5*101+7*100+7*10-1=757,7

Значение каждой цифры зависит от ее положения (позиции) в числе.

Непозиционные

В непозиционных системах вес цифры (т.е. вклад, который она вносит в значение числа) не зависит от ее позиции в записи числа.

Так в римской СС в числе XXXII (32) вес цифры X в любой позиции равен просто десяти.

Значение цифры не зависит от места (позиции) в числе.

Виды:

  • двоичная система счисления (все числа представлены с помощью только двух цифр: 0 и 1).

  • восьмиричная система счисления (цифры 0, 1,...7)

  • шестнадцатеричная (кроме привычных 0,…9 в качестве цифр используются буквы A,B,C,D,E,F)

  • Ввод и вывод числовой информации осуществляется в удобной человеку десятеричной системе счисления

Число и цифра различаются по значению и происхождению.

Число — единица счёта, выражающая количество (один дом, два дома, три дома и т.д.).

Цифра — знак (символ), обозначающий значение числа.

Системы счисления в компьютере

В компьютере чаще всего используется двоичная система счисления (все числа представлены с помощью только двух цифр: 0 и 1).

Один двоичный разряд (0 или 1) принят за единицу информации бит.

Восемь бит составляют один байт.

Для решения ряда задач используются восьмиричная система счисления (цифры 0, 1,...7) и шестнадцатеричная (кроме привычных 0,…9 в качестве цифр используются буквы A,B,C,D,E,F).

Ввод и вывод числовой информации осуществляется в удобной человеку десятеричной системе счисления, а их преобразование производит компьютер под управлением программ по специальному алгоритму.

Алгоритм преобразования:

При переводе десятичного числа в систему с основанием q (q = 2,8,16) его необходимо последовательно делить на q до тех пор, пока не останется остаток, меньший или равный q-1.

Число с основанием q записывается как последовательность остатков от деления, записанных в обратном порядке, начиная с последнего.

Для перевода чисел из одной системы счисления в другую удобно использовать стандартную программу Калькулятор (Вид: Программист).

Запуск: Программы/Стандартные/Калькулятор.

Hex - шестнадцатеричная система счисления

Dec - десятеричная система счисления

Oct - восьмеричная система счисления

Bin - двоичная система счисления

Текст в компьютере

Компьютер обрабатывает информацию представленную в числовой форме.

Для представления текста его символы кодируются двоичными числами.

При вводе в ПК каждая буква кодируется, а при выводе (на экран или печать) по этим числам строятся изображения букв.

Кодировка символов - однозначное соответствие между набором букв и набором чисел.

Таблица символов ASCII

Первоначально для представления печатных символов определили семиразрядные числа (состоящие из 7 двоичных цифр и занимающие в памяти 7 бит). Это давало 128 (два в седьмой степени = 128) чисел для кодирования символов американского английского: 27 строчных букв, 27 прописных, 10 цифр, знаки пунктуации и т.д.) Именно такой, 7-битной, является таблица символов ASCII (American standard code for information interchange).

Символы ASCII являются материалом для ASCII art.

Восьмибитные кодировки

В современных компьютерах минимально адресуемая единица памяти — 8-битный байт, поэтому там используются 8-битные кодировки символов.

8-битная ASCII позволяет закодировать 256 символов (два в восьмой степени). Каждый символ кодируется 8 битами (8-разрядным двоичным числом).

Windows 1251 - 8-битная кодировка для операционных систем MS Windows.

Другие 8-разрядные кодировки: LATIN-1 (OEM), ISO 8859-5, КОИ-8.

Было создано множество разных 8-битных кодировок в связи с расширением круга поддерживаемых языков. Возникли проблемы отображения документов в неправильной кодировке, ограниченности набора символов, преобразования одной кодировки в другую, дублирования шрифтов.

Было решено создать единую 16-битную кодировку для всех языков.

ЮНИКОД

UNICODE (UNIversal CODE) - стандарт 16-разрядного кодирования символов. В 16-разрядном UNICODE можно закодировать 65 536 символов.

Стандарт UNICODE предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (Unicode® Consortium, Unicode Inc.), объединяющей крупнейшие IT-корпорации.

UNICODE включает практически все современные письменности, в том числе:

  • арабскую,

  • армянскую,

  • бенгальскую,

  • бирманскую,

  • греческую,

  • грузинскую,

  • деванагари,

  • иврит,

  • кириллицу,

  • коптскую,и др

С академическими целями в UNICODE добавлены многие исторические письменности, в том числе:

  • руны,

  • древнегреческая,

  • египетские иероглифы,

  • клинопись,

  • письменность майя,

  • этрусский алфавит.

В UNICODE представлен широкий набор пиктограмм, математических и музыкальных символов.

Стандарт UNICODE состоит из универсального набора символов (UCS, Universal Character Set) и семейства кодировок (UTF, Unicode Transformation Format): UTF-8, UTF-16 и UTF-32.

UTF-8 — обеспечивает наилучшую совместимость со старыми с8-битными кодировками.

UTF-8 изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком.

Ограничения UNICODE:

пока не реализовано изображение «длинных» надстрочных символов, простирающихся над несколькими буквами для церковнославянского языка.

многие символы из языков с алфавитами на основе кириллицы не имеют монолитных форм, другие могут быть представлены набором базового символа с последующим диакритическим знаком.

не предусмотрено традиционное написание сверху вниз для китайского, корейского и японского языков

китайские иероглифы с разными начертаниями в китайском, японском (кандзи) и корейском (ханчча) письме обозначаются одним и тем же символом.

29.01.2010 По данным Google доля кодировки Unicode в интернет-документах приблизилась к 50%.

Unicode обогнал все другие кодировки в мае 2008 года. Тогда его доля составляла около 25%, как и доли ASCII- и западноевропейской кодировок. В 2001 году доля ASCII-кодировки составляла около 55%. Сейчас она снизилась до 20%. Доли других популярных национальных кодировок, в том числе и распространенной в России CP-1251 не превышают 5-10%.

Понятие текста

В семиотике: ТЕКСТ (от лат. textus - ткань, соединение) - объединенная смысловой связью последовательность знаковых единиц любой формы коммуникаций (письмо, песня, танец, рисунок, обряд).

В языкознании: ТЕКСТ - объединенная смысловой связью последовательность вербальных единиц (устный и письменный).

В информатике: ТЕКСТ - форма представления данных в виде последовательности символов (букв, знаков пунктуации, специальных символов) выбранного языка, содержательно рассматриваемой как единое целое.

Электронный текст - это текст, записанный в памяти компьютерной системы. На диски записываются документы, книги, журналы, справочники, словари... .

Гипертекст (hypertext) - текст, представленный в виде ассоциативно связанных блоков, переход между которыми осуществляется с помощью гиперссылок.

Гипертекст может быть расположен в различных частях компьютерной сети. Тогда взаимодействие компонентов определяется протоколом (соглашением). В сети Internet это гипертекстовый протокол передачи. HTTP (HyperText Transfer Protocol) - описывающий процедуры обмена блоками гипертекста. Создание гипертекстов осуществляется с помощью гипертекстового языка разметки документов. (HyperText Markup Language, HTML). Главной задачей HTML является осуществление пользователями гипертекстовой разметки обычных текстов .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]