Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
informatika_ump_rus.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
3.03 Mб
Скачать

Контрольные вопросы

  1. Как Вы понимаете понятие информации и какое определение можно дать?

  2. Как называется форма представления информации?

  3. Какие существуют подходы к определению количества информации и кто их открыл?

  4. Чем отличается байт от бита?

  5. Более крупные единицы измерения информации и как они определяются?

  6. Сколько различных информации можно написать одним байтом и обоснуйте почему?

  7. В чем состоит процедура дискретизации непрерывной информации?

  8. Что такое кодирование?

  9. Какая форма представления информации - непрерывная или дискретная приемлема для компьютеров и почему?

  10. В чем отличие позиционной системы счисления от непозиционной?

Литература: Основная [1-5], дополнительная [1,2]

Лекция №4. Тема: Представление информации в компьютере

Цель: Показать как информация представляется в компьютере.

Ключевые понятия: Кодирование, декодирование, форма с фиксированной запятой, форма с плавающей запятой, прямой код, обратный код, дополнительный код.

Формирование представления информации называется ее кодированием. В более узком смысле под кодированием понимается переход от исходного представления информации, (удобного для восприятия человеком, к представлению, удобного для хранения, передачи и обработки. В этом случае обратный переход называется декодированием.

Информация в памяти ЭВМ записывается в форме цифрового двоичного кода.

Представление чисел в ЭВМ

В ЭВМ применяются две формы представления чисел:

  • естественная форма, или форма с фиксированной запятой (точкой) — ФЗ (ФТ);

  • нормальная форма, или форма с плавающей запятой (точкой) - ПЗ (ПТ).

Алгебраическое представление двоичных чисел

Знак числа обычно кодируется двоичной цифрой, при этом:

код 0 означает знак + (плюс);

код 1 — знак - (минус).

Для алгебраического представления чисел, т. е. для представления чисел с учетом их знака, в вычислительных машинах используются специальные коды:

  • прямой код числа;

  • обратный код;

  • дополнительный код.

При этом два последних кода позволяют заменить неудобную для компьютера операцию вычитания на операцию сложения с отрицательным числом. Дополнительный код обеспечивает более быстрое выполнение операций, поэтому в компьютере чаще всего применяется именно он.

Представление текстовой информации

При вводе документов, текстов программ и другой информации вводимые символы (буквы, цифры, знаки) кодируются определенными комбинациями из восьми нулей и единиц и наоборот — при выводе их для чтения человеком (на монитор или принтер) по коду символа строится изображение символа.

При двоичном кодировании текстовой информации каждому символу назначается код — последовательность из фиксированного количества нулей и единиц со взаимно однозначным соответствием. Используя 1 двоичную цифру (один бит) можно закодировать всего 2 символа. Двухбитовых комбинаций может быть 4: 00; 01, 10, 11, т. е. 22, с помощью трех битов можно получить восемь различных сочетаний нулей и единиц (23). Аналогичным образом можно подсчитать, что число битов, необходимое для кодирования 32 различных символов, равно 5 (25). Этот код использовался в работе телеграфа в 20-е годы прошлого столетия, вместо знаков препинания ставились ТЧК и ЗПТ. Используя 7 битов, можно закодировать 128 символов (двоичный семибитовый код обмена информацией КОИ-7), а с помощью 24 битов — 16777216 различных символов или состояний.

Оптимальное количество символов, которые используются при наборе различных текстов, равно примерно 200 (буквы латинские и русские, заглавные и строчные, знаки препинания, цифры, математические знаки, элементы псевдографики). В двоичной системе такое количество символов может быть закодировано последовательностью из 8 бит (28 = 256), т.е. 1 байтом.

Кодировка IBM (ASCII коды American Standard Coding for Information Interchange) состоит из двух частей: нижняя является общепринятой во всем мире (десятичные коды 0-127).

Фрагмент кодировки ASCII:

Код двоичный Символ Десятичный код

0010 0000 пробел 32

00101011 + 43

00110000 1 49

00110000 0 48

О11 1001 9 57

00111010 двоеточие: 58

Первые 32 кода зарезервированы для различных управляющих символов, таких как возврат каретки, табуляция, отмена операции и т.п. Вторая — «верхняя половина» представляет собой расширенные ASCII коды, в ней находятся национальные алфавиты и специальные символы. В России вторая половина подчиняется 4 разным стандартам: КОИ-8 (Код обмена информацией восьмизначный. или кодовая страница 866, полученная путем замены греческих букв и некоторых элементов псевдографики из таблиц ASCII кодов на буквы русского алфавита), кодировка WINDOWS 1251, ISO, модифицированная альтернативная кодировка ГОСТ. В последней прописные буквы от А до Я имеют десятичные коды 128 — 159, строчные буквы от а до п имеют десятичные коды 160 — 175, от р до я имеют коды 224 — 241.

Помимо восьмиразрядной системы кодирования символьной (текстовой) информации разработана система шестнадцатиразрядного кодирования символов, которая получила название универсальной, UNICODE. Такая система позволяет закодировать 216 = 65536 различных символов, в том числе практически все алфавиты языков нашей планеты.

Расчет объема текстовой информации сводится к вычислению произведения количества символов в тексте на число разрядов двоичного кода, необходимого для кодирования одного символа.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]