Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
10-(2003)-информатика для бакалавров .doc
Скачиваний:
6
Добавлен:
04.05.2019
Размер:
1.36 Mб
Скачать

Представление информации

Для обмена информацией между людьми используются естественные языки (русский, английский, китайский…). Наряду с естественными языками были разработаны формальные языки (системы счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии очень строгих правил грамматики и синтаксиса.

Язык – это множество символов и совокупность правил, опре­деляющих способы составления из этих символов осмысленных сообщений.

Сообщение на любом языке состоит из последовательности символов – букв, цифр, знаков. Знаки или символы любой природы, из которых конструируются информационные сообщения, назы­вают кодами. Полный набор кодов составляет алфавит кодирова­ния.

Любое информационное сообщение можно представить, не меняя его содержания, символами того или иного алфавита или, го­воря иначе, получить ту или иную форму представления1.

Кодирование информации – это процесс формирования опре­деленного представления информации. При кодировании информа­ция представляется в виде дискретных данных. Декодирование яв­ляется обратным к кодированию процессом. Способ кодирования зависит от цели, ради которой оно осуществляется. Это может быть сокращение записи, засекречивание информации, или, напротив, достижение взаимопонимания2. От того, как представлена информация, зависит способ ее обработки, хранения и передачи.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (на­пример, звуки, изображения, показания приборов и т. д.) для обра­ботки на компьютере должна быть в неё преобразована.

Простейшим алфавитом, достаточным для записи информации о чем-либо, является алфавит из двух символов (двоичная система счисления). Именно в ней обычно работают компьютеры. Это свя­зано с тем, что информацию, представленную в таком виде, легко смоделировать технически. Оперативная память состоит из очень большого числа триггеров (электронных схем, состоящих из двух транзисторов). Триггер может сколь угодно долго находиться в од­ном из двух состояний: когда один транзистор открыт, а другой за­крыт, или наоборот. Одно состояние обозначается нулем, а другое – единицей.

Компьютерное кодирование чисел

Целые числа

  1. Представление в беззнаковых целых типах (только для положительных целых чисел)

При таком представлении в k-разрядной ячейке может храниться 2k различных значений положительных целых чисел1.

Чтобы получить внутреннее представление целого положительного числа N, хранящегося в k-разрядном машинном слове, необходимо:

1) перевести число N в двоичную систему счисления;

2) полученный результат дополнить слева нулями до k разрядов.

Пример. Пусть k=8 (8 бит= 1 байт)

13(10) = 1101(2) = 00001101(2) – представление числа 13 в ячейке в 1 байт.

  1. Представление в знаковых целых типах (старший разряд – знак числа)

2а) прямой код. Положительные числа записываются так же, как в беззнаковых типах, отрицательные числа получают 1 в старшем разряде, остальные разряды демонстрируют модуль числа.

13(10)  00001101 -13(10)  10001101

Однако в ЭВМ такой код не используется.

2б) дополнительный код (именно он используется в ЭВМ). Положительные числа записываются так же, а отрицательные – иначе.

Для записи внутреннего представления целого отрицательного числа N необходимо:

1) получить внутреннее представление положительного числа |N|;

2) инвертировать код (заменить все 0 на 1, а 1 на 0);

3) к полученному числу прибавить 1.

Пример. Пусть количество разрядов k=8, заданное число x=-13. Ищем y - представление числа x.

  1. 13(10) 00001101(2) (перевели модуль числа в двоичную систему);

  2. 00001101 11110010 (инвертировали);

  3. y = 11110010+1=11110011 (добавили 1).

Обратное преобразование: x=2k-y, где x – число в десятичной системе, y – его представление, k – число разрядов.

Пример (продолжение). Если y=11110011, k=8, то

x = 28 – (27+26+25+24+0+0+21+20) = 256-(128+64+32+16+2+1)=256-243=13

Вещественные числа

Для вещественных чисел принят способ представления с пла­вающей точкой. Этот формат использует представление вещест­венного числа R в виде произведения мантиссы m на основание системы счисления p в некоторой целой степени n которую назы­вают порядком: R=m*pn. Однако это представление не однозначно1. Поэтому используется нормализованное представление, в котором мантисса меньше 1 и первая значащая цифра – не 0. Правда, если само число – это 0, то R=0,0. В памяти компьютера мантисса пред­ставляется как целое число, содержащее только значащие цифры (0 целых и запятая не хранятся). Следовательно, внутреннее пред­ставление вещественного числа сводиться к представлению пары целых чисел: мантиссы и порядка. Старший разряд отводится под знак числа, а вот знак порядка не хранится, используется так назы­ваемый смещенный (или машинный) порядок.

Число в памяти компьютера может располагаться так, как показано на рис. 1. Представление числа зависит от размеров отводимой под его запись ячейки. В 4-байтовой ячейке (рис. 1) под порядок отводится 7 битов, а в 8-байтовом представлении, например, – 11 битов.

В семи двоичных разрядах помещаются двоичные числа в диапазоне от 0 до 127. Порядок может быть положительным и от­рицательным: от -64 до 63. Машинный порядок смещен относи­тельно математического и имеет только положительные значения. Смещение выбирается так, чтобы минимальному математическому значению порядка соответствовал нуль. Связь между машинным порядком (МП) и математическим (П) в общем случае выражается формулой: МП = П + 2а-1, где МП – машинный порядок, П – мате­матический, а – количество разрядов, отводимых под порядок (в рассматриваемом случае а=7).

Пример. Найти представление числа -25,625 в 4-байтовой ячейке.

1. Приведем число в двоичную систему счисления с 24 значащими цифрами: -25,625(10) = - 11001,1010000000000000000(2)

2. Запишем в форме нормализованного двоичного числа

- 0,110011010000000000000000*25

3. Найдем МП = 5+ 2а-1 = 5+26 = 69(10) = 1000101(2)

4. Запишем представление числа с учётом его знака (рис. 1).

Представление текстовой информации в ЭВМ

При вводе в компьютер текста каждая буква кодируется опре­деленным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изо­бражения букв. Соответствие между набором букв и числами назы­вается кодировкой символов. Для кодирования одного символа в ЭВМ используется 1 байт (8 бит), что позволяет закодировать 256 различных символов. Стандартный набор из 256 символов называ­ется ASCII (American Standard Code for Information Interchange) – Американский Стандартный Код для Обмена Информацией. Набор ASCII был разработан в США Американским Национальным Ин­ститутом Стандартов (ANSI). Но он используется и в других стра­нах, поскольку половина из 256 стандартных символов(128) могут быть с помощью специальных программ заменены на символы на­ционального алфавита1. «Русский» ASCII включает в себя большие и маленькие латинские и русские буквы, а также всякие знаки – знаки препинания, арифметических действий и т.п. Каждому сим­волу ASCII соответствует 8-битовый двоичный код – целое число. Поэтому практически все программы «умеют» сравнивать сим­волы: чем больше код, тем «больше» символ.

Представление графической информации в ЭВМ

Как и любая другая информация в ЭВМ, графические изобра­жения хранятся, обрабатываются и передаются в закодированном виде, т.е. в виде нулей и единиц. Существует множество разно­об­разных программ, работающих с графическими изображениями, в которых используются самые разные графические форматы (спо­собы кодирования). Расширения имен файлов указывают на ис­пользуемый формат и, соответственно, какими программами можно обрабатывать данное изображение. Однако существует только два принципиально разных подхода к тому, каким образом можно оцифровать изображение: растровая и векторная графика.

При использовании растровой графики изображение верти­кальными и горизонтальными линиями делится на элементы (точки, клетки) – пиксели (pixel, от англ. picture element). Чем больше пикселей в изображении, тем оно качественнее. В памяти компьютера хранится информация о цвете каждого пикселя. Под каждый пиксель отводится определенное число бит, называемое битовой глубиной. Каждому цвету соответствует определенный двоичный код (т.е. код из нулей и единиц). Например, если битовая глубина равна 1, т.е. под каждый пиксель отводится 1 бит, то 0 со­ответствует черному цвету, 1 – белому, а изображение может быть только черно-белым. Если говорить о цветных изображениях, то одним из способов представления цвета является так называемое RGB-представление. Физика утверждает, что любой цвет может быть представлен в виде суммы различной яркости красного (Red), зеленого (Green) и синего (Blue) цветов. Поэтому надо закодиро­вать информацию о яркости каждого из трех цветов для отображе­ния каждого пикселя.

Итак, растровые изображения представляют собой однослой­ную сетку пикселей, а код пикселя содержит информацию о его цвете. Основным недостатком растровой графики является большой объем памяти, необходимый для хранения изображения.

При использовании векторной графики в памяти ЭВМ со­храняется математическое описание каждого графического прими­тива (отрезка, прямоугольника, окружности и т.д.), из которых формируется изображение. Сложные объекты (ломаные линии, различные геометрические фигуры) представляются в виде сово­купности примитивов. Такое представление требует значительно меньше памяти1. Кроме того, объекты векторного изображения, в отличие от растровой графики, могут изменять свои размеры без потери качества (при увеличении растрового изображения увели­чивается зернистость). Однако векторная графика не позволяет ра­ботать с высокохудожественными изображениями. Поэтому основ­ной сферой её применения являются чертежи, схемы и т.п.

Представление звуковой информации

З вук – это колебания воздуха. В электронных устройствах звук преобразуется в аналоговый электрический сигнал – плавно меняющееся напряжение или ток. Для записи сигнала в компьютер необходима его дискретизация по уровню и по времени. Эту функ­цию выполняют специальные электронные устройства – аналогово-цифровые преобра­зователи (АЦП). Через каждый короткий промежуток времени уровень сигнала регистриру­ется в виде двоичного числа, и звуковой сигнал превращается в поток двоичных чисел (рис. 2). Обычно глубина кодирова­ния (дискретизация по уровню) составляет 16 бит (65536 уровней), а частота дискретизации 24000 раз в се­кунду. Наиболее распростра­ненный формат со сжатием – MP3.

Чтобы воспроизвести закодированный звук нужно сделать об­ратное преобразование (для этого служит ЦАП – цифро-аналого­вый преобразователь), а затем сгладить получившийся ступенчатый сигнал.

Представление видео

Видео представляет собой поток последовательно сменяющихся кадров изображений. Следовательно, представление видео в ЭВМ сводится к представлению потока графической информации. Телевизионный формат воспроизведения видео использует разрешение кадра 720*576 точек с 24 битовой глубиной цвета. Скорость воспроизведения составляет 25 кадров в секунду. Объем передаваемой при этом информации составляет: приблизительно 30 Мбайт/с. Это очень большой поток данных, поэтому при хранении и передаче видео используют разные методы сжатия (MPEG, AVI).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]