Добавил:
Rumpelstilzchen2018@yandex.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3-й семестр / Организация ЭВМиС; Орлов С.А., Цилькер Б.Я

..pdf
Скачиваний:
422
Добавлен:
25.12.2020
Размер:
5.43 Mб
Скачать

Типы и форматы операндов

71

 

 

Рис. 2.15. Форматы десятичных чисел: а — упакованный; б — зонный

Наиболее распространен упакованный формат (рис. 2.15, а), позволяющий не только хранить десятичные числа, но и производить над ними арифметические операции. В данном формате запись числа имеет вид цепочки байтов, где каждый байт содержит коды двух десятичных цифр. Правая тетрада младшего байта предназначается для записи знака числа. Десятичное число должно занимать целое количество байтов. Если это условие не выполняется, то четыре старших двоичных разряда левого байта заполняются нулями. Так, представление числа –7396 в упакованном формате имеет вид, приведенный на рис 2.16.

Рис. 2.16. Представление числа –7396 в упакованном формате

Зонный формат (рис. 2.15, б) распространен, главным образом, в больших универсальных ВМ семейства IBM 360/370/390. В нем под каждую цифру выделяется один байт, где младшие четыре разряда отводятся под код цифры, а в старшую тетраду (поле зоны) записывается специальный код «зона», не совпадающий с кодами цифр и знаков. В IBM 360/370/390 это код 11112 = F16. Исключение составляет байт, содержащий младшую цифру десятичного числа, где в поле зоны хранится знак числа. На рис. 2.17 показана запись числа –7396 в зонном формате. В некоторых ВМ принят вариант зонного формата, где поле зоны заполняется нулями.

Рис. 2.17. Представление числа –7396 в зонном формате

Размещение знака в младшем байте, как в зонном, так и в упакованном представлениях, позволяет задавать десятичные числа произвольной длины и передавать их в виде цепочки байтов. В этом случае знак указывает, что байт, в котором он содержится, является последним байтом данного числа, а следующий байт последовательности — это старший байт очередного числа.

Рассмотренный вариант двоично-кодированного представления десятичных цифр с весами 8421 наиболее распространен, но не является единственным. Возможные иные схемы кодирования приведены в табл. 2.5.

72

 

 

Глава 2. Архитектура системы команд

 

 

 

 

 

 

Таблица 2.5. Варианты двоично-кодированного представления десятичных цифр

 

 

 

 

 

 

Цифра

BCD 8 4 2 1

Excess-3

BCD 2 4 2 1

BCD 8 4 -2 -1

BCD 8 4 2 1

 

 

(код Стибица)

(код Айкена)

 

(IBM 702, 705)

0

0000

0011

0000

0000

1010

1

0001

0100

0001

0111

0001

2

0010

0101

0010

0110

0010

3

0011

0110

0011

0101

0011

4

0100

0111

0100

0100

0100

5

0101

1000

1011

1011

1011

6

0110

1001

1100

1010

0110

7

0111

1010

1101

1001

0111

8

1000

1011

1110

1000

1000

9

1001

1100

1111

1111

1001

Использование 4-х двоичных цифр для представления одной десятичной цифры по своей сути избыточно. В то же время при иной системе кодирования для представления десятичного числа из трех цифр достаточно 10 двоичных разрядов. Два наиболее известных варианта такого «экономичного» кодирования — код ЧенХо (Tien Chi Chen, Irving T. Ho) и плотно упакованный десятичный код (DPD — Densely Packed Decimal).

В обоих вариантах каждая десятичная цифра классифицируется по значению старшего бита в ее представлении в коде BCD на «маленькую» 0–7 (00002–01112) или «большую» 8–9 (10002–10012). Для идентификации маленькой цифры (М) достаточно 3 бита, а большой (Б) — одного бита.

При таком представлении возможны следующие комбинации из трех десятичных цифр:

М + М + М (требуется 9 битов для цифр и остается 1 бит для идентификации этой комбинации);

М + М + Б, или М + Б + М, или Б + М + М (требуется 7 битов для цифр и остается 3 бита для идентификации этих комбинаций);

М + Б + Б, или Б + М + Б, или Б + Б + М (требуется 5 битов для цифр и остается 5 битов для идентификации этих комбинаций);

Б + Б + Б (3 бита для цифр и 7 битов для индикации этой комбинации, хотя нужно только 5).

Для идентификации конкретной комбинации используются те из 10 битов, которые остались свободными после представления закодированных значений цифр. Различие в методах кодирования Чен-Хо и DPD состоит в способе формирования идентификатора комбинации. Более детально с данными видами кодировки десятичных чисел можно ознакомиться в [64, 72]. В табл. 2.6 приведены примеры кодировки троек десятичных чисел в кодах BCD, Чен-Хо и DPD.

Типы и форматы операндов

 

73

 

 

 

 

 

Таблица 2.6. Примеры представления десятичных чисел в кодировках BCD, Чен-Хо и DPD

 

 

 

 

 

Десятичное число

BCD 8421

Чен-Хо

DPD

005

0000 0000 0101

000 000 0101

000 000 0101

 

009

0000 0000 1001

110 000 0001

000 000 1001

 

055

0000 0101 0101

000 010 1101

000 101 0101

 

079

0000 0111 1001

110 011 1001

000 111 1001

 

080

0000 1000 0000

101 000 0000

000 000 1010

 

099

0000 1001 1001

111 000 1001

000 101 1111

 

555

0101 0101 0101

010 110 1101

101 101 0101

 

999

1001 1001 1001

111 111 1001

001 111 1111

 

Числа в форме с плавающей запятой

От недостатков ФЗ в значительной степени свободна форма представления чисел с плавающей запятой (ПЗ), известная также под названиями нормальной или полулогарифмической формы. В данном варианте каждое число разбивается на две группы цифр. Первая группа цифр называется мантиссой, вторая — порядком. Число представляется в виде произведения X = ±mq±p, где m — мантисса числа X, р — порядок числа, q — основание системы счисления.

Для представления числа в форме с ПЗ требуется задать знаки мантиссы и порядка, их модули в q-ричном коде, а также основание системы счисления (рис. 2.18). Нормальная форма неоднозначна, так как взаимное изменение m и p приводит к «плаванию» запятой, чем и обусловлено название этой формы.

Рис. 2.18. Форма представления чисел с плавающей запятой

Диапазон и точность представления чисел с ПЗ зависят от числа разрядов, отводимых под порядок и мантиссу. На рис. 2.19 показаны диапазоны разрядностей порядка и мантиссы, характерные для известных ВМ.

Помимо разрядности порядка и мантиссы, диапазон представления чисел зависит и от основания используемой системы счисления, которое может быть отличным от 2. Например, в универсальных ВМ (мэйнфреймах) фирмы IBM используется база 16. Это позволяет при одинаковом количестве битов, отведенных под порядок, представлять числа в большем диапазоне. Так, если поле порядка равно 7 битам, максимальное значение qp, на которое умножается мантисса, равно 2128 (при q = 2) или 16128 (при q = 16), а диапазоны представления чисел соответственно составят 10–19 < | X | < 10+19 и 10–76 < | X | < 10+76. Известны также случаи использования базы 8, например, в ВМ B-5500 фирмы Burroughs.

74

Глава 2. Архитектура системы команд

 

 

Рис. 2.19. Типовые разрядности полей порядка и мантиссы

В большинстве вычислительных машин для упрощения операций над порядками последние приводят к целым положительным числам, применяя так называемый смещенный порядок. Для этого к истинному порядку добавляется целое положительное число — смещение (рис. 2.20). Например, в системе со смещением 128, порядок –3 представляется как 125 (–3 + 128). Обычно смещение выбирается равным половине представимого диапазона порядков. Отметим, что смещенный порядок занимает все биты поля порядка, в том числе и тот, который ранее предназначался для записи знака порядка.

Рис. 2.20. Формат числа с ПЗ со смещенным порядком

Мантисса в числах с ПЗ обычно представляется в нормализованной форме. Это означает, что на мантиссу налагаются такие условия, чтобы она по модулю была меньше единицы (|q| < 1), а первая цифра после запятой отличалась от нуля. Полученная таким образом мантисса называется нормализованной. Для применяемых в ВМ систем счисления можно записать:

двоичная: X = m × 2p, (1 > |m| ≥ ½);

восьмеричная: X = m × 8p, (1 > |m| ≥ ⅛);

шестнадцатеричная: X = m × 16p, (1 > |m| ≥ 1/16).

Типы и форматы операндов

75

 

 

Если первые i цифр мантиссы равны нулю, для нормализации ее нужно сдвинуть относительно запятой на i разрядов влево с одновременным уменьшением порядка на i единиц. В результате такой операции число не изменяется:

База

До нормализации

 

После нормализации

 

Порядок

Мантисса

Порядок

Мантисса

2

100

0,000110

001

0,110000

16

8

0,001010

6

0,101000

В примере для шестнадцатеричной системы после нормализации старшая цифра в двоичном представлении содержит впереди три нуля (0001). Это несколько уменьшает точность представления чисел по сравнению с двоичной системой при одинаковом числе двоичных разрядов, отведенных под мантиссу.

Если для записи числа с ПЗ используется база 2 (q = 2), то часто применяют еще один способ повышения точности представления мантиссы, называемый приемом скрытой единицы. Суть его в том, что в нормализованной мантиссе старшая цифра всегда равна единице (для представления нуля используется специальная кодовая комбинация), следовательно, эта цифра может не записываться, а подразумеваться. Запись мантиссы начинают с ее второй цифры, и это позволяет задействовать дополнительный значащий бит для более точного представления числа. Следует отметить, что значение порядка в данном случае не меняется. Скрытая единица перед выполнением арифметических операций восстанавливается, а при записи результата — удаляется. Таким образом, нормализованная мантисса 0,101000(1) при использовании способа «скрытой единицы» будет иметь вид 0,010001 (в скобках указана цифра, не поместившаяся в поле мантиссы при стандартной записи).

Для более существенного увеличения точности вычислений под число отводят несколько машинных слов, например два. Дополнительные биты, как правило, служат для увеличения разрядности мантиссы, однако в ряде случаев часть из них может отводиться и для расширения поля порядка. В процессе вычислений может получаться ненормализованное число. В таком случае ВМ, если это предписано командой, автоматически нормализует его.

Рассмотренные принципы представления чисел с ПЗ поясним на примере [143]. На рис. 2.21 представлен типичный 32-битовый формат числа с ПЗ. Старший (левый) бит содержит знак числа. Значение смещенного порядка хранится в разрядах с 30-го по 23-й и может находиться в диапазоне от 0 до 255.

Рис. 2.21. Типичный 32-битовый формат числа с плавающей запятой

Для получения фактического значения порядка из содержимого этого поля нужно вычесть фиксированное значение, равное 128. С таким смещением фактические

76

Глава 2. Архитектура системы команд

 

 

значения порядка могут лежать в диапазоне от –128 до +127. В примере предполагается, что основание системы счисления равно 2. Третье поле слова содержит нормализованную мантиссу со скрытым разрядом (единицей). Благодаря такому приему 23-разрядное поле позволяет хранить 24-разрядную мантиссу в диапазоне от 0,5 до 1,0.

На рис. 2.22 приведены диапазоны чисел, которые могут быть записаны с помощью 32-разрядного слова.

Рис. 2.22. Числа, представимые в 32-битовых форматах: а — целые числа

сфиксированной запятой; б — числа с плавающей запятой

Вварианте с ФЗ для целых чисел в дополнительном коде могут быть представлены все целые числа от –231 до 231 – 1, то есть всего 232 различных чисел (рис. 2.22, а). Для случая ПЗ возможны следующие диапазоны чисел (рис. 2.22, б):

отрицательные числа между –(1 – 2–24) × 2127 и –0,5 × 2–128;положительные числа между 0,5 × 2–128 и (1 – 2–24) × 2127.

В эту область не включены участки:

отрицательные числа, меньшие чем –(1 – 2–24) × 2127 отрицательное переполнение;

отрицательные числа, большие чем –0,5 × 2–128 отрицательная потеря значимости;

положительные числа, меньшие чем 0,5 × 2–128 положительная потеря значимости;

положительные числа, большие чем (1 – 2–24) × 2127 положительное переполнение.

Показанная запись числа с ПЗ не учитывает нулевого значения. Для этой цели используется специальная кодовая комбинация. Переполнения возникают, когда в результате арифметической операции получается значение большее, чем можно

Типы и форматы операндов

77

 

 

представить порядком 127 (2120 ×2100 = 2230). Потеря значимости — это когда результат представляет собой слишком маленькое дробное значение (2–120 × 2–100 = 2–230). Потеря значимости является менее серьезной проблемой, поскольку такой результат обычно рассматривают как нулевой.

Следует также отметить, что числа в формате ПЗ, в отличие от чисел в форме с ФЗ, размещены на числовой оси неравномерно. Возможные значения в начале числовой оси расположены плотнее, а по мере движения вправо — все реже (рис. 2.23). Это означает, что многие вычисления приводят к результату, который не является точным, то есть представляет собой округление до ближайшего значения, представимого в данной форме записи.

Рис. 2.23. Плотность чисел с плавающей запятой на числовой оси

Для формата, изображенного на рис 2.21, имеет место противоречие между диапазоном и точностью. Если увеличить число битов, отведенных под порядок, расширяется диапазон представимых чисел. Однако, поскольку может быть представлено только фиксированное число различных значений, уменьшается плотность и тем самым точность. Единственный путь увеличения как диапазона, так и точности — увеличение количества разрядов, поэтому в большинстве ВМ предлагается использовать числа в одинарном и двойном форматах. Например, число одинарного формата может занимать 32 бита, а двойного — 64 бита.

Числа с плавающей запятой в разных ВМ имеют несколько различных форматов. В табл. 2.7 приводятся основные параметры для нескольких систем представления чисел в форме с ПЗ. В настоящее время для всех ВМ рекомендован стандарт, разработанный общепризнанным международным центром стандартизации IEEE (Institute of Electrical and Electronics Engineers).

Таблица 2.7. Варианты форматов чисел с плавающей запятой1

 

 

 

 

 

Параметр

IBM 390

VAX

IEEE 754

Длина слова, бит

О: 32; Д: 64

О: 32; Д: 64

О: 32; Д: 64

Порядок, бит

7

8

О: 8; Д: 11

Мантисса, m

О: 6 цифр

О: (1) + 23 бита

О: (1) + 23 бита

 

Д: 14 цифр

Д: (1) + 55 битов

Д: (1) + 52 бита

Смещение порядка

64

128

К: 127, Д: 1023

Основание системы

16

2

2

счисления

 

 

 

Скрытая 1

Нет

Да

Да

продолжение

1 О — одинарный формат; Д — двойной формат.

78

 

Глава 2. Архитектура системы команд

 

 

 

 

Таблица 2.7 (продолжение)

 

 

 

 

 

 

Параметр

IBM 390

VAX

IEEE 754

Запятая

Слева от мантиссы

Слева от скрытой 1

Справа старшего

 

 

 

бита мантиссы

Диапазон мантиссы

(1/16) m < 1

(1/2) m < 1

1 m < 2

Представление ман-

Величина со знаком

Величина со знаком

Величина со знаком

тиссы

 

 

 

Максимальное поло-

1663 1076

2126 1038

21024 10308 (Д)

жительное число

 

 

 

Точность

О: 16–6 10–7

О: 2–24 10–7

О: 2–23 10–7

 

Д: 16–14 10–17

Д: 2–564 10–17

Д: 2–524 10–16

Стандарт IEEE 754

Рекомендуемый для всех ВМ формат представления чисел с плавающей запятой определен стандартом IEEE 754. Этот стандарт был разработан с целью облегчить перенос программ с одного процессора на другие и нашел широкое применение практически во всех процессорах и арифметических сопроцессорах.

Стандарт определяет 32-битовый (одинарный) и 64-битовый (двойной) форматы (рис. 2.24) с 8- и 11-разрядным порядком соответственно. Основанием системы счисления является 2. В дополнение, стандарт предусматривает два расширенных формата, одинарный и двойной, фактический вид которых зависит от конкретной реализации. Расширенные форматы предусматривают дополнительные биты для порядка (увеличенный диапазон) и мантиссы (повышенная точность). Таблица 2.8 содержит описание основных характеристик всех четырех форматов.

Рис. 2.24. Основные форматы IEEE 754: а — одинарный; б — двойной

Не все кодовые комбинации в форматах IEEE интерпретируются обычным путем — некоторые комбинации используются для представления специальных значений. Предельные значения порядка, содержащие все нули (0) и все единицы (255 — в одинарном формате и 2047 — в двойном формате), определяют специальные значения.

Описываются следующие классы чисел.

Порядки в диапазоне от 1 до 254 для одинарного формата и от 1 до 2036 — для двойного формата, используются для представления ненулевых нормализо-

Типы и форматы операндов

79

 

 

ванных чисел. Порядки смещены так, что их диапазон составляет от –126 до +127 для одинарного формата и от –1022 до +1023 — для двойного формата. Нормализованное число требует, чтобы слева от двоичной запятой был единичный бит. Этот бит подразумевается, благодаря чему обеспечивается эффективная ширина мантиссы, равная 24 битам для одинарного и 53 битам — для двойного форматов.

Нулевой порядок совместно с нулевой мантиссой представляют положительный или отрицательный 0, в зависимости от состояния бита знака мантиссы.

Порядок, содержащий единицы во всех разрядах, плюс нулевая мантисса соответствуют бесконечности (положительной или отрицательной, в зависимости от состояния бита знака), что позволяет пользователю самому решить, считать ли это ошибкой или продолжать вычисления со значением, равным бесконечности.

Нулевой порядок в сочетании с ненулевой мантиссой обозначают ненормализованное число. В этом случае бит слева от двоичной точки равен 0 и фактический порядок равен –126 или –1022. Число является положительным или отрицательным в зависимости от значения знакового бита.

Кодовая комбинация, в которой порядок содержит все единицы, а мантисса не равна 0, используется как признак «не числа» (NAN — Not a Number) и служит для предупреждения о различных исключительных ситуациях, например о делении 0/0.

Таблица 2.8. Параметры форматов стандарта IEEE 754

 

 

 

 

 

 

 

Параметр

Формат

 

 

 

 

одинарный

одинарный

двойной

двойной

 

 

расширенный

 

расширенный

Разрядность слова,

32

≥ 43

64

≥ 79

бит

 

 

 

 

Поле порядка, бит

8

≥ 11

11

≥ 15

Смещение порядка

127

Не оговорено

1023

Не оговорено

Поле мантиссы, бит

23

≥ 31

52

≥ 63

Максимальное значе-

127

≥ 1023

1023

≥ 16383

ние порядка

 

 

 

 

Минимальное значение

–126

≤ –1022

–1022

≤ –16382

порядка

 

 

 

 

Диапазон чисел

10–38, 10+38

Не оговорен

10–308, 10–308

Не оговорен

Упакованные числа с плавающей запятой

В рамках уже упоминавшейся технологии SSE4 имеются команды, служащие для увеличения производительности систем при обработке мультимедийной информации, описываемой числами с ПЗ. Каждая такая команда работает с четырьмя операндами с плавающей запятой одинарной точности или двумя операндами двойной точности. Операнды упаковываются в 128-разрядные группы, как это показано на рис. 2.25.

80

Глава 2. Архитектура системы команд

 

 

Рис. 2.25. Формат упакованных чисел с плавающей запятой в технологии SSE4

Разрядность основных форматов числовых данных

Данные, представляющие в ВМ числовую информацию, могут иметь фиксированную или переменную длину. Операционные устройства вычислительных машин (целочисленные арифметико-логические устройства, блоки обработки чисел с плавающей запятой, устройства десятичной арифметики и т. п.), как правило, рассчитаны на обработку кодов фиксированной длины. Общепринятые величины разрядности кодов чисел: бит, полубайт, байт, слово, двойное слово, счетверенное слово, двойное счетверенное слово.

Наименьшей единицей данных в ВМ служит бит (BIT, BInary digiT — двоичная цифра). В большинстве случаев эта единица информации слишком мала. Однобитовые операционные устройства использовались в ВМ с последовательной обработкой информации, а в современных машинах с параллельной обработкой разрядов они практически не применяются. Побитовую работу с данными скорее можно встретить в многопроцессорных вычислительных системах, построенных из одноразрядных процессоров.

Следующая по величине единица состоит из четырех битов и называется полубайтом или тетрадой, или реже «ниблом» (nibble). Она также редко имеет самостоятельное значение и заслуживает упоминания как единица представления отдельных десятичных цифр при их двоично-десятичной записи.

Реально наименьшей обрабатываемой единицей считается байт (BYTE, BinarY TErm — двоичный элемент), состоящий из восьми битов. На практике эта единица информации также оказывается недостаточной, и значительно чаще применяются числа, представленные двумя (слово — 16 битов), четырьмя (двойное слово — 32 бита), восемью (счетверенное слово — 64 бита) или шестнадцатью (двойное счетверенное слово — 128 битов) байтами.

Блоки операций с плавающей запятой обычно согласованы со стандартом IEEE 754 и рассчитаны на обработку чисел в формате двойной длины (64 бита). В большинстве ВМ реальная разрядность таких блоков даже больше (80 битов). Таким образом, наилучшим вариантом при проведении вычислений с плавающей запятой можно считать формат двойного слова. При выборе формата меньшей длины (32 разряда) вычисления все равно ведутся с большей точностью, после чего результат округляется. Таким образом, использование короткого формата чисел с плавающей запятой, как и в случае целых чисел с фиксированной запятой, помимо экономии памяти никаких иных преимуществ также не дает.