3-й семестр / Организация ЭВМиС; Орлов С.А., Цилькер Б.Я
..pdfТипы и форматы операндов |
71 |
|
|
Рис. 2.15. Форматы десятичных чисел: а — упакованный; б — зонный
Наиболее распространен упакованный формат (рис. 2.15, а), позволяющий не только хранить десятичные числа, но и производить над ними арифметические операции. В данном формате запись числа имеет вид цепочки байтов, где каждый байт содержит коды двух десятичных цифр. Правая тетрада младшего байта предназначается для записи знака числа. Десятичное число должно занимать целое количество байтов. Если это условие не выполняется, то четыре старших двоичных разряда левого байта заполняются нулями. Так, представление числа –7396 в упакованном формате имеет вид, приведенный на рис 2.16.
Рис. 2.16. Представление числа –7396 в упакованном формате
Зонный формат (рис. 2.15, б) распространен, главным образом, в больших универсальных ВМ семейства IBM 360/370/390. В нем под каждую цифру выделяется один байт, где младшие четыре разряда отводятся под код цифры, а в старшую тетраду (поле зоны) записывается специальный код «зона», не совпадающий с кодами цифр и знаков. В IBM 360/370/390 это код 11112 = F16. Исключение составляет байт, содержащий младшую цифру десятичного числа, где в поле зоны хранится знак числа. На рис. 2.17 показана запись числа –7396 в зонном формате. В некоторых ВМ принят вариант зонного формата, где поле зоны заполняется нулями.
Рис. 2.17. Представление числа –7396 в зонном формате
Размещение знака в младшем байте, как в зонном, так и в упакованном представлениях, позволяет задавать десятичные числа произвольной длины и передавать их в виде цепочки байтов. В этом случае знак указывает, что байт, в котором он содержится, является последним байтом данного числа, а следующий байт последовательности — это старший байт очередного числа.
Рассмотренный вариант двоично-кодированного представления десятичных цифр с весами 8421 наиболее распространен, но не является единственным. Возможные иные схемы кодирования приведены в табл. 2.5.
72 |
|
|
Глава 2. Архитектура системы команд |
||
|
|
|
|
|
|
Таблица 2.5. Варианты двоично-кодированного представления десятичных цифр |
|||||
|
|
|
|
|
|
Цифра |
BCD 8 4 2 1 |
Excess-3 |
BCD 2 4 2 1 |
BCD 8 4 -2 -1 |
BCD 8 4 2 1 |
|
|
(код Стибица) |
(код Айкена) |
|
(IBM 702, 705) |
0 |
0000 |
0011 |
0000 |
0000 |
1010 |
1 |
0001 |
0100 |
0001 |
0111 |
0001 |
2 |
0010 |
0101 |
0010 |
0110 |
0010 |
3 |
0011 |
0110 |
0011 |
0101 |
0011 |
4 |
0100 |
0111 |
0100 |
0100 |
0100 |
5 |
0101 |
1000 |
1011 |
1011 |
1011 |
6 |
0110 |
1001 |
1100 |
1010 |
0110 |
7 |
0111 |
1010 |
1101 |
1001 |
0111 |
8 |
1000 |
1011 |
1110 |
1000 |
1000 |
9 |
1001 |
1100 |
1111 |
1111 |
1001 |
Использование 4-х двоичных цифр для представления одной десятичной цифры по своей сути избыточно. В то же время при иной системе кодирования для представления десятичного числа из трех цифр достаточно 10 двоичных разрядов. Два наиболее известных варианта такого «экономичного» кодирования — код ЧенХо (Tien Chi Chen, Irving T. Ho) и плотно упакованный десятичный код (DPD — Densely Packed Decimal).
В обоих вариантах каждая десятичная цифра классифицируется по значению старшего бита в ее представлении в коде BCD на «маленькую» 0–7 (00002–01112) или «большую» 8–9 (10002–10012). Для идентификации маленькой цифры (М) достаточно 3 бита, а большой (Б) — одного бита.
При таком представлении возможны следующие комбинации из трех десятичных цифр:
М + М + М (требуется 9 битов для цифр и остается 1 бит для идентификации этой комбинации);
М + М + Б, или М + Б + М, или Б + М + М (требуется 7 битов для цифр и остается 3 бита для идентификации этих комбинаций);
М + Б + Б, или Б + М + Б, или Б + Б + М (требуется 5 битов для цифр и остается 5 битов для идентификации этих комбинаций);
Б + Б + Б (3 бита для цифр и 7 битов для индикации этой комбинации, хотя нужно только 5).
Для идентификации конкретной комбинации используются те из 10 битов, которые остались свободными после представления закодированных значений цифр. Различие в методах кодирования Чен-Хо и DPD состоит в способе формирования идентификатора комбинации. Более детально с данными видами кодировки десятичных чисел можно ознакомиться в [64, 72]. В табл. 2.6 приведены примеры кодировки троек десятичных чисел в кодах BCD, Чен-Хо и DPD.
Типы и форматы операндов |
|
73 |
||
|
|
|
|
|
Таблица 2.6. Примеры представления десятичных чисел в кодировках BCD, Чен-Хо и DPD |
||||
|
|
|
|
|
Десятичное число |
BCD 8421 |
Чен-Хо |
DPD |
|
005 |
0000 0000 0101 |
000 000 0101 |
000 000 0101 |
|
009 |
0000 0000 1001 |
110 000 0001 |
000 000 1001 |
|
055 |
0000 0101 0101 |
000 010 1101 |
000 101 0101 |
|
079 |
0000 0111 1001 |
110 011 1001 |
000 111 1001 |
|
080 |
0000 1000 0000 |
101 000 0000 |
000 000 1010 |
|
099 |
0000 1001 1001 |
111 000 1001 |
000 101 1111 |
|
555 |
0101 0101 0101 |
010 110 1101 |
101 101 0101 |
|
999 |
1001 1001 1001 |
111 111 1001 |
001 111 1111 |
|
Числа в форме с плавающей запятой
От недостатков ФЗ в значительной степени свободна форма представления чисел с плавающей запятой (ПЗ), известная также под названиями нормальной или полулогарифмической формы. В данном варианте каждое число разбивается на две группы цифр. Первая группа цифр называется мантиссой, вторая — порядком. Число представляется в виде произведения X = ±mq±p, где m — мантисса числа X, р — порядок числа, q — основание системы счисления.
Для представления числа в форме с ПЗ требуется задать знаки мантиссы и порядка, их модули в q-ричном коде, а также основание системы счисления (рис. 2.18). Нормальная форма неоднозначна, так как взаимное изменение m и p приводит к «плаванию» запятой, чем и обусловлено название этой формы.
Рис. 2.18. Форма представления чисел с плавающей запятой
Диапазон и точность представления чисел с ПЗ зависят от числа разрядов, отводимых под порядок и мантиссу. На рис. 2.19 показаны диапазоны разрядностей порядка и мантиссы, характерные для известных ВМ.
Помимо разрядности порядка и мантиссы, диапазон представления чисел зависит и от основания используемой системы счисления, которое может быть отличным от 2. Например, в универсальных ВМ (мэйнфреймах) фирмы IBM используется база 16. Это позволяет при одинаковом количестве битов, отведенных под порядок, представлять числа в большем диапазоне. Так, если поле порядка равно 7 битам, максимальное значение qp, на которое умножается мантисса, равно 2128 (при q = 2) или 16128 (при q = 16), а диапазоны представления чисел соответственно составят 10–19 < | X | < 10+19 и 10–76 < | X | < 10+76. Известны также случаи использования базы 8, например, в ВМ B-5500 фирмы Burroughs.
74 |
Глава 2. Архитектура системы команд |
|
|
Рис. 2.19. Типовые разрядности полей порядка и мантиссы
В большинстве вычислительных машин для упрощения операций над порядками последние приводят к целым положительным числам, применяя так называемый смещенный порядок. Для этого к истинному порядку добавляется целое положительное число — смещение (рис. 2.20). Например, в системе со смещением 128, порядок –3 представляется как 125 (–3 + 128). Обычно смещение выбирается равным половине представимого диапазона порядков. Отметим, что смещенный порядок занимает все биты поля порядка, в том числе и тот, который ранее предназначался для записи знака порядка.
Рис. 2.20. Формат числа с ПЗ со смещенным порядком
Мантисса в числах с ПЗ обычно представляется в нормализованной форме. Это означает, что на мантиссу налагаются такие условия, чтобы она по модулю была меньше единицы (|q| < 1), а первая цифра после запятой отличалась от нуля. Полученная таким образом мантисса называется нормализованной. Для применяемых в ВМ систем счисления можно записать:
двоичная: X = m × 2p, (1 > |m| ≥ ½);
восьмеричная: X = m × 8p, (1 > |m| ≥ ⅛);
шестнадцатеричная: X = m × 16p, (1 > |m| ≥ 1/16).
Типы и форматы операндов |
75 |
|
|
Если первые i цифр мантиссы равны нулю, для нормализации ее нужно сдвинуть относительно запятой на i разрядов влево с одновременным уменьшением порядка на i единиц. В результате такой операции число не изменяется:
База |
До нормализации |
|
После нормализации |
|
|
Порядок |
Мантисса |
Порядок |
Мантисса |
2 |
100 |
0,000110 |
001 |
0,110000 |
16 |
8 |
0,001010 |
6 |
0,101000 |
В примере для шестнадцатеричной системы после нормализации старшая цифра в двоичном представлении содержит впереди три нуля (0001). Это несколько уменьшает точность представления чисел по сравнению с двоичной системой при одинаковом числе двоичных разрядов, отведенных под мантиссу.
Если для записи числа с ПЗ используется база 2 (q = 2), то часто применяют еще один способ повышения точности представления мантиссы, называемый приемом скрытой единицы. Суть его в том, что в нормализованной мантиссе старшая цифра всегда равна единице (для представления нуля используется специальная кодовая комбинация), следовательно, эта цифра может не записываться, а подразумеваться. Запись мантиссы начинают с ее второй цифры, и это позволяет задействовать дополнительный значащий бит для более точного представления числа. Следует отметить, что значение порядка в данном случае не меняется. Скрытая единица перед выполнением арифметических операций восстанавливается, а при записи результата — удаляется. Таким образом, нормализованная мантисса 0,101000(1) при использовании способа «скрытой единицы» будет иметь вид 0,010001 (в скобках указана цифра, не поместившаяся в поле мантиссы при стандартной записи).
Для более существенного увеличения точности вычислений под число отводят несколько машинных слов, например два. Дополнительные биты, как правило, служат для увеличения разрядности мантиссы, однако в ряде случаев часть из них может отводиться и для расширения поля порядка. В процессе вычислений может получаться ненормализованное число. В таком случае ВМ, если это предписано командой, автоматически нормализует его.
Рассмотренные принципы представления чисел с ПЗ поясним на примере [143]. На рис. 2.21 представлен типичный 32-битовый формат числа с ПЗ. Старший (левый) бит содержит знак числа. Значение смещенного порядка хранится в разрядах с 30-го по 23-й и может находиться в диапазоне от 0 до 255.
Рис. 2.21. Типичный 32-битовый формат числа с плавающей запятой
Для получения фактического значения порядка из содержимого этого поля нужно вычесть фиксированное значение, равное 128. С таким смещением фактические
76 |
Глава 2. Архитектура системы команд |
|
|
значения порядка могут лежать в диапазоне от –128 до +127. В примере предполагается, что основание системы счисления равно 2. Третье поле слова содержит нормализованную мантиссу со скрытым разрядом (единицей). Благодаря такому приему 23-разрядное поле позволяет хранить 24-разрядную мантиссу в диапазоне от 0,5 до 1,0.
На рис. 2.22 приведены диапазоны чисел, которые могут быть записаны с помощью 32-разрядного слова.
Рис. 2.22. Числа, представимые в 32-битовых форматах: а — целые числа
сфиксированной запятой; б — числа с плавающей запятой
Вварианте с ФЗ для целых чисел в дополнительном коде могут быть представлены все целые числа от –231 до 231 – 1, то есть всего 232 различных чисел (рис. 2.22, а). Для случая ПЗ возможны следующие диапазоны чисел (рис. 2.22, б):
отрицательные числа между –(1 – 2–24) × 2127 и –0,5 × 2–128;положительные числа между 0,5 × 2–128 и (1 – 2–24) × 2127.
В эту область не включены участки:
отрицательные числа, меньшие чем –(1 – 2–24) × 2127 — отрицательное переполнение;
отрицательные числа, большие чем –0,5 × 2–128 — отрицательная потеря значимости;
положительные числа, меньшие чем 0,5 × 2–128 — положительная потеря значимости;
положительные числа, большие чем (1 – 2–24) × 2127 — положительное переполнение.
Показанная запись числа с ПЗ не учитывает нулевого значения. Для этой цели используется специальная кодовая комбинация. Переполнения возникают, когда в результате арифметической операции получается значение большее, чем можно
Типы и форматы операндов |
77 |
|
|
представить порядком 127 (2120 ×2100 = 2230). Потеря значимости — это когда результат представляет собой слишком маленькое дробное значение (2–120 × 2–100 = 2–230). Потеря значимости является менее серьезной проблемой, поскольку такой результат обычно рассматривают как нулевой.
Следует также отметить, что числа в формате ПЗ, в отличие от чисел в форме с ФЗ, размещены на числовой оси неравномерно. Возможные значения в начале числовой оси расположены плотнее, а по мере движения вправо — все реже (рис. 2.23). Это означает, что многие вычисления приводят к результату, который не является точным, то есть представляет собой округление до ближайшего значения, представимого в данной форме записи.
Рис. 2.23. Плотность чисел с плавающей запятой на числовой оси
Для формата, изображенного на рис 2.21, имеет место противоречие между диапазоном и точностью. Если увеличить число битов, отведенных под порядок, расширяется диапазон представимых чисел. Однако, поскольку может быть представлено только фиксированное число различных значений, уменьшается плотность и тем самым точность. Единственный путь увеличения как диапазона, так и точности — увеличение количества разрядов, поэтому в большинстве ВМ предлагается использовать числа в одинарном и двойном форматах. Например, число одинарного формата может занимать 32 бита, а двойного — 64 бита.
Числа с плавающей запятой в разных ВМ имеют несколько различных форматов. В табл. 2.7 приводятся основные параметры для нескольких систем представления чисел в форме с ПЗ. В настоящее время для всех ВМ рекомендован стандарт, разработанный общепризнанным международным центром стандартизации IEEE (Institute of Electrical and Electronics Engineers).
Таблица 2.7. Варианты форматов чисел с плавающей запятой1 |
|
||
|
|
|
|
Параметр |
IBM 390 |
VAX |
IEEE 754 |
Длина слова, бит |
О: 32; Д: 64 |
О: 32; Д: 64 |
О: 32; Д: 64 |
Порядок, бит |
7 |
8 |
О: 8; Д: 11 |
Мантисса, m |
О: 6 цифр |
О: (1) + 23 бита |
О: (1) + 23 бита |
|
Д: 14 цифр |
Д: (1) + 55 битов |
Д: (1) + 52 бита |
Смещение порядка |
64 |
128 |
К: 127, Д: 1023 |
Основание системы |
16 |
2 |
2 |
счисления |
|
|
|
Скрытая 1 |
Нет |
Да |
Да |
продолжение
1 О — одинарный формат; Д — двойной формат.
78 |
|
Глава 2. Архитектура системы команд |
|
|
|
|
|
Таблица 2.7 (продолжение) |
|
|
|
|
|
|
|
Параметр |
IBM 390 |
VAX |
IEEE 754 |
Запятая |
Слева от мантиссы |
Слева от скрытой 1 |
Справа старшего |
|
|
|
бита мантиссы |
Диапазон мантиссы |
(1/16) ≤ m < 1 |
(1/2) ≤ m < 1 |
1 ≤ m < 2 |
Представление ман- |
Величина со знаком |
Величина со знаком |
Величина со знаком |
тиссы |
|
|
|
Максимальное поло- |
1663 1076 |
2126 1038 |
21024 10308 (Д) |
жительное число |
|
|
|
Точность |
О: 16–6 10–7 |
О: 2–24 10–7 |
О: 2–23 10–7 |
|
Д: 16–14 10–17 |
Д: 2–564 10–17 |
Д: 2–524 10–16 |
Стандарт IEEE 754
Рекомендуемый для всех ВМ формат представления чисел с плавающей запятой определен стандартом IEEE 754. Этот стандарт был разработан с целью облегчить перенос программ с одного процессора на другие и нашел широкое применение практически во всех процессорах и арифметических сопроцессорах.
Стандарт определяет 32-битовый (одинарный) и 64-битовый (двойной) форматы (рис. 2.24) с 8- и 11-разрядным порядком соответственно. Основанием системы счисления является 2. В дополнение, стандарт предусматривает два расширенных формата, одинарный и двойной, фактический вид которых зависит от конкретной реализации. Расширенные форматы предусматривают дополнительные биты для порядка (увеличенный диапазон) и мантиссы (повышенная точность). Таблица 2.8 содержит описание основных характеристик всех четырех форматов.
Рис. 2.24. Основные форматы IEEE 754: а — одинарный; б — двойной
Не все кодовые комбинации в форматах IEEE интерпретируются обычным путем — некоторые комбинации используются для представления специальных значений. Предельные значения порядка, содержащие все нули (0) и все единицы (255 — в одинарном формате и 2047 — в двойном формате), определяют специальные значения.
Описываются следующие классы чисел.
Порядки в диапазоне от 1 до 254 для одинарного формата и от 1 до 2036 — для двойного формата, используются для представления ненулевых нормализо-
Типы и форматы операндов |
79 |
|
|
ванных чисел. Порядки смещены так, что их диапазон составляет от –126 до +127 для одинарного формата и от –1022 до +1023 — для двойного формата. Нормализованное число требует, чтобы слева от двоичной запятой был единичный бит. Этот бит подразумевается, благодаря чему обеспечивается эффективная ширина мантиссы, равная 24 битам для одинарного и 53 битам — для двойного форматов.
Нулевой порядок совместно с нулевой мантиссой представляют положительный или отрицательный 0, в зависимости от состояния бита знака мантиссы.
Порядок, содержащий единицы во всех разрядах, плюс нулевая мантисса соответствуют бесконечности (положительной или отрицательной, в зависимости от состояния бита знака), что позволяет пользователю самому решить, считать ли это ошибкой или продолжать вычисления со значением, равным бесконечности.
Нулевой порядок в сочетании с ненулевой мантиссой обозначают ненормализованное число. В этом случае бит слева от двоичной точки равен 0 и фактический порядок равен –126 или –1022. Число является положительным или отрицательным в зависимости от значения знакового бита.
Кодовая комбинация, в которой порядок содержит все единицы, а мантисса не равна 0, используется как признак «не числа» (NAN — Not a Number) и служит для предупреждения о различных исключительных ситуациях, например о делении 0/0.
Таблица 2.8. Параметры форматов стандарта IEEE 754 |
|
|
||
|
|
|
|
|
Параметр |
Формат |
|
|
|
|
одинарный |
одинарный |
двойной |
двойной |
|
|
расширенный |
|
расширенный |
Разрядность слова, |
32 |
≥ 43 |
64 |
≥ 79 |
бит |
|
|
|
|
Поле порядка, бит |
8 |
≥ 11 |
11 |
≥ 15 |
Смещение порядка |
127 |
Не оговорено |
1023 |
Не оговорено |
Поле мантиссы, бит |
23 |
≥ 31 |
52 |
≥ 63 |
Максимальное значе- |
127 |
≥ 1023 |
1023 |
≥ 16383 |
ние порядка |
|
|
|
|
Минимальное значение |
–126 |
≤ –1022 |
–1022 |
≤ –16382 |
порядка |
|
|
|
|
Диапазон чисел |
10–38, 10+38 |
Не оговорен |
10–308, 10–308 |
Не оговорен |
Упакованные числа с плавающей запятой
В рамках уже упоминавшейся технологии SSE4 имеются команды, служащие для увеличения производительности систем при обработке мультимедийной информации, описываемой числами с ПЗ. Каждая такая команда работает с четырьмя операндами с плавающей запятой одинарной точности или двумя операндами двойной точности. Операнды упаковываются в 128-разрядные группы, как это показано на рис. 2.25.
80 |
Глава 2. Архитектура системы команд |
|
|
Рис. 2.25. Формат упакованных чисел с плавающей запятой в технологии SSE4
Разрядность основных форматов числовых данных
Данные, представляющие в ВМ числовую информацию, могут иметь фиксированную или переменную длину. Операционные устройства вычислительных машин (целочисленные арифметико-логические устройства, блоки обработки чисел с плавающей запятой, устройства десятичной арифметики и т. п.), как правило, рассчитаны на обработку кодов фиксированной длины. Общепринятые величины разрядности кодов чисел: бит, полубайт, байт, слово, двойное слово, счетверенное слово, двойное счетверенное слово.
Наименьшей единицей данных в ВМ служит бит (BIT, BInary digiT — двоичная цифра). В большинстве случаев эта единица информации слишком мала. Однобитовые операционные устройства использовались в ВМ с последовательной обработкой информации, а в современных машинах с параллельной обработкой разрядов они практически не применяются. Побитовую работу с данными скорее можно встретить в многопроцессорных вычислительных системах, построенных из одноразрядных процессоров.
Следующая по величине единица состоит из четырех битов и называется полубайтом или тетрадой, или реже «ниблом» (nibble). Она также редко имеет самостоятельное значение и заслуживает упоминания как единица представления отдельных десятичных цифр при их двоично-десятичной записи.
Реально наименьшей обрабатываемой единицей считается байт (BYTE, BinarY TErm — двоичный элемент), состоящий из восьми битов. На практике эта единица информации также оказывается недостаточной, и значительно чаще применяются числа, представленные двумя (слово — 16 битов), четырьмя (двойное слово — 32 бита), восемью (счетверенное слово — 64 бита) или шестнадцатью (двойное счетверенное слово — 128 битов) байтами.
Блоки операций с плавающей запятой обычно согласованы со стандартом IEEE 754 и рассчитаны на обработку чисел в формате двойной длины (64 бита). В большинстве ВМ реальная разрядность таких блоков даже больше (80 битов). Таким образом, наилучшим вариантом при проведении вычислений с плавающей запятой можно считать формат двойного слова. При выборе формата меньшей длины (32 разряда) вычисления все равно ведутся с большей точностью, после чего результат округляется. Таким образом, использование короткого формата чисел с плавающей запятой, как и в случае целых чисел с фиксированной запятой, помимо экономии памяти никаких иных преимуществ также не дает.