Книги / Книга Проектирование ВПОВС (часть 2)
.pdf
все типы возможных структур разбиты на шесть классов и соответственно выделено шесть возможных структур ЭВМ.
Машина I соответствует стандартной ЭВМ фон неймановского типа. Для наглядности память данных и команд разделим на две части (рис. 2.12).
Схематично машина I представляется следующим образом.
|
ПК |
|
Пословная |
УУ |
|
|
|
|
память |
|
|
данных |
Параллельное |
ПК – память команд; |
ППД |
устройство |
УУ – устройство управления; |
|
обработки ПУО |
ПУО – параллельное устройство |
|
|
обработки данных; |
|
|
ППД – пословная память данных |
Р
ис. 2.12
Машина II – аналог стандартной ЭВМ за исключением того, что обработка данных ведётся над разрядным срезом данных. Разрядный срез суть одноимённые разряды всех слов, поступающих на обработку в данный момент.
ПК
...
УУ
Разрядная |
|
|
память |
УОРС |
|
данных |
||
|
||
РПД |
|
|
|
... |
РПД – разрядная память данных с выдачей разрядного среза; УОРС – устройство обработки разрядных срезов
Рис. 2.13
Машина III – это сочетание машины I и II.
В ней содержится ортогональная память, которая позволяет считывать данные либо по разрядным срезам, либо словами. Соответственно обработка
81
ведётся либо под разрядами, причём одновременно по всему срезу, либо пословно, последовательно под каждым словом (рис. 2.14).
ПК
...
Ортогональная память
Разрядный срез
Последовательный процессор обработки срезов УОРС
УУ
...
Параллельный процессор ПУО
Преобразователь |
|
паседовательного |
Пословная память |
кода в парал- |
данных |
лельный и обратно |
|
... |
... |
Рис. 2.14
Машина IV – ансамбль независимых процессоров (рис. 2.15).
УУ
УО |
УО |
УО |
УО |
УО |
ПД |
ПД |
ПД |
ПД |
ПД |
|
|
Внешняя память |
|
|
|
|
Рис. 2.15 |
|
|
82
Достаточно специализированная система, в которой все устройства обработки реализуют одну команду и процессы, протекающие в каждом устройстве обработки независимы друг от друга. Обмен данными происходит на уровне внешняя память – память данных. Отсутствия обменов на уровне УО и ПД достаточно легко позволяет наращивать систему, но делает её весьма ограниченной по применению.
Машина V – является расширением машины IV (рис. 2.16). В ней предусмотрен обмен данными между процессором в прямом и обратном направлении.
УУ
УО ... |
УО |
УО |
УО ... |
УО |
ПД |
ПД |
ПД |
ПД |
ПД |
Внешняя память
Ри
Рис. 2.16
МашинаVI – симбиоз памяти и вычислительной логики ассоциативная
ЭВМ.
Во всех вышеперечисленных ЭВМ, память данных и устройства обработки разделены. Машина VI отражает другой подход, когда устройство обработки
(логика) и элементы памяти совмещены, другими словами, машина VI – это память со встроенной логикой, т. е. элементы процессора распределены по всему запоминающему устройству.
83
Входные данные
Ячейка памяти
Логика управления 
... 
Ячейка памяти
Логика управления 
... 
Ячейка памяти
Логика управления 
... 
Управление
Логика вычисления
Логика вычисления
Логика вычисления
Ячейка памяти
Логика управления 
... 
Ячейка памяти
Логика управления 
... 
Ячейка памяти
Логика управления 
... 
Логика вычисления
Логика вычисления
Логика вычисления
...
...
...
Ячейка памяти
Логика управления 
... 
Ячейка памяти
Логика управления 
... 
Ячейка памяти
Логика управления 
... 
Логика вычисления
Логика вычисления
Логика вычисления
Рис. 2.17
Система Шора в целом не является полной, например, конвейерно-
векторная ЭВМ не отражается в классификаторе. И хотя машина V в какой по мере может претендовать на этот класс, однако при общем управлении это звучит не убедительно. С другой стороны, машина II также имеет альтернативу,
если рассматривать распределённую систему управления. В силу чего введём дополнительную машину “Машина VII”.
Машина VII – является модификацией машины II и VI
84
|
|
ПК |
|
|
|
УУ |
|
|
к |
Верт |
|
ОРП |
о |
||
м |
УО |
||
|
|||
|
м |
|
|
ПК |
|
... |
|
ПК |
|
|
|
|
УУ |
|
... |
|
УУ |
|
|
|
к |
Верт |
к |
|
к |
|
Верт |
к |
|
|
|
|||||||
о |
о |
|
о |
|
о |
ОРП |
||
|
||||||||
м |
УО |
м |
|
м |
|
УО |
м |
|
|
|
|
||||||
м |
|
м |
|
м |
|
|
м |
|
|
|
|
|
|||||
Рис. 2.18
Здесь каждое вертикальное устройство обработки (УО) управляется своим устройством управления (УУ). Причём загрузка команд в каждое УУ осуществляется до начала вычислений. Таким образом, данная система относится к параллельно-векторым ЭВМ.
К её достоинствам относится высокая эффективность при решении задач,
структура данных которых существенно не изменяется при проведении вычислений.
Используя все основные классификационные признаки вычислительных систем, участвующих в разных систематиках можно построить следующий граф,
возможных систем.
2.7.1.2 Классификационный граф систем
В качестве основных признаков выбираются следующие:
1)тип потока команд в вычислительной части системы;
2)тип потока данных в вычислительной части системы;
3)способ обработки данных в вычислительной части системы;
4)степень связанности компонент вычислительной системы;
5)системы однородности компонент ВС;
6)тип внутренних связей в ВС.
85
Эти признаки позволяют построить базовую классификацию в виде дерева,
где на каждом уровне используется свой признак. В схеме используются следующие сокращения:
а) ВС – вычислительная система;
б) ОК, МК – одиночный и множественный поток команд;
в) ОД, МД – одиночный и множественный поток данных;
г) С, Р – пословная и поразрядная обработка данных в вычислительной системы;
д) Нс, Вс – низкая и высокая степень связанности вычислительной системы соответственно;
е) Ор, Нр – однородные и неоднородные ВС;
ж) Кн, Пм, Пр – система связи канал – канал, через внешнею память и непосредственно между процессорами;
з) ОШ – общая шина, МШ – многошинная система, ПК – перекрёстные связи через коммутатор.
Данный классификатор достаточно полно отражает все возможные системы.
86
87
1 ур |
ВС |
1 ур |
ОК |
МК |
3 ур |
ОД |
ИД |
ОД |
4 ур |
C |
P |
C |
P |
C |
P |
|
|
Обычный |
Проц. |
|
Ассоц. |
Матрич. |
Разрядно |
|
|
проц. |
одноразр. |
проц. |
системы потоковые |
|
||
|
|
|
|
|
|
ВС |
|
5 ур |
|
|
НС |
ВС |
|
|
МС |
|
|
|
Система |
Матрич. |
|
|
|
|
|
|
проц. |
системы |
|
|
|
6 ур |
|
|
|
|
|
ОР |
НР |
7 ур |
Кн Пм Пр |
Кн Пм Пр |
|
Одноразрядные |
Неоднородные |
|
многомашинные |
многомашинные |
|
системы |
системы |
Системы
МД
C P C
Обычный процессор
ВС
НПС
ОК
ОД
P
Цифровой
интегратор
Ансамбль пр-в
Система с ОР НР ансамблем процессоров
Ош Мш Пк |
Ош Мш Пк |
Одноразрядные |
Неоднородные |
многопроцессорные |
многопроцессо |
системы |
лные системы |
Рис. 2.19
МД
C
НПСеть
Нейропроцессорная сеть
2.7.2. Двоичные высокоскоростные операционные устройства
В проблемно-ориентированных системах основное внимание уделяют быстродействию операционных устройств. Достаточно сильное влияние на время выполнения операций в арифметико-логических устройствах оказывают сумматоры. Это связано с тем, что в параллельных сумматорах большой разрядности цепь распространения переноса содержит значительное число элементов и, как следствие, длительное время пробега переноса. В связи, с этим вопросу снижения времени пробега переноса уделяется основное внимание.
Ниже рассматриваются основные методы повышения производительности работы арифметико-логических устройств.
2.7.2.1. Сверхпараллельные сумматоры
К сверхпараллельным сумматорам относят устройства, в которых осуществляется не только суммирование чисел в параллельном коде, но и параллельное суммирование переносов. Идея построения такого сумматора заключается в том, что обычный сумматор с последовательным переносом разбивается на группы. Выбор разрядности группы в целом произволен, но большая разрядность ведет к значительным расходам оборудования. Обычно ограничиваются 4 – 8 реже 16 разрядами. Затем группы объединяются в более крупные группы и т.д., причем в каждой группе формируются специальные подготовительные функции, которые в дальнейшем используются для организации ускоренного переноса. Самым существенным является то, что они готовятся на основе значений разрядов поступающих чисел и не зависят от значений сигналов переносов.
Методику построения параллельного переноса рассмотрим на примере 24
разрядного сумматора [4]. Напомним, что перенос в традиционном комбинационном сумматоре формируется по правилу
88
a0 b0 |
P |
1 |
|
ai bi |
P |
i+1 |
ai+1 bi+1 |
P |
an |
bn |
|
|
|
|
|
|
i+2 |
|
|
||
|
|
|
|
|
|
|
|
|
|
C |
å0 |
|
|
... |
ån-i |
|
|
ån-(i+1) |
... |
|
0 |
|
|
|
|
|
ån |
P0 |
S |
0 |
P |
1 |
|
|
|||
|
|
|
|
S |
i |
a b P |
1 |
a b P |
1 |
a b P |
1 |
|
i i i |
i i i |
i i i |
Si
a b P |
1 |
i i i |
,
P |
i+1 |
S |
|
P |
S |
|
|
i+1 |
n |
n |
|||
|
|
|
|
|
P a b P |
1 |
a b P |
1 |
a b P |
1 |
|
i |
i i i |
i i i |
i i i |
|||
a b P |
1 |
i i i |
,
где ai, bi – цифры слагаемых в i-м разряде, pi – перенос в i-й разряд из (i+1)
разряда, pi-1 – перенос в (i-1)-й разряд из i-го разряда(старший разряд имеет меньший номер). Время суммирования в отдельном трехходовом сумматоре минимальна и равна задержки сигнала на трёх элементах (И, ИЛИ, НЕ - Т=3 ).
Проведя минимизацию соответствующих выражений, получим
P |
a b |
a P |
b P |
i 1 |
i i |
i i |
i i |
; |
S |
|
i
a b P a P |
1 |
b P |
1 |
P |
1 |
P. |
|
i i i |
i i |
i i |
i |
i |
|||
Время формирования суммы двух n-разрядных чисел во втором сумматоре соответственно равно Тn = 5n , где 5 – время прохождения сигнала в одном сумматоре. Несмотря на увеличение времени суммирования, вторая схема, более предпочтительна при реализации, особенно на ПЛИС, в связи с уменьшением
числа входов на элементах И.
Дальнейшее снижение времени суммирования в полном сумматоре возможно за счёт сокращения времени пробега переноса, т.е. замены
последовательного переноса на параллельный перенос. С этой целью, как уже
было сказано выше, отдельные разряды слагаемых объединяются в произвольные группы [4], начиная со старших разрядов. Число разрядов в группе может быть произвольным. В нашем случае слагаемые, содержащие 24
бита, разбиты на 6 групп по 4 бита каждая: 10 – (1 – 4), 11– (5 – 8), 12 – (9-12), 13–
(12 – 16), 14– (16 – 20), 15– (21 – 24). В скобках указаны номера разрядов,
старшие разряды начинаются с единицы.
В каждой группе формируются вспомогательные функции, которые являются соответственно переносом (Pi), возникающим в i-м разряде, и
функцией распространения переноса через разряд (Ri). Соответственно
89
обозначение Pi-j говорит о переносе через группу (i-j) разрядов, а Ri-j – о
разрешении переноса через группу разрядов (i-j). Понятно, что перенос в разряде формируется, если оба числа содержат единицу в этом разряде, т.е. Pi = ai&ci, а
разрешение переноса возможно, если функция |
R a c |
a c a c |
равна |
|||
i |
i |
i |
i i |
i i |
||
единицы. Нетрудно увидеть, что данные функции образуют двухвходовой сумматор. Групповые сигналы P и R вырабатываются из разрядных сигналов.
В рассматриваемой структуре выполняются следующие условия:
а) размерность группы формирования переносов совпадает с размерностью групп формирования функций Р и R;
б) схемы формирования переносов и функций Р, R имеют многоярусную структуру;
в) в любом ярусе нет пересекающихся групп;
г) на каждом ярусе группы имеют разную размерность, но внутри яруса все группы одинаковы;
д) на нижнем ярусе имеется только одна группа, охватывающая все разряды;
е) внутри яруса все выходные сигналы вырабатываются параллельно.
Рассмотрим схему сумматора на 24 разряда. Первый слой формирует, как и в первом случае, соответственно функции Р и R – каждого разряда (рис. 2.22).
Так как на уровне формирования суммы также используются эти сигналы, то общая схема выглядит следующим образом.
x1 x2
+
1 |
& 1 |
1 &
x1x2 v x1x2
Ri
&
Рi
Рис. 2.20
90
