Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Книги / Книга Проектирование ВПОВС (часть 2)

.pdf
Скачиваний:
84
Добавлен:
01.06.2015
Размер:
4.62 Mб
Скачать

Здесь предполагается, что используется 4-разрядный регистр. Таким образом, общее число корпусов, необходимых для построения многовходового

сумматора, равно

N

K N

 

 

 

4 ЦЕЛ

1

. Время сложения

 

t

 

log

2

N

 

 

 

 

cn

log

2

N

4

 

 

 

 

 

 

 

ЦЕЛ

 

 

 

ЦЕЛ

 

при условии, что

 

 

4

cn

,

 

cn

– задержка сигнала в схеме совпадения.

 

 

 

 

 

В качестве примера рассмотрим случай N = 11. Число корпусов,

необходимых для построения сумматора, равно K = 13 , время суммирования

одного разряда

t

 

8

cn

160 нсек 80 нсек.

 

 

 

Как видим, сумматор оказывается достаточно громоздким и

медленнодействующим устройством.

Существенного снижения объема оборудования и времени суммирования можно достичь, если использовать для построения сумматора постоянные запоминавшие устройства (ПЗУ). При построении сумматора поступим следующим образом. В каждую ячейку ПЗУ будем записывать сумму единиц, входящих в адрес ячейки. В качестве примера рассмотрим сумматор на

4 входа. В ПЗУ по адресами заносится следующая информация:

 

Таблица 5.1

 

Работа сумматора

Адрес.

Содержимое ячейки

x

0

 

0

1

0

1

0

1

0

1

0

1

1

x1

0

0

1

1

0

0

1

1

0

0

1

x

2

x

3

 

 

0

0

0

0

0

0

00

10

1

0

1

0

1

0

0

1

01

11

p0i

0

0

0

0

0

0

0

0

0

0

1

p

i

S

 

 

0

1

 

0

 

0

0

 

1

0

 

1

0

 

0

0

 

1

0

 

0

0

 

0

0

 

1

0

 

1

00

10

p

i 1

0

 

0

0

0

1

0

1

1

1

0

1

1

p1i 1

0

0

0

0

0

0

0

0

0

0

1

321

Схема такого сумматора покатана на рис. 5.24.

x

0

 

 

 

 

 

 

 

x

1

 

S

 

 

 

 

 

 

 

0

 

x

2

 

 

 

 

 

 

 

x

3

 

ПЗУ

 

 

 

 

 

 

 

 

(РЕ)

 

 

 

P

P0

D0

 

 

 

 

 

 

0

 

RG

 

 

 

 

 

 

P

P1

D1

 

 

 

 

 

 

1

 

 

Рис. 5.24

Он содержит ПЗУ и регистр переноса. Количество корпусов равно двум,

а время суммирования – времени считывания из ПЗУ. В [160] указывается, что при использовании ЭСЛ-технологии и диодов Шоттки время считывания может быть доведено до 10 нс. В настоящее время разработаны и выпускаются ПЗУ с временем считывания 30 нс. Таким образом, время суммирования 4-сумматора равно t = 30 нс + 10 нс. Для аналогичного сумматора эта цифра лежит в пределах 120 нс + 60 нс. Однако в сумматоре на ПЗУ нет управления входной информацией, как это сделано в сумматоре на рис. 5.23. Такое управление можно осуществить с помощью схем совпадения. Но в целом такой путь оказывается не эффективным.

Во-первых, растет число корпусов, так как из-за ограничения числа входов и выходов у микросхем количество схем совпадения в корпусе незначительно (обычно 4 двухвходовые схемы совпадения).

Во-вторых, увеличивается число слоев, через которые проходит сигнал и, следовательно, растет время суммирования.

Будем осуществлять управление входами непосредственно в ПЗУ, Для этого добавим в адрес чисто бит, равное числу входов сумматора y0 , y1 ,...ym .

Каждому информационному входу xi поставим в соответствие управляющий

322

вход yi следующим образом. Если yi 1, то во всех ячейках, в адреса которых xi входит как единица, она участвует в образовании суммы, если yi = 0, то переменная xi исключается из образования суммы во всех адресах, куда yi

входит как нуль. На рис. 5.25 изображен сумматор с управлением входной информацией. В ПЗУ записаны 16 таблиц типа табл. 5.1.

Здесь укажем, что большей частью объем ПЗУ ограничен. Обычно

4

x j используются ПЗУ объемом 256 х 4 или 256 х 8. Поэтому увеличение

j 1

числа входов сумматора требует увеличения числа ПЗУ. Например, при N = II

объем ПЗУ равен (222 х 4) бит, для построения которого необходимо 214 ПЗУ объемом (28 х 4) бит. Ясно, что метод формирования полной адресности ПЗУ неприемлем.

Используем два типа сумматоров на ПЗУ. В первом ПЗУ записана таблица для суммы единиц адреса, имеющих равные веса, здесь же осуществляется управление входной информацией. Во втором ПЗУ записана таблица суммы разрядов, как имеющих равные веса, так и разрядов, имеющих разные веса. Без единицы адреса определяются положением в адресе. На рис. 5.26 показана схема одиннадцати-входового сумматора. Постоянные запоминающие устройства 1, 2, 3 используются для суммирования одноименных разрядов и управления входной информацией. Соответственно ПЗУ4 и ПЗУ5 используются для суммирования разрядов с разными весами.

Веса разрядов представлены в поле ПЗУ на рис. 5.27. На рис. 5.28 показано обозначение N-входового сумматора. Рассматриваемый сумматор требует 5

корпусов ПЗУ и один корпус регистра, т. е. расход оборудования сокращается более чем в два раза по сравнению с сумматором на комбинационных сумматорах. При использовании ПЗУ объемом (2048 х 8) требуется всего два слоя ПЗУ, а их число уменьшается до четырех. Время суммирования одного разряда всех чисел равно t = 90 30 нс /(60 – 20 нс. )

N-входовой сумматор и его условное обозначение показан на рис. 5.27.

323

z1 z2 z3 z4

y0 y1 y2 y3

z5 z6 z7 z8

y4 y5 y6 y7

z9 z10 z11

y8 y9 y10

x

0

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

2

2

 

 

 

 

 

1

 

 

 

3

 

3

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

2

2

 

2

 

 

 

 

 

 

 

x

3

ПЗУ1

1

 

1

 

 

 

 

P3

y0

2

2

 

 

 

 

 

 

 

 

2

 

2

 

y1

 

 

 

 

2

2

 

 

0

 

0

 

 

 

y2

2

2

 

 

 

 

 

 

 

 

 

 

 

 

y3

 

 

 

 

 

1

 

1

P2

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

x

0

 

2

 

2

 

0

 

0

 

 

 

 

 

 

 

x1

2

2

2

2

P1

 

 

 

 

x

2

 

 

 

 

 

 

 

 

 

 

ПЗУ2

 

 

 

ПЗУ4

 

 

 

ПЗУ5

x

3

1

 

1

 

 

 

y0

2

2

 

 

 

 

 

 

 

 

 

 

 

 

y1

 

0

 

 

 

 

 

 

P0

y2

2

2

0

 

 

 

 

 

 

 

 

 

 

 

 

y

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

0

x

0

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

2

 

 

 

 

 

 

 

2

 

x

 

ПЗУ3

 

 

 

 

 

2

 

3

1

 

1

 

 

 

 

y0

2

2

 

 

 

 

 

 

 

 

 

 

1

 

y1

 

 

 

 

 

 

2

 

 

0

 

0

 

 

 

 

y2

2

2

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

Рис. 5.26

... ...

x

 

0

 

x1

S0

x

 

2

 

...

 

 

 

 

x

 

 

 

 

10

 

 

 

y

 

 

P

0

y1

 

 

0

 

 

 

 

 

P

1

 

 

 

 

y

 

 

 

 

10

 

 

 

P

0

 

P

2

 

 

 

P

1

 

 

 

 

 

 

 

P

2

 

P

3

 

 

 

P

3

 

 

 

 

 

 

 

 

 

P

D

 

0

0

 

 

 

 

P

D

 

1

1

 

 

 

RG

P

 

 

D

 

2

2

 

 

 

 

P

D

 

3

3

 

 

Рис. 5. 27

N-входовой параллельный сумматор на ПЗУ показан на рис. 5.28.

324

325

 

 

 

 

S

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

0

 

 

 

 

 

P

3

P

2

P

1

P

0

 

S

0

 

 

 

 

 

 

P

3

P

2

P

P

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

3

P

2

P

P

0

y0

y1 ...

y10

x0

 

x1

 

...

x10

P

P

2

P

1

P

0

y0

y1 ...

y10

x0

 

x1

...

x10

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

Управление

 

 

 

 

 

 

X1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X2

 

 

 

коммутацией

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Разряды операндов

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

0

 

 

 

 

P

3

P

P

1

P

0

 

 

 

 

 

 

 

 

n

 

2

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

P

 

P

P

 

y0

y1 ...

y10

x0

x1

 

...

x10

...

 

 

 

 

 

 

3

 

2

1

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xn

 

Рис. 5.28

325

Невысокая сложность многовходового сумматора на ПЗУ позволяет его использовать и при параллельно-параллельном методе коммутации (1-Й метод).

Схема N-входового параллельного сумматора показана на рис. 5.28. Все ПЗУ

первого и второго слоя каждого разряда срабатывают одновременно, так как не зависят друг от друга.

Перенос, сформированный в младшем разряде, пробегает только через одно ПЗУ в каждом разряде. Время суммирования в таком сумматоре равно

n p 2

cr ,

где n – разрядность чисел, Р – число слоев ПЗУ в сумматоре. При

 

 

 

n = 16,

 

cr

10

нс,

p 3

t

170 нсек.

 

 

 

 

 

 

Общая

архитектура

 

двухмерного ПЭ, учитывающая все особенности

алгоритма, показана на рис. 5.29. Процессорный элемент включает схему умножения, осуществляющую перемножение операторов А и В/Д, арифметико-

логическое устройство САЛУ), которое настроено на выполнение операций накопления (суммирования), выделение остатка и формирования приращения

(логическое умножение), блок деления, выполнявший операцию деления (В/Д),

и блоки формирования операторов А и Б. Шинные интерфейсы на выходе АЛУ1 использованы дня согласования выхода AЛУ с шинами связи узловых процессоров.

Особенностью вычислительного процесса в интегродифференци-

рующих системах с узловым распараллеливанием и структурным программ-

мированием является распределение команд и данных по решающим элементам узлового процессора и синхронный характер вычислений. Следует отметить,

что на весь период решения ПЭ настраивается на выполнение только одной

операции, а само решение ведется да шагам. Число шагов (N) зависит от

 

 

T

интервала решения Т и величины шага интегрирования:

t N

 

.

 

 

 

t

Двухмерный ПЭ показан на рис. 5.29.

 

 

 

326

a

ПЗУ МК

Устройство

 

 

 

“Н”

 

 

К внутренним

шинам обмена

управления

АЛУ-1

 

 

накопитнль, квантователь

 

 

 

 

Схема

К внутренним

шине

 

 

 

 

умножений-1

 

 

 

АЛУ-2

 

 

 

 

 

 

Инт-с

Инт-с

Схема

МУУ

ПЗУ 1

УМН-2

обмена по xl

обмена по xr

формирования

 

 

 

 

 

 

 

входного

 

 

 

 

 

 

 

оператора АУq j

ПЗУ 2

УМН 3

 

Рг. 1

 

 

 

 

 

 

 

 

 

 

 

“Н”

Рг. 1

 

 

Многовходовой

 

 

 

 

 

сумматор

 

 

 

 

 

 

 

 

a

“D”

 

 

 

 

 

 

К внешним шинам

 

Блок деления – 1

 

 

ПЗУ

 

 

Группа схем

 

обмена

 

 

 

коэф.

 

 

 

 

 

 

 

 

 

умножений

 

 

 

 

 

AKS

 

 

 

 

 

 

 

 

 

 

Рг. j+2

 

 

 

Рг. j-1

 

«Запись»

 

 

 

 

«Запись»

 

 

j+2

 

 

 

 

j-1

 

«Данные» xl

 

 

 

 

«Данные» xl

xl

xl

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рг. j+1

 

 

 

Рг. j-2

 

«Запись»

 

Рг. Yq

 

«Запись»

 

 

j+2

 

 

j-2

Система форми-

 

 

 

 

 

 

«Данные» xr

«Данные» xr

«Данные»

рования входного

 

«Данные» xl

 

 

 

 

 

 

 

 

 

 

оператора BYP

 

 

 

 

 

 

 

 

 

y0, y1,... yn,

x0, x1,… xn

 

 

 

 

 

 

 

 

“Н” ПЭ

 

 

 

 

 

 

 

выбор

 

 

 

к шинам узлового процессора

магистрали xl, xr

 

 

 

 

 

 

 

выбор магистрали xl, xr

 

 

 

 

 

 

 

 

КОП а0qk

аpk

 

 

 

Рг. команды

Рис. 5.29

327

Каждый новый шаг начинается только в том случае, если все ПЭ узлового процессора завершили свою работу, поэтому желательно, чтобы время работы ГО не зависело от типа операции. Этому требованию удовлетворяет ПЭ с аппаратным выполнением команд. Циклограмма работы системы состоит из повторяющейся серии сигналов. Число сигналов равно числу шагов интегрирования (N), а каждый сигнал состоит из двух циклов. Первый цикл соответствует времени выполнения операции в ПЭ и его длительность равна

p , где

p

 

on

 

 

 

 

 

нормирующий множитель, длительность нормированного

такта. Второй цикл соответствует времени обмена и его длительность равна n ,

где п – разрядность передаваемых данных. Следовательно, длительность машинного шага интегрирования равна

T (n p) .

При реализации операции обобщенного интегрирования каждой операции алгоритма поставлен в соответствие свой блок. Операции суммирования, накопления и квантования выполняются на АЛУ, умножение – на специальной матричной схеме. В табл. 5.2 приведены известные автору интегральные микросхемы, которые могут быть использованы при построении обобщенного цифрового интегратора [183, 184,185]. Наиболее сложной и длительной операцией является операция деления, В работах [73. 9, 73.21]

рассматриваются различные варианты построения быстродействующих схем деления. Оптимальной в данном случае является схема, основанная на формировании обратной величины операнда Д (1/Д), с последующим умножением ее на числитель. Это решение следует, прежде всего, из того, что в большинстве случаев решение осуществляется на равномерных или неравномерных сетках, расстояние между соседними точками которых не изменяется при решении, что позволяет вычислить величину 1/Д во время загрузки, сохраняя её значение в процессе решения неизменным.

328

Таблица 5.2

Обозначение

Наименование ИС

 

Разряд-

Возможность

Длитель-

 

ность

расширения

ность

 

 

 

такта. ИС

 

 

 

 

 

КР58СИК80

ЦПЭ параллельной

обр-

S

-

400

 

ботки данных

 

 

 

 

 

 

 

 

 

 

 

 

КР582ЙК/(2)

Микропроцессор

 

4

 

1700

КР583ИКЗ

Микропроцессор

 

8

 

1000

 

 

 

 

 

 

КР584ИМ (Б)

Микропроцессор

 

4

 

2000

 

 

 

 

 

 

 

 

 

 

KP58SBC2

Арифметико-логическое

 

16

 

1000

 

устройство

 

 

 

 

 

 

 

 

 

 

 

 

КР589Щ32

Центральный процессорный

 

 

 

 

элемент

 

2

 

100

 

 

 

 

 

 

 

 

 

 

 

КР180ШС1

Арифметико-логическое

 

 

 

 

 

Устройство

 

4

+

28

 

 

 

 

 

 

KPI802BCI

Арифметическое

 

8

 

200

 

устройство

 

 

 

 

 

 

 

 

 

 

 

 

KPI804BCI

Микропроцессорная секция

4

 

125

 

 

 

 

 

 

 

 

 

 

KPI802BP2

Последовательный

 

&8

 

200

 

умножитель/делитель

 

 

 

 

 

 

 

 

 

 

 

 

KFI8G2BP3

Параллельный умножитель

8x8

 

100

 

 

 

 

 

 

 

 

 

 

KPI8Q2BP4

-

 

12x12

 

110

 

 

 

 

 

 

 

 

 

 

KPI802BP5

-

 

16x16

 

130

 

 

 

 

 

 

 

 

 

 

KHI8O4BP6

-

 

24x24

 

130

 

 

 

 

 

 

KPI804BP7

-

 

32x32

 

210

 

 

 

 

 

 

В большинстве случаев решение осуществляется на равномерных или неравномерных сетках, расстояние между соседними точками которых не изменяется при решении, что позволяет вычислить величину 1/Д во время загрузки, сохраняя её значение в процессе решения неизменным. Если же решение осуществляется на подвижных сетках, расстояние между соседними точками которых изменяется в зависимости от номера шага интегрирования, то

329

j 2, j 1, j 1, j 2

1

при вводе данных находится начальное значение D0 , а в процессе решения

производится уточнение по приращению

Di 1

Di 1

Di

, где Di – значение

D в прошлом шаге, Di+1

– значение D текущем шаге. Начальный расчет

1

D

 

 

 

0

 

 

 

его последующее уточнение выполняются по одному и тому же алгоритму:

и

1

 

1

D

D

 

 

 

i

1

Di

 

2

D

 

 

i 1

 

 

.

Для начального расчета Di – есть старшие т разрядов числа D, а

Di 1 (n m) – младшие разряды числа. В начальный момент времени 1/Di, (1/Di)2 выбирается соответственно из ПЗУ1 и ПЗУ2, а в дальнейшем (1/Di)2

формируется на умножителе УМН2. Относительная точность вычисления обратной величины оказывается не меньше чем 2-16. При работе с большей разрядной сеткой можно использовать следующий алгоритм:

1 D*i 1

1 D*i 1

 

1

 

 

1

 

2

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

D

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

1

 

1

1

 

*

 

1 D

*

 

*

 

D

 

 

 

 

i 1

 

 

 

 

i 1

 

 

 

 

D i 1

 

D i 1

 

 

 

 

 

 

 

 

D

 

 

i 1

 

 

.

Несмотря на то, что для отыскания обратной величины требуется выполнить по две операции умножения и сложения, на общее время работы ПЭ это не оказывает влияния, так как они совмещаются по времени с вычислением приращения и формированием оператора В. При передаче данных последовательным кодом, определение 1/D можно веста на традиционных параллельно-последовательных делительных устройствах, время работы которых равно n , т.е. фактически совпадает с временем передачи данных.

Вычисление входных операторов А и Б осуществляется следующим образом. Информация из регистров и регистра Yq (Yp )

поступает на группу схем умножений. Число схем умножения равно количеству

330