Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Инженерно-технологическая академия ЮФУ

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Книги / Книга Проектирование ВПОВС (часть 2)

.pdf

Скачиваний:

Добавлен:

01.06.2015

Размер:

4.62 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3233 / 3633 34 35 36 > Следующая >>>

Здесь предполагается, что используется 4-разрядный регистр. Таким образом, общее число корпусов, необходимых для построения многовходового

сумматора, равно

N
K N

	4 ЦЕЛ

. Время сложения

log

ЦЕЛ

при условии, что

– задержка сигнала в схеме совпадения.

В качестве примера рассмотрим случай N = 11. Число корпусов,

необходимых для построения сумматора, равно K = 13 , время суммирования

одного разряда	t		8	cn	160 нсек 80 нсек.

Как видим, сумматор оказывается достаточно громоздким и

медленнодействующим устройством.

Существенного снижения объема оборудования и времени суммирования можно достичь, если использовать для построения сумматора постоянные запоминавшие устройства (ПЗУ). При построении сумматора поступим следующим образом. В каждую ячейку ПЗУ будем записывать сумму единиц, входящих в адрес ячейки. В качестве примера рассмотрим сумматор на

4 входа. В ПЗУ по адресами заносится следующая информация:

	Таблица 5.1
	Работа сумматора
Адрес.	Содержимое ячейки

x	0

x	2	x	3

0		0
0		0
0		0

1	0
1	0
1	0
0	1

p0i

p	i	S
			0
1
0		0
0		1
0		1
0		0
0		1
0		0
0		0
0		1
0		1

	p	i 1
	p	0
		0

p1i 1

321

Схема такого сумматора покатана на рис. 5.24.

x	0
	0
x	1		S
	1		S
			0
x	2
	2
x	3		ПЗУ
	3
			(РЕ)
		P	P0	D0
		P
		0		RG
				RG
		P	P1	D1
		P
		1

Рис. 5.24

Он содержит ПЗУ и регистр переноса. Количество корпусов равно двум,

а время суммирования – времени считывания из ПЗУ. В [160] указывается, что при использовании ЭСЛ-технологии и диодов Шоттки время считывания может быть доведено до 10 нс. В настоящее время разработаны и выпускаются ПЗУ с временем считывания 30 нс. Таким образом, время суммирования 4-сумматора равно t = 30 нс + 10 нс. Для аналогичного сумматора эта цифра лежит в пределах 120 нс + 60 нс. Однако в сумматоре на ПЗУ нет управления входной информацией, как это сделано в сумматоре на рис. 5.23. Такое управление можно осуществить с помощью схем совпадения. Но в целом такой путь оказывается не эффективным.

Во-первых, растет число корпусов, так как из-за ограничения числа входов и выходов у микросхем количество схем совпадения в корпусе незначительно (обычно 4 двухвходовые схемы совпадения).

Во-вторых, увеличивается число слоев, через которые проходит сигнал и, следовательно, растет время суммирования.

Будем осуществлять управление входами непосредственно в ПЗУ, Для этого добавим в адрес чисто бит, равное числу входов сумматора y0 , y1 ,...ym .

Каждому информационному входу xi поставим в соответствие управляющий

322

вход yi следующим образом. Если yi 1, то во всех ячейках, в адреса которых xi входит как единица, она участвует в образовании суммы, если yi = 0, то переменная xi исключается из образования суммы во всех адресах, куда yi

входит как нуль. На рис. 5.25 изображен сумматор с управлением входной информацией. В ПЗУ записаны 16 таблиц типа табл. 5.1.

Здесь укажем, что большей частью объем ПЗУ ограничен. Обычно

x j используются ПЗУ объемом 256 х 4 или 256 х 8. Поэтому увеличение

j 1

числа входов сумматора требует увеличения числа ПЗУ. Например, при N = II

объем ПЗУ равен (222 х 4) бит, для построения которого необходимо 214 ПЗУ объемом (28 х 4) бит. Ясно, что метод формирования полной адресности ПЗУ неприемлем.

Используем два типа сумматоров на ПЗУ. В первом ПЗУ записана таблица для суммы единиц адреса, имеющих равные веса, здесь же осуществляется управление входной информацией. Во втором ПЗУ записана таблица суммы разрядов, как имеющих равные веса, так и разрядов, имеющих разные веса. Без единицы адреса определяются положением в адресе. На рис. 5.26 показана схема одиннадцати-входового сумматора. Постоянные запоминающие устройства 1, 2, 3 используются для суммирования одноименных разрядов и управления входной информацией. Соответственно ПЗУ4 и ПЗУ5 используются для суммирования разрядов с разными весами.

Веса разрядов представлены в поле ПЗУ на рис. 5.27. На рис. 5.28 показано обозначение N-входового сумматора. Рассматриваемый сумматор требует 5

корпусов ПЗУ и один корпус регистра, т. е. расход оборудования сокращается более чем в два раза по сравнению с сумматором на комбинационных сумматорах. При использовании ПЗУ объемом (2048 х 8) требуется всего два слоя ПЗУ, а их число уменьшается до четырех. Время суммирования одного разряда всех чисел равно t = 90 30 нс /(60 – 20 нс. )

N-входовой сумматор и его условное обозначение показан на рис. 5.27.

323

z1 z2 z3 z4

y0 y1 y2 y3

z5 z6 z7 z8

y4 y5 y6 y7

z9 z10 z11

y8 y9 y10

x	0		2		2
	0
x		2		2
x	1	2		2			3		3
	1
x						2		2
x	2					2		2
x	3	ПЗУ1	1		1					P3
y0		2	1	2	1
y0		2		2			2		2
y1						2	2	2	2
y1			0		0	2		2
y2		2	0	2	0
y2		2		2
y3							1		1	P2
						2	1	2	1
						2		2
x	0		2		2		0		0
	0
x1		2		2		2		2		P1
x1		2		2		2		2		P1
x	2
	2	ПЗУ2				ПЗУ4				ПЗУ5
x	3	ПЗУ2	1		1	ПЗУ4				ПЗУ5
y0		2	1	2	1
y0		2		2
y1			0							P0
y2		2	0	2	0
y2		2		2
y	3
	3
										S
										0
x	0								3
	0
x								2
x	1							2
	1
x	2								2
x		ПЗУ3						2	2
x	3	ПЗУ3	1		1			2
y0		2	1	2	1
y0		2		2					1
y1								2	1
y1			0		0			2
y2		2	0	2	0
y2		2		2					0
								2	0
								2
P
3
P
2
P
1
P
0

Рис. 5.26

... ...

x
0
x1	S0
x
2

...
x
10
y		P	0
y1
	0
		P	1
			1
y
10
P	0	P	2
	0		2
P	1
	1
P	2	P	3
	2		3
P	3
	3

		P
D		0
0
		P
D		1
1
	RG	P
		P
D		2
2
		P
D		3
3

Рис. 5. 27

N-входовой параллельный сумматор на ПЗУ показан на рис. 5.28.

324

325

				S	1																S	2
					1																	2
		S		0						P	3	P	2	P	1	P	0		S		0							P	3	P	2	P	P	0
				0							3		2		1		0				0								3		2	1		0

P	3	P	2	P		P	0	y0	y1 ...	y10		x0		x1		...	x10	P	P	2	P		1	P	0	y0	y1 ...	y10		x0		x1	...	x10
	3		2		1		0											3		2			1		0
									...						...												...					...
									Y																		Y
		Управление													X1																	X2
		коммутацией													X1																	X2
		коммутацией
																												Разряды операндов

...

y1 ...

y10

...

x10

...

Рис. 5.28

325

Невысокая сложность многовходового сумматора на ПЗУ позволяет его использовать и при параллельно-параллельном методе коммутации (1-Й метод).

Схема N-входового параллельного сумматора показана на рис. 5.28. Все ПЗУ

первого и второго слоя каждого разряда срабатывают одновременно, так как не зависят друг от друга.

Перенос, сформированный в младшем разряде, пробегает только через одно ПЗУ в каждом разряде. Время суммирования в таком сумматоре равно

n p 2			cr ,	где n – разрядность чисел, Р – число слоев ПЗУ в сумматоре. При

n = 16,		cr	10		нс,	p 3	t	170 нсек.

	Общая			архитектура				двухмерного ПЭ, учитывающая все особенности

алгоритма, показана на рис. 5.29. Процессорный элемент включает схему умножения, осуществляющую перемножение операторов А и В/Д, арифметико-

логическое устройство САЛУ), которое настроено на выполнение операций накопления (суммирования), выделение остатка и формирования приращения

(логическое умножение), блок деления, выполнявший операцию деления (В/Д),

и блоки формирования операторов А и Б. Шинные интерфейсы на выходе АЛУ1 использованы дня согласования выхода AЛУ с шинами связи узловых процессоров.

Особенностью вычислительного процесса в интегродифференци-

рующих системах с узловым распараллеливанием и структурным программ-

мированием является распределение команд и данных по решающим элементам узлового процессора и синхронный характер вычислений. Следует отметить,

что на весь период решения ПЭ настраивается на выполнение только одной

операции, а само решение ведется да шагам. Число шагов (N) зависит от

		T
интервала решения Т и величины шага интегрирования:	t N		.

		t
Двухмерный ПЭ показан на рис. 5.29.

326

ПЗУ МК

Устройство

			“Н”
		К внутренним	шинам обмена
управления	АЛУ-1
управления	накопитнль, квантователь
	накопитнль, квантователь
	Схема	К внутренним	шине
	Схема
	умножений-1
	АЛУ-2

				Инт-с		Инт-с	Схема
МУУ	ПЗУ 1	УМН-2		обмена по xl		обмена по xr	формирования
							входного
							оператора АУq j
ПЗУ 2	УМН 3		Рг. 1
							“Н”
Рг. 1			Многовходовой
Рг. 1			сумматор
			сумматор				a
“D”							К внешним шинам
	Блок деления – 1				ПЗУ		К внешним шинам
	Блок деления – 1		Группа схем		ПЗУ		обмена
					коэф.		обмена

			умножений
			умножений		AKS
					AKS
	Рг. j+2				Рг. j-1
«Запись»						«Запись»
	j+2					j-1
«Данные» xl						«Данные» xl	xl
xl							xl
xl
	Рг. j+1				Рг. j-2
«Запись»			Рг. Yq			«Запись»
	j+2		Рг. Yq			j-2	Система форми-
	j+2					j-2	Система форми-
	«Данные» xr			«Данные» xr		«Данные»	рования входного
	«Данные» xl			«Данные» xr			рования входного
							оператора BYP

		y0, y1,... yn,		x0, x1,… xn
			…	…			“Н” ПЭ
							“Н” ПЭ
выбор					к шинам узлового процессора
магистрали xl, xr					к шинам узлового процессора
магистрали xl, xr						выбор магистрали xl, xr
						выбор магистрали xl, xr
		КОП а0qk		аpk

Рг. команды

Рис. 5.29

327

Каждый новый шаг начинается только в том случае, если все ПЭ узлового процессора завершили свою работу, поэтому желательно, чтобы время работы ГО не зависело от типа операции. Этому требованию удовлетворяет ПЭ с аппаратным выполнением команд. Циклограмма работы системы состоит из повторяющейся серии сигналов. Число сигналов равно числу шагов интегрирования (N), а каждый сигнал состоит из двух циклов. Первый цикл соответствует времени выполнения операции в ПЭ и его длительность равна

p , где

p		on

нормирующий множитель, – длительность нормированного

такта. Второй цикл соответствует времени обмена и его длительность равна n ,

где п – разрядность передаваемых данных. Следовательно, длительность машинного шага интегрирования равна

T (n p) .

При реализации операции обобщенного интегрирования каждой операции алгоритма поставлен в соответствие свой блок. Операции суммирования, накопления и квантования выполняются на АЛУ, умножение – на специальной матричной схеме. В табл. 5.2 приведены известные автору интегральные микросхемы, которые могут быть использованы при построении обобщенного цифрового интегратора [183, 184,185]. Наиболее сложной и длительной операцией является операция деления, В работах [73. 9, 73.21]

рассматриваются различные варианты построения быстродействующих схем деления. Оптимальной в данном случае является схема, основанная на формировании обратной величины операнда Д (1/Д), с последующим умножением ее на числитель. Это решение следует, прежде всего, из того, что в большинстве случаев решение осуществляется на равномерных или неравномерных сетках, расстояние между соседними точками которых не изменяется при решении, что позволяет вычислить величину 1/Д во время загрузки, сохраняя её значение в процессе решения неизменным.

328

Таблица 5.2

Обозначение	Наименование ИС		Разряд-	Возможность	Длитель-
Обозначение	Наименование ИС		ность	расширения	ность
			ность	расширения	такта. ИС
					такта. ИС
КР58СИК80	ЦПЭ параллельной	обр-	S	-	400
	ботки данных		S	-	400
	ботки данных

КР582ЙК/(2)	Микропроцессор		4		1700
КР583ИКЗ	Микропроцессор		8		1000

КР584ИМ (Б)	Микропроцессор		4		2000
			4		2000

KP58SBC2	Арифметико-логическое		16		1000
	устройство		16		1000
	устройство

КР589Щ32	Центральный процессорный
	элемент		2		100
	элемент

КР180ШС1	Арифметико-логическое
	Устройство		4	+	28

KPI802BCI	Арифметическое		8		200
	устройство		8		200
	устройство

KPI804BCI	Микропроцессорная секция		4		125
			4		125

KPI802BP2	Последовательный		&8		200
	умножитель/делитель		&8		200
	умножитель/делитель

KFI8G2BP3	Параллельный умножитель		8x8		100
			8x8		100

KPI8Q2BP4	-		12x12		110
			12x12		110

KPI802BP5	-		16x16		130
			16x16		130

KHI8O4BP6	-		24x24		130

KPI804BP7	-		32x32		210

В большинстве случаев решение осуществляется на равномерных или неравномерных сетках, расстояние между соседними точками которых не изменяется при решении, что позволяет вычислить величину 1/Д во время загрузки, сохраняя её значение в процессе решения неизменным. Если же решение осуществляется на подвижных сетках, расстояние между соседними точками которых изменяется в зависимости от номера шага интегрирования, то

329

j 2, j 1, j 1, j 2

при вводе данных находится начальное значение D0 , а в процессе решения

производится уточнение по приращению

Di 1

, где Di – значение

D в прошлом шаге, Di+1	– значение D текущем шаге. Начальный расчет	1
		D
			0

его последующее уточнение выполняются по одному и тому же алгоритму:

	1		1
	D		D
	D		D
			i

		2
		D
		D
		i 1

Для начального расчета Di – есть старшие т разрядов числа D, а

Di 1 (n m) – младшие разряды числа. В начальный момент времени 1/Di, (1/Di)2 выбирается соответственно из ПЗУ1 и ПЗУ2, а в дальнейшем (1/Di)2

формируется на умножителе УМН2. Относительная точность вычисления обратной величины оказывается не меньше чем 2-16. При работе с большей разрядной сеткой можно использовать следующий алгоритм:

1 D*i 1

i 1

1 D

i 1

D i 1





	D
	D
	i 1

Несмотря на то, что для отыскания обратной величины требуется выполнить по две операции умножения и сложения, на общее время работы ПЭ это не оказывает влияния, так как они совмещаются по времени с вычислением приращения и формированием оператора В. При передаче данных последовательным кодом, определение 1/D можно веста на традиционных параллельно-последовательных делительных устройствах, время работы которых равно n , т.е. фактически совпадает с временем передачи данных.

Вычисление входных операторов А и Б осуществляется следующим образом. Информация из регистров и регистра Yq (Yp )

поступает на группу схем умножений. Число схем умножения равно количеству

330

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3233 / 3633 34 35 36 > Следующая >>>

Соседние файлы в папке Книги

#
01.06.20154.62 Mб88Книга Проектирование ВПОВС (часть 2).pdf
#
01.06.201536.23 Mб99ПРОЕКТИРОВАНИЕ ПОВС (последнее).doc
#
01.06.201538.01 Mб111ПРОЕКТИРОВАНИЕ ПОВС (последнее)2.doc