Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Инженерно-технологическая академия ЮФУ

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Книги / Книга Проектирование ВПОВС (часть 2)

.pdf

Скачиваний:

Добавлен:

01.06.2015

Размер:

4.62 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2829 / 3629 30 31 32 33 34 35 36 > Следующая >>>

Устройство формирования значения функций работает следующим образом. Вначале определяется исходный аргумент как произведение аргумента на себя. Это осуществляется на умножителе 1. После получения аргумента

формируется 4 переменных вида

x		2
				.
a	a
			i	1
i

Так как они представлены в форме

произведения периодов, как это было показано в табл. 4.7, то для этого используется 4 умножителя (см. рис. 4.11). Вначале переменная x2 поступает на сдвигатель, где осуществляется одноразовая операция сдвига на 2-k. Полученное значение с выхода сдвигателя поступает на первый вход умножителя, на второй вход которого поступает период. После получения первого произведения оно поступает на полный сдвигатель 2 и одновременно записывается в накапливающий сумматор. Затем последовательно осуществляется сдвиг на период (как это описывалось выше) и результаты суммируются в накапливающем сумматоре. После окончания сдвигов в сумматорах получаются все четыре дроби, входящие в итеративный цикл.

Затем на входной умножитель поступают значения произведения с накапливающего сумматора 1, на второй вход которого поступает Ui. Соответственно на четвёртый умножитель поступают значения накапливающего сумматора 3 и формируется текущее значение результата. Затем результат умножается на значение, хранимое во втором сумматоре, и далее формируется окончательное значение умножением произведения хранимого в умножителе 1 на значение, полученное в накапливающем сумматоре 4. Окончательный результат формируется в накапливающем сумматоре 4. Общее время равно 5 умножениям.

Таким образом, сформирована организация операционных средств суммирования, сдвига и умножения на период в коде «опережающий перенос», позволяющая перейти к построению аппаратных подпрограмм реализации функций, входящих в алгоритмы систем высокоточного определения угловых координат объектов. Дальнейшие исследования направлены на организацию ВС и повышение её производительности за счет дальнейшего совершенствования операционных узлов для реализации операции умножения.

281

5. РАЗРАБОТКА И ИССЛЕДОВАНИЕ АРХИТЕКТУР

ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ПРОБЛЕМНО-ОРИЕНТИРОВАННЫХ

ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ

Разработанные в предыдущем разделе методы выполнения операций по реализации функциональных зависимостей и выполнения операций суммирования и умножения для операндов стандартных форматов и операндов с неограниченной разрядностью (полями). Однако данный набор операций хотя и является полным, но при реализации сложных операций не обеспечивает требуемую скорость обработки данных. К таким операциям относятся операции интегрирования и дифференцирования одной переменной, обобщенного интегрирования, раздельного дифференцирования производных высокого порядка, реализация сеточных алгоритмов и других, которые собственно и составляют теоретическую основу построения цифровых высокопроизводи-

тельных систем, отличающихся высоким уровнем распараллеливания вычислительного процесса. Однако полнота использования всех возможностей,

представляемых разработанной алгоритмической базой, во многом зависит от того, насколько сама структура системы приспособлена к параллельным вычислениям и, кроме того, насколько данная система допускает работу с переменными произвольной разрядности.

В связи с чем в настоящем разделе рассматриваются вопросы проектирования как нижних, так и верхних уровней системы, позволяющие реализовать перечисленные выше операции. При этом основное внимание уделено возможности высокопроизводительных ПОВС воспроизводить параллельные вычисления при тех или иных конструктивных ограничениях,

возможность совмещения выполнения операций, возможность работы с переменной разрядностью, а также формированию основных архитектурных признаков системы.

282

5.1. Синтез операционного элемента

Реализация крупных операций с совмещением простых операций типа интегрирования и дифференцирования, вычисление функций и интегрирование,

а также других аналогичных операций не вызывает принципиальных затруднений. Достаточно каждой операции, входящей в реализуемый алгоритм,

поставить в соответствие узел, выполняющий эту операцию. Однако, как показано ниже, для одной и той же операции возможно использование нескольких типов формул ("левые", "правые", "симметричные") того или иного порядка точности. Каждый тип формулы или все типы могут использоваться при решении той или иной конкретной задачи. Поэтому необходимо чтобы решающий элемент мог реализовать весь набор алгоритмов и формул. Это могут быть формулы первого или второго (и при возможности произвольного) порядка точности, сложные многофункциональные вычисления и так далее. Для реализации сложных многофункциональных вычислений на предлагаемых структурах преобразуем, указанный круг формул так, чтобы их вид был одинаков и не изменялся при переходе с одного типа формулы на другой.

Аналогично также при переходе от одного порядка точности к другому. Для формул первого порядка точности это преобразование выполняется достаточно просто.

Пусть задана «правая» формула численного интегрирования:

Z pq(i

p ypxl p

1) j			p yp	t x p yq(i 1)( jr p )
1) j			x p		x p
			l		r
	p yp(i 1) j				t xl p ypi( je p )
		x p			x p
			l		r

(5.1)

Для упрощения записи индексы (i, j), относящиеся к точке (ti Xj)

опускаются.

283

Приведем формулу (5.1) к виду

Z		A		B	,
	pq(i 1) j	x		x
			p		p


		l		l

(5.2)

где	A A	p	y	pi( je 1)	(2	p	1) y	pij	,
	n

B B

q(i 1)(

jr 1)

qi( jr 1)

1) y

q(i 1) jr

1) y

qijr

0,1 ,

0,1

Изменение типа формулы численного интегрирования приводит только к изменению схемы формирования операндов А и В. Соответственно для «левой»

формулы

B B

q(i 1) jr

qijr

qi( jr 1)

«симметричной»:

q( j 1)( jr 1)

) y

pi( j

pij

pi( j

B B

) y

q(i 1)( j

q(i

1)(

q(i 1) j

) y

qi( j

qij

Для формулы второго порядка точности эта процедура несколько усложняется. Рассмотрим «правую» формулу численного интегрирования:

p(i 1) j

q(i 1) j

pq(i 1) j

p(i 1) j

q(i 1) j

(5.3)

Формула численного интегрирования (5.3) не приводится к записи в виде выражения (5.2). Чтобы это можно было сделать, добавим в формулу (5.3)

величину

x p yp(i 1)(

)

x p yq(i 1)(

)

2 xl p

xr q

284

При этом, хотя вид формулы изменятся, порядок погрешности сохраняется, так как порядок точности добавляемого члена сравним с порядком погрешности. Тогда выражения для А и В имеют вид:

A A

p(i 1)( j

yqi( j 1)

(2 p 1)

yp(i 1) j

B B2

q(i 1)( jr 1)

qi( jr

q(i 1)( jr 1)

q(i 1) j

1) y					p	y
					p
		pij		2			p(i 1)( j	1)
				2			e
							e
	(2 p		1)	ypij			;

		2
		2				e
						e

(2 q 1) yq(i 1) jr (2 q 1) yqij

		q	y
q(i 1)( jr 1)				qi( jr 1)
	2

	y			q	y		.
q		qij				qi( jr 1)
			2

Аналогичным образом можно преобразовать к виду (5.2) «левые» и «симметричные» формулы численного интегрирования второго порядка точности, а также симметричные формулы второго порядка точности с производными по пространственным переменным второго порядка.

Следовательно, общим выражением для всех формул будет оператор

Z (A : C) (B : D),		(5.4)
где А, В – входные операции, C xl p ( p		D xr q ( q		.
	0,2)		0,2)

Входные операции А и В имеют вид:

B		B	y	(i K 1)( j S 1)	A		A	y		.	(5.5)
		KS					KS	(i K 1)(	j S 1)

	K ,S 0					K ,S 0
Операнды В и D в рассматриваемом случае представляются степенями
переменных xl и	xr	соответственно. Однако для расширения возможностей

они могут иметь и более сложный вид, например (5.5). В зависимости от того,

каким образом задаются операнды А, В, С, D, можно выполнить довольно

285

большое число различных операций.

Задание всех операторов позволяет реализовать обобщенную операцию

интегрирования в целом. Задавая то или иное значение		p	или		q , можно

реализовать одну из разновидностей операции обобщенного интегрирования или

других операций. Например, положив

получим

возможность

выполнить операцию деления. Если же положить оба оператора

, то

реализуется операция интегрирования по Стилтьесу. В то же время, если А = С

= 1 и		q	1	, то реализуется операция дифференцирования. Перечисленные

выше операции относятся к дифференциальным. Однако на предложенном ПЭ можно выполнять и арифметические операции над числами. Для этого достаточно сопоставить каждому оператору число и задать необходимую структуру. Действительно, если же положить B = D = 1, а операндам А и С

поставить в соответствие некоторые числа, то будет выполняться операция деления двух чисел. При C = D = 1, A, B – числа, выполняется операция умножения. Если положить В = C = В = 1, то реализуется операция сум-

мирование с одновременным умножением на коэффициенты и т.д.

Наряду с алгоритмом (5.4) для повышения точности следует использовать алгоритм, оперирующий с приращениями. Как нетрудно увидеть

это позволяет существенно снизить погрешность квантования:

t Z t A : C t B : D OZi

t A AKS t y(i K 1)( j S 1) , t B BKS y(i K 1)( j S 1) ,
		K ,S 0				K ,S 0	.
		K ,S 0				K ,S 0

t Z	Q t Z ,
O		q		Z ,
O		q		Z ,
Z (i 1)			t
Q 111...1			000...0,		q 000...0,	111...1, n m1 m2
		m1		m2	m1	m2

Как видим, алгоритмы (5.4) и (5.6) по форме практически одинаковы и отличаются лишь наличием операции квантования и накопления остатка. Оба

286

алгоритма требуют в максимальном случае выполнения двух операций деления,

операции умножения, а также операций по формированию операндов А и В. При этом каждая операция может выполнять но микропрограмме на одном или нескольких микропроцессорах: (МП), аппаратно или аппаратномикропрограмно,

когда часть операций выполняется по микропрограмме, а часть – аппаратно.

В результате можно выделить следующие направления в построении процессорных элементов ориентированных на выполнение крупных операций:

-микропрограммный на одном МП – СМПЭ (сосредоточенным микро-

программный процессорный элемент;

-то же, но на нескольких МП – РМПЭ (распределённый микропрограммный процессорный элемент);

-процессорный элемент с аппаратным выполнением операций (АПЭ);

-процессорный элемент с аппаратно-микропрограммым выполнением

оперший (АМПЭ).

Для обоснования выбора типа ПЭ необходимо произвести сравнение их по основным структурным и функциональным признакам. Для сравнения различных устройств вычислительной техники принято использовать такие качественные параметры, как производительность, точность вычислений,

аппаратурная сложность, стоимость, потребляемая мощность, надежность и т.д.

Интегральная оценка по всем параметрам является сложной задачей, требующей детальной проработки как систем в целом, так и отдельных её узлов. Поэтому для облегчения синтеза его проводят в несколько итерационных этапов. На первом этапе число параметров ограничивают только такими, которые оказывают определяющее влияние на основные характеристики. На втором этапе изучается влияние принятых решений на значение интегральных параметров. Если при этом интегральные параметры не удовлетворят принятым ограничениям, то осуществляется возврат на первый этап и уточнение тех или иных технических решений.

Как правило, в случае проектирования мобильных систем моделирования

287

всегда, основными показателями являются производительность, аппаратурная сложность, надежность и потребляемая мощность. С наибольшей достоверностью на первом этапе можно оценить первые два параметра, которые и участвуют в оценке эффективности того или иного процессорного элемента.

Структура ПЭ с микропрограммным управлением приведена на рис. 5.1. Здесь введены следующие обозначения:

1.БОД – блок обработки данных.

2.БУП – блок управления программой.

3.ПК – память команд, ПД - память данных.

4.ПМК – память микрокоманд.

5.БМУ – блок микропрограммного управления.

6.ДШКОП – дешифратор кода операции.

7.Рг МК, Рг К, Рг АК, Рг Д, Рг АД – регистры микрокоманд, команд,

адреса команды, данных, адреса данных.

Шина команд ШК [31:0]

Pr K1

КОП

ДШ КОП

ПК

БУП

Рг АК

БМУ

ПМК

СТ БОД

Рг D1 ПД Рг D2

Рг МК

B ДА

ДB

Рг АД

Шина данных ШД [15:0]

Упр. сигналы на все узловые пр-ры

Рис. 5.1

288

Структурная схема ПЭ с последовательно-микропрограммным выполнением макроопераций.

Основу его составляет блок обработки данных, где выполняются все основные операции ПЭ. Перечень операций, выполняемых при выполнении того или иного алгоритма интегро-дифференцирования, приведены в табл. 5.1.

Каждый из этих алгоритмов преобразуется либо в микропрограммы, которые заносятся в память микрокоманд и вызываются затем по коду операции, либо реализуются аппаратно. Сложность и объем микропрограммы для одного и того же алгоритма зависят от количества и типа микрокоманд, выполняемых в центральном микропроцессоре (ЦМП). Построение микропрограммы по известному алгоритму не является технически сложной задачей, поэтому она здесь не приводится.

Для уменьшения времени выполнения микропрограммы она может быть распределена на несколько МП. Распределенный процессорный элемент с параллельно-микропрограммным выполнением операций отличается от последовательного только наличием дополнительного блока обработки данных.

Алгоритм обобщенного интегрирования может быть реализован структурно, на основе аппаратного выполнения макроопераций. Схема такого ПЭ приведена на рис 5.2. Она реализует алгоритм наиболее сложной формулы обобщенного интегрирования. Переход с операции на операцию здесь осуществляется за счет изменения набора коэффициентов, записанных в постоянное запоминающее устройство (ПЗУ) коэффициентов. Код операции,

поступающий на ПЗУ коэффициентов, является адресом ячеек, где хранятся соответствующие данной операции коэффициенты. Нетрудно увидеть, что независимо от типа операции время выполнения каждой из них остается неизменным. Это обстоятельство является решающим при выборе элемента для построения систем с синхронным управлением.

289

Таблица 5.1

289

Наименование макроопераций

Мнемо

Алгоритмы выполнения

Арифме-

Сложе-

Умно- ДелеКол-

код

тические

ние,

жение ние

во

сдвиги

Вычи-

тание

/ x

1. Дифференцирование (1-й

1, j

i, j 1

i, j

Диф1

порядок частной производной)

i 1, j

i, j

j 1,i

2. Дифференцирование (2-й

2 U

/( x)

Диф2

i 1, j

i, j 1

i, j

i, j 1

порядок частной производной)

i 1, j

i, j

1, j

3. Интегрирование

i 1, j

i, j

0,5

i, j

i 1

(формула трапеций)

ИНТТ

i 1

i 1 j

i 1

i, j

yi 1, j

yi, j

yi 1, j

4. Интегрирование

(формулa парабол)


2
		i, j				i,
y					i, j
	i 1, j				i, j
y	i 1, j		S	i 1 j
	i 1, j			i 1 j
y			y
i 1, j				i, j

j			i 1, j					t
j			i 1, j
	0,5					2
	0,5			i, j		(5 /12)	i, j		i 1
				i, j			i, j		i 1
y	i 1, j	S			i, j
	i 1, j				i, j
y
	i 1, j

290

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2829 / 3629 30 31 32 33 34 35 36 > Следующая >>>

Соседние файлы в папке Книги

#
01.06.20154.62 Mб88Книга Проектирование ВПОВС (часть 2).pdf
#
01.06.201536.23 Mб99ПРОЕКТИРОВАНИЕ ПОВС (последнее).doc
#
01.06.201538.01 Mб111ПРОЕКТИРОВАНИЕ ПОВС (последнее)2.doc