Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Инженерно-технологическая академия ЮФУ

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Книги / Книга Проектирование ВПОВС (часть 2)

.pdf

Скачиваний:

Добавлен:

01.06.2015

Размер:

4.62 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 2930 / 3630 31 32 33 34 35 36 > Следующая >>>

1	2
5. Интегродифференцирование
(формула трапеций, 1-й порядок
частной производной)	ИДТ1

6. Интегродифференцирование
(формула трапеций, 2-й порядок
частной производной)	ИДТ2

289

7. Интегродифференцирование

(формула парабол, 2-й порядок

частной производной)

ИДП1

291

i, j

0,5

i, j

i 1

i 1, j

i 1 j

i, j

i 1, j

Ui, j 1 Ui, j

/ x

1, j

i 1, j

i, j

i 1, j

i, j

i 1, j

i, j

0,5

i, j

i 1

i 1, j

i 1 j

i, j

i 1, j

/( x)

2 U

i 1, j

i, j 1

i, j

i, j 1

1, j

i 1, j

i, j

i 1, j

i, j

i 1, j

(5 /12) t

0,5

i 1, j

i, j

i j

yi 1, j

Si 1 j

yi 1, j

Si, j

i 1, j

i, j 1

i, j

/( x)

i 1, j

i, j

yi 1, j

yi, j

yi 1, j

i 1, j

i, j

i 1, j

Продолжение табл. 5.1

8. Интегродифференцирование

(формула парабол, 2-й порядок

частной производной)

9. Суммирование приращений

290

0,5

ИДП2

(5 /12)

i 1, j

i, j

i j

1 j

i, j

i 1, j

2 U

/( x)

i 1, j

i, j 1

i 1, j

i, j

1, j

i 1, j

i, j

i 1, j

i, j

i 1, j

СУМП

U i 1, j

yi 1,K

K 1

i 1, j

i, j

i K , j

292

Окончание табл. 5.1

- Р

- P + 2

Для

обобщенным

сравнения

критерием

эффективности

Э	1	,
Э	S

каждого

где S –

из ПЭ воспользуемся комплексный параметр,

учитывающий

определяющий

качество ПЭ важность

	n	i	i
S		i	i
S		(P C
	i 1

параметра, Ci

)	2

–

Pi – весовой коэффициент,

параметр, выраженный в

относительных единицах (

– параметр эталонного ПЭ),

i,Э

– время выполнения операций, выраженное в тактах,

время

такта в

эталонном ПЭ. При выборе Pi

необходимо учитывать все основные условия.

Правильный выбор Pi и характеризует сложность выбора

параметров

i 1

интегральной оценки на начальных этапах синтеза.

На уровне процессорного элемента такие параметры, как потребляемая

мощность, стоимость и надежность достаточно просто выражаются через аппаратурную сложность ПЭ, поэтому этот параметр и выбирается в качестве основного.

Наибольшей эффективностью при выполнении крупных операций, в

частности операций обобщенного интегрирования, обладает ПЭ с аппаратным выполнением макроопераций.

x	l

	yp	yа
	...	...			Регистр КОП
					Регистр КОП
ПЗУ	Вх.	Вх.		ПЗУ
коэф. ...	блок	блок	...	коэф.
коэф. ...	блок	блок	...	коэф.

		x
Делитель	Делитель	r
Делитель	Делитель

Схема

умножителя

АЛУ

Рис. 5.2

293

Следует отметить, что время выполнения любой операции в АПЭ оказывается одинаковым. При синхронном управлении множеством ПЭ, это обстоятельство является определяющим. В системах, допускающих асинхронное управление, синхронное время выполнения команд ухудшает характеристики системы. Одним из путей преодоления указанного недостатка является построение ПЭ таким образом, что его структура изменяется в зависимости от выполняемой операции. Настройка ПЭ на конкретную операцию может быть осуществлена с помощью коммутатора. Схема ПЭ для этого случая приведена на рис. 5.3.

yp					ya
...					...
Многовх	Дел.	Дел.	Умн.	АЛУ	Многовх
сумм.	Дел.	Дел.	Умн.	АЛУ	сумм.
сумм.					сумм.

Коммутатор

	Запоминающее	Рг КОП
	устройство	Рг КОП
	устройство

Рис. 5.3

К недостаткам рассматриваемого ПЭ следует отнести возрастание оборудования за счет введения коммутатора и малой загрузки операционных узлов. Для повышения загрузки каждого операционного узла используем совмещение выполнения операций в узлах ПЭ, используя для передачи данных общую шину. Схема распределенного ПЭ с аппаратным выполнением макроопераций и общей шиной, показана на рис. 5.4, а, а на рис. 5.4, б – ПЭ с совмещением операций на одноименных блоках. Общая характеристика каждого ПЭ проведена в табл. 5.2. Анализ полученных характеристик показывает, что наибольшей эффективностью обладает ПЭ с общей шиной и

294

совмещением операций. Это достигается за счет сокращения оборудования

(некоторые операции ведутся на одном и том же операционном узле), при сохранении быстродействия практически на том же уровне.

y	l					y	d

...						...
Многовх		Дел.	Дел.	Умн.	АЛУ	Многовх		ЗУ
сумм.						сумм.

Рис. 5.4, а

Структурная схема ПЭ с аппаратно-микропрограммным выполнением макроопераций и общей шиной:

yp/yd

...

Многовх	Дел.	Умн.	АЛУ	ОЗУ
сумм.	Дел.	Умн.	АЛУ	ОЗУ
сумм.

Рис. 5.4, б

Структурная схема ПЭ с аппаратно-микропрограммным выполнением макроопераций, общей шиной и совмещением операций.

Таким образом, наибольшей эффективностью обладают ПЭ с аппаратной реализацией операций при синхронном управлении и аппаратно-

микропрограммном выполнении при асинхронном управлении.

295

	Тип ПЭ	Расход
	Тип ПЭ	оборудования S
		оборудования S
	Сосредоточенный	44 n
		44 n
	Распределенный	(44 n + 40 n)
	с коммутатором	(44 n + 40 n)
	с коммутатором
	Распределённый с	44 n
	общей шиной	44 n
	общей шиной
	Распределенный
	с общей шиной	30 n
	совмещением	30 n
	совмещением
	операций

		Таблица 5.2
		Э	1
			1
t				t
t	CP		S / n	t	CP
	CP				CP
					n
					n
~ (1,6n 2)			0,014
			0,014
~ (0,7n 1)			0,017
~ (0,7n 1,5)			0,032
~ (0,9n 1,2)			0.037
			0.037

5.2.Разработка структуры обобщённого вычислителя

Вкачестве основного вычислительного элемента рассмотрим обобщенный цифровой интегратор, который представляет собой совокупность некоторого числа элементов и наиболее полно представляет собой универсальный перестраевымый процессор. Цифровой интегратор вычисляет интеграл по независимой переменной t в одной точке пространства, а

обобщенный цифровой интегратор по некоторой совокупности точек, что и делает его наиболее близким к универсальному.

Предположим, что

= 0, а

	q

принимает произвольное значение, т. е.

обобщённый интеграл содержит производную только по одной пространственной переменной x. Дискретное множество точек, получаемое на прямой x, показано на рис. 5.5, а. Каждой точке дискретного множества составим собой процессорный элемент. В этом случае обобщенный цифровой интегратор имеет вид, представленный на рис. 5.5, б

296

1 2 3 (j-1) ... j (j+1) ... N x

Рис. 5.5, a

Дискретное множество точек пространства, необходимое для построения обобщенного цифрового интегратора

1	2	3	...	j-1	j	j+1	...	N
			...				...

Рис. 5.5, б

Как видно, конфигурация обобщенного интегратора является отражением дискретного множества точек, и он может рассматриваться как многопроцессорная структура. Одной из проблем, решаемых в рамках организации структуры, является определение конфигурации соединений

процессорных элементов в систему. Это связано с тем, что влияет на

межпроцессорный обмен, конфигурация связей во многом определяет производительность обобщенного цифрового интегратора и, следовательно,

системы в целом, а также его аппаратурную сложность и надежность.

Дня оценки конфигураций обобщенного интегратора необходимо определить дополнительные характеристики, значения которых позволили бы судить о возможностях обеспечения требуемой производительности,

аппаратурной сложности и надежности на уровне системы. При оценке будем показывать, что различные конфигурации обобщенного цифрового интегратора выполнены на одних и тех же процессорных элементах. При таком ограничении выбор конфигурации влияет на производительность только через

время вычисления, которое определяется как	t	выч	t	on	t	об	где	t	on	– время

выполнения операции в ПЭ и tоб – время обмена между ПЭ.

297

Если для обмена воспользоваться общей шиной, которая объединяет все ПЭ, как это показано на рис. 5.5, б, то в каждый момент времени только один ПЭ может служить источником. Прием информации осуществляется всеми ПЭ одновременно. Время обмена, необходимое для обеспечения данными всех процессоров системы при реализации операции обобщенного интегрирования,

равно

T	N ,
об

где N – число процессоров вычислительной структуры;

– время обмена, затрачиваемое одним процессором (такт обмена).

Учитывая, что число процессорных элементов может быть большим, а в худшем случае обмен может потребоваться на каждом шаге вычислений, то время, отводимое на обмен, будет оказывать серьезное влияние на быстродействие системы.

Анализ численных алгоритмов, реализуемых процессором, показывает,

что при обмене информацией на прием настраиваются не все процессоры, а

только ближайшие к возбужденному процессору. В рассматриваемой структуре принимают информацию только четыре процессора по два справа и слева от возбужденного. Это позволяет реализовать следующий метод уменьшения времени обмена. Разорвем числовую магистраль так, чтобы справа и слева оказалось одинаковое число процессоров. Если число процессоров нечетно,

тогда справа или слева добавляется «пустой» процессор, назначение которого выровнять время обмена в правой и левой частях. Вычислительная структура с такой числовой шиной показана на рис. 5.6. В разрыве числовой шины поставлена схема коммутации. Работает она следующим образом. Если Uуп = 0,

то схема настраивается таким образом, что образуются две одинаковые числовые шины. При подаче сигнала управления (Uуп = 0) эти две шины объединяются в одну. Процесс обмена протекает следующим образом. Вначале сигнал Uуп = 0 и обмен данными между процессорами происходит в правой и левой частях одновременно. По окончании обмена в обеих частях подается

298

сигнал управления Uуп = 1 и информацией обмениваются процессоры,

расположенные на границе разрыва числовой шины. При этом в обмене участвуют не более четырех процессоров – два с левой и два с правой стороны.

Время обмена в такой структуре равно

T	N / 2 2 4		.
об
Вновь разделим правую и левую		группы процессоров пополам.

Получаемая при этом структура показана на рис. 5.7. Обмен в ней производится в три этапа. На первом этапе сигналы U1 = U2 = 0. В результате каждая группа процессоров оказывается не связанной между собой, что позволяет совместить обмен в группах. На втором этапе обмен происходит между граничными

процессорами

соседних групп в

правой

левой

частях структуры

1,U

. На третьем этапе

обмен

происходит между

граничными процессорами правой и девой частей. Время обмена в данном случае равно

	N
Tоб			2 2	4 ,
		22

Продолжим указанный процесс дихотомического деления вновь образуемых групп до получения 2n участков (рис. 5.8). Тогда при сохранении принципа обмена между участками, заключающегося в том, что вначале одновременно независимо друг от друга оцениваются процессоры внутри каждой группы. Затем обмен производится между каждыми двумя соседними группами. Следующий обмен производится между объединением групп и так далее, как это показано на рис. 5.9. Время обмена в структуре, содержащей 2n

участка, равно

	N
Tоб			2 n 4 .
	2	n

Нетрудно увидеть, что с ростом n первое слагаемое уменьшается, а второе увеличивается. Определим оптимальное значение величины n, позволяющее

299

получить минимальное значение

Tоб

. Предполагая, что п – непрерывная

величина, после несложных преобразований получим

					x
1	2	3	...	N/2-1	N/2
			...

log	2	(N ln
	2
...		N/2+1
...

Uуп

2) 2	.
	.
N/2+2	N/2+3	...	N-1	N
		...

Рис. 5.6

Вычислительная структура, реализующая операцию обобщенного

интегрирования, с возможностью разбиения шины на два участка

1	2	...	P	P+1		P+2	...	N/2	N/2+1		N/2+2	...	R		R+1 R+2	...	N
				U	1				U	2				U	3
					1					2					3

Рис. 5.7

Структура с шиной, разделяющейся на 3 участка.

Структура с полной сегментацией шины, показана на рисунке 5.8, где каждый участок обеспечивает полную операцию интегро-дифференцирования.

Процесс обмена в такой структуре, показан на рисунке 5.9.

300

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 2930 / 3630 31 32 33 34 35 36 > Следующая >>>

Соседние файлы в папке Книги

#
01.06.20154.62 Mб88Книга Проектирование ВПОВС (часть 2).pdf
#
01.06.201536.23 Mб99ПРОЕКТИРОВАНИЕ ПОВС (последнее).doc
#
01.06.201538.01 Mб111ПРОЕКТИРОВАНИЕ ПОВС (последнее)2.doc