2. Проекты параллельной памяти

В настоящее время разработаны и эксплуатируются ряд систем специального и общего назначения, реализующие прин­ципы параллельной обработки, в которых используется память с параллельным и многоформатным доступом. Для краткой характеристики реальных проектов памяти мы рассмотрим две из них: систему BSP (Burroughs Scientific Processor) и систе­му STARAN. Выбор определяется тем, что устройства параллельной памяти, реализованные в этих системах, представляю два направления развития подобных структур, так как основаны на двух разных классах размещений.

Система BSP предназначена для решения вычислительны задач. Она способна производить обработку числовых данных представленных в формате с плавающей запятой, со скоростью до 50 млн операций в секунду.

Ассоциативная вычислительная система STARAN относится к классу ОКМД-систем с обработкой данных по разрядам. B системе могут параллельно выполняться арифметические, логические и поисковые операции над всеми словами данных хранящихся в модулях матричной памяти с многомерным доступом.

Рассмотрим кратко основные принципы организации памяти в системах BSP и STARAN.

2.1. Параллельная память системы bsp

В структуру системы BSP включены параллельный процессор и параллельная память. Параллельный процессор состоит из шестнадцати 48-разрядных процессорных элементов. Память включает 17 блоков, каждый размером от 32 до 512 К 56-разрядных слов. Восемь разрядов в слове контрольные. Блоки памяти построены на полупроводниковых микросхемах объемом 4 Кбит с циклом обращения 160 нс.

Параллельные процессор и память связаны между собой двумя (входной и выходной) соединительными сетями, представляющими собой полные координатные переключатели Максимальная скорость передачи данных между параллельной памятью и процессорными элементами 108 слов/с.

Обращает на себя внимание то, что при ширине параллельного доступа L16 слов в структуре памяти М = 17 блоков Число 17 — ближайшее старшее простое число, которое больше 16 (числа процессоров). Такая структура при наличии полный координатных переключателей для связи позволяет построить размещение, обеспечивающее бесконфликтный доступ ко всем линейным векторам при условии, что расстояние между элементами в памяти не является кратным простому числу 17. Мы рассмотрим это размещение на примере с уменьшением для простоты размеров L и М.

Построим 2D-запоминающую среду размером 8 X 8 на М = 5 блоках памяти при ширине доступа L = 4 в соответствии c таблицей размещения на рис. 8, а. В памяти BSP применяется такое распределение элементов данных по блокам и адресам, которое в рассматриваемом примере обеспечивает бесконфликтный выбор фрагментов (L = 4) строк, столбцов, прямых и обратных диагоналей, а также квадратных 2 X 2-подмассивов двухмерного массива А = {aij}, i,j = 0, 1, ..., 7. Соответст­вующая схема хранения представлена на рис. 8,6.

а

0

1

2

3

4

5

6

7

0

0

3

1

4

2

0

3

1

1

1

4

2

0

3

1

4

2

2

2

0

3

1

4

2

0

3

3

3

1

4

2

0

3

1

4

4

4

2

0

3

1

4

2

0

5

0

3

1

4

2

0

3

1

6

1

4

2

0

3

1

4

2

7

2

0

3

1

4

2

0

3

б

Адреса

Модули памяти

0

1

2

3

4

0

а00

а10

а20

а30

Х

1

а50

а60

а70

Х

а40

2

а21

а31

Х

а01

а11

3

а71

Х

а41

а51

а61

4

Х

а02

а12

а22

а32

5

а42

а52

а62

а72

Х

6

а13

а23

а33

Х

а03

7

а63

а73

Х

а43

а53

8

а34

Х

а04

а14

а24

9

Х

а44

а54

а64

а74

10

а05

а15

а25

а35

Х

11

а55

а65

а75

Х

а45

12

а26

а36

Х

а06

а16

13

а76

Х

а46

а56

а66

14

Х

а07

а17

а27

а37

15

а47

а57

а67

а77

Х

Рис. 8. Пример организации запоминающей среды с ис­пользованием простого числа блоков памяти (М = 5): а — таблица размещения Т2D8X8; б — схема хранения массива А = ij} — 8 X 8

Особенностью применяемой схемы хранения является нали­чие пропусков (отмечены на рис. 8,6 знаком X) при рас­пределении элементов данных в памяти. Они возможны благо­даря тому, что при L = 4 мы имеем запоминающую среду из пяти блоков памяти. Это позволяет реализовать указанные ге­ометрические форматы как форматы плавающего типа.

Одновременно следует отметить, что появление пустых мест снижает эффективность использования запоминающей среды. В приведенном примере 1/5 часть памяти не использу­ется. В принципе пустые ячейки можно занять другой инфор­мацией, однако при этом возникают трудности сих адресацией.

Соседние файлы в папке 2.3. Процессорные матрицы