Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции 437стр.doc
Скачиваний:
48
Добавлен:
15.06.2014
Размер:
9.54 Mб
Скачать

3 Stages

Memories 000

Коммутационная сеть "omega ".

Слжд 19

Соединение 8 процессоров с 8 модулями памяти 12-ю коммутаторами . Для п процессоров и п модулей памяти понадобится bg 2n ступеней , wjl коммутаторов на каждую ступень , то есть всего (n/2)log 2n.

Мультипроцессоры UMA с многоступенчатыми сетями

CPUs

3 Stages

Memories 000

Допустим процессору ОН нужно считать слово из модуля памяти ПО. Процессор посылает сообщение READ, чтобы переключить коммутатор Ю го содержимому 110 в поле «Модуль ». Коммутатор берет первый (крайний левый ) бит от ПО и го нему узнает направление .0 указывает на верхний выход , а 1 — на нижний - > сообщение отправляется через нижний выход в 2D.

Printed with FinePrint- purchase atwww.fineprint.com

Мультипроцессоры с многоступенчатыми сетями

CPUs

3 Stages

Memories 000

Как только сообщение пройдет через коммутатор , соотв . битыномера модуля больше нэ требуются . Их можно использовать ,записав туда номер входной линии , чтобы было известно , го какомупути посылать ответ . Для пути а входные линии — это 0( верхнийвход в ID), 1( нижний вход в 2D) и 1( нижний вход в 3D)соответственно . При отправке ответа тоже используется 011, толькотеперь число читается справа налево . См£д

Классификация параллельных ВС

NUMA (NonUniform Memory Access — с неоднородным доступом к памяти ) - для ВС с более 100 процессоров .

Как и мультипроцессоры UMA, они обеспечивают единое адресное пространство для всех процессоров , нэ, в отличие от машин UMA, доступ к локальным модулям памяти происходит быстрее, чем к удаленным .

Три ключевые характеристики NUMA:

  1. Существует одно адресное пространство , видимое для всехпроцессоров .

  2. Доступ к удаленной памяти производится с использованием

команд LCAD и STORE.

3. Доступ к удаленной памяти происходит медленнее , чем доступ клокальной памяти .

Программы \№к будут работать без изменений на машинах NUMA, нэ производительность будет хуже , чем на машине UMA с той хе тактовой частотой .

Сяаяд 22

Printed with FinePrint- purchase atwww.fineprint.com

Num am ulti processors

Если время доступа к удаленной памяти нэ скрыто (поскольку кш -память отсутствует ), то такая система называется I\C -NUMA (Г\Ь Caching NUMA — NUMA без кэширования ) Если присутствуют согласованные кэши , то система называется СЕ -NUMA (Coherent Cache NUMA — NUMA с согласованной кш -памятью ). Так же её называют аппаратной СЕМ (Distributed Shared Memory — распределенная совместно используемая память )

CPU Memory CPU Memory CPU Memory CPU Memory

MMU

Local bus

Local bus

Local bus

Local bus

System bus

Машина NUMA с двумя уровнями шин . Carnegie -Mellon (fn * — первый мультипроцессор , в котором использовалась данная разработка .

Слайд Ъ

NUM AM ulti processors

CPU Memory CPU Memory

CPU Memory

CPU Memory

i

MMU

Local bus

Local bus

Local bus

System bus

Выполнение программы из удаленной памяти занимало в Ю раз больше времени , чем выполнение той хе программы из локальной памяти . Согласованность памяти гарантирована в машине Г\С -NUMA, поскольку отсутствует кш -память . Каждое слово памяти находится только в одном месте : здесь нет копий данных .

Имеет большое значение , в какой именно памяти находится та

или иная страница , поскольку от этого зависит производительность . Машины NCNUMA используют сложное программное обеспечение для перемещения страниц , чтобы максимально увеличить производительность .

Printed with FinePrint- purchase atwww.fineprint.com

The Sun Fire E25K NUMA Multiprocessor (1)

PCI slot

CPU-memory boards

System control board

9 1/0 boards

The Sun Microsystems E25K multiprocessor.

Слайд 25

The Sun Fire E25K NUMA Multiprocessor (2)

i.

о

3

18x18 Address crossbar switch

ТГГ

1Bx 18 Response crossbar switch

Mil III Ml III

18x18Dat crossbar switch

III III I

Level 3

Direclory and snooping management

3x3 Data

switch

о и

m

Level 2

CPU

О

с

о 3

О"

о

Addr rep.

3x3

Data

switch

Level 1

Level 0

The Sun Fire E25K использует соединения четырёх уровней . Пунктир - шины адресов . Сплошные - ИД .

Printed with FinePrint- purchase atwww.fineprint.com

Сяаид

Node 1 CPU Memory

Node 255 CPU Memory


Local bus

CacheCoherentNUMA мультипроцессоры

СИ



Local bus

Local bus


Node О CPU Memory

СИ

Interconnection network

(.a)

18

Bits 8

Mode

Block

Offset

-1

I

f

4

0

3

0

2

1

62

1

0

0

0

Слайд 27


Мультипроцессор на основе каталога , содержащий 256 узлов (а); разбиение 32-битного адреса памяти на поля (б); каталог в узле 36( в)

Node 255 CPU Memory

Node О CPU Memory

CacheCoherentNUMA мультипроцессоры

Directory