Добавил:

Kaz Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет информатики и радиоэлектроники

Предмет:

Структурная и функциональная организация ЭВМ

Файл:

Лекции 437стр.doc

Скачиваний:

Добавлен:

15.06.2014

Размер:

9.54 Mб

Скачать

☆

<<< < Предыдущая 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 3637 / 3937 38 39 > Следующая >>>

3 Stages

Memories 000

Коммутационная сеть "omega ".

Слжд 19

Соединение 8 процессоров с 8 модулями памяти 12-ю коммутаторами . Для п процессоров и п модулей памяти понадобится bg ₂n ступеней , wjl коммутаторов на каждую ступень , то есть всего (n/2)log ₂n.

Мультипроцессоры UMA с многоступенчатыми сетями

CPUs

3 Stages

Memories 000

Допустим процессору ОН нужно считать слово из модуля памяти ПО. Процессор посылает сообщение READ, чтобы переключить коммутатор Ю го содержимому 110 в поле «Модуль ». Коммутатор берет первый (крайний левый ) бит от ПО и го нему узнает направление .0 указывает на верхний выход , а 1 — на нижний - > сообщение отправляется через нижний выход в 2D.

Printed with FinePrint- purchase atwww.fineprint.com

Мультипроцессоры с многоступенчатыми сетями

CPUs

3 Stages

Memories 000

Как только сообщение пройдет через коммутатор , соотв . битыномера модуля больше нэ требуются . Их можно использовать ,записав туда номер входной линии , чтобы было известно , го какомупути посылать ответ . Для пути а входные линии — это 0( верхнийвход в ID), 1( нижний вход в 2D) и 1( нижний вход в 3D)соответственно . При отправке ответа тоже используется 011, толькотеперь число читается справа налево . ^См£д

Классификация параллельных ВС

NUMA (NonUniform Memory Access — с неоднородным доступом к памяти ) - для ВС с более 100 процессоров .

Как и мультипроцессоры UMA, они обеспечивают единое адресное пространство для всех процессоров , нэ, в отличие от машин UMA, доступ к локальным модулям памяти происходит быстрее, чем к удаленным .

Три ключевые характеристики NUMA:

Существует одно адресное пространство , видимое для всехпроцессоров .
Доступ к удаленной памяти производится с использованием

команд LCAD и STORE.

3. Доступ к удаленной памяти происходит медленнее , чем доступ клокальной памяти .

Программы \№к будут работать без изменений на машинах NUMA, нэ производительность будет хуже , чем на машине UMA с той хе тактовой частотой .

Сяаяд 22

Printed with FinePrint- purchase atwww.fineprint.com

Num am ulti processors

Если время доступа к удаленной памяти нэ скрыто (поскольку кш -память отсутствует ), то такая система называется I\C -NUMA (Г\Ь Caching NUMA — NUMA без кэширования ) Если присутствуют согласованные кэши , то система называется СЕ -NUMA (Coherent Cache NUMA — NUMA с согласованной кш -памятью ). Так же её называют аппаратной СЕМ (Distributed Shared Memory — распределенная совместно используемая память )

CPU Memory CPU Memory CPU Memory CPU Memory

MMU

Local bus

System bus

Машина NUMA с двумя уровнями шин . Carnegie -Mellon (fn * — первый мультипроцессор , в котором использовалась данная разработка .

Слайд Ъ

NUM AM ulti processors

CPU Memory CPU Memory

CPU Memory

MMU

Local bus

System bus

Выполнение программы из удаленной памяти занимало в Ю раз больше времени , чем выполнение той хе программы из локальной памяти . Согласованность памяти гарантирована в машине Г\С -NUMA, поскольку отсутствует кш -память . Каждое слово памяти находится только в одном месте : здесь нет копий данных .

Имеет большое значение , в какой именно памяти находится та

или иная страница , поскольку от этого зависит производительность . Машины NCNUMA используют сложное программное обеспечение для перемещения страниц , чтобы максимально увеличить производительность .

Printed with FinePrint- purchase atwww.fineprint.com

The Sun Fire E25K NUMA Multiprocessor (1)