- •Структура эвм
- •Структура машинного цикла
- •Структура и типы команд
- •3Х адресные команды
- •2Х адресные команды
- •1О адресные команды
- •Процессоры семейства pdp-11. Вычислительные системы параллельной обработки данных. Параллельная обработка как архитектурный способ повышения производительности.
- •Преимущества параллельной архитектуры:
- •Классификация систем параллельной обработки данных.
- •Классификация мультипроцессорных систем по способу организации основной памяти.
- •Мультипроцессорные системы с распределительной памятью
- •Топология из 4х процессорных блоков. Двумерный гиперкуб.
- •Способы организации внутренней памяти мультипроцессорных систем.
- •Топология внутренних связей многопроцессорных систем.
- •Сеть связи через общую шину.
- •Общая шина с арбитром.
- •Кольцевая структура.
- •Связи типа «звезда».
- •Улучшение возможностей связывания между процессорами.
- •Коммутаторы внутренних связей.
- •Однокаскадный коммутатор «Тасовка».
- •Многокаскадная коммутирующая сеть «Омега».
- •Состояние производства использования высокопроизводительных вычислительных систем.
- •Развитие архитектурных систем с общей разделяемой памятью.
- •Шина слежения за когерентностью данных.
- •Мультипроцессорная система Power Scale.
- •Архитектура вычислительных систем с распределенной разделяемой памятью.
- •Архитектура numa.
- •Развитие архитектуры мп для высокопроизводительных вычислительных систем.
- •Увеличение состава и числа функциональных устройств.
- •Интеграция функции.
- •Тенденция изменения архитектуры систем параллельной обработки на кристалле.
- •Вычислительные системы на кристалле.
Сеть связи через общую шину.
Эта система связи узлов отличается простотой. Шина обеспечивает связь между всеми узлами в режиме разделения времени.
1 2 3 4
ОШ
В этом есть и достоинства: модульность. При наращивании элементов производительность системы ограничивается фиксируемой пропускной способностью общей шины. Процессоры конкурируют между собой.
Возникает задача распределения ресурсов по запросам от процессоров. Необходимо осуществить арбитраж.
Общая шина с арбитром.
В соответствии с приоритетами арбитр выбирает несколько вопросов от процессоров на доступ к шине и обеспечивает данному процессору монопольное владение шины.
Такая схема сочетает экономичность и логическую простоту. Для повышения пропускной способности внутренних связей используют набор из нескольких шин, параллельные не зависимо работающие шины имеют возможность одновременно обслужить несколько запросов в памяти.
Кольцевая структура.
Эффективность информационного обмена в цепочке можно повысить, если замкнуть цепочку в кольцо.
Общая шина с арбитром:
1 2 3 4
арб
В кольце передачи информации осуществляются от некоторого текущего процессора – предшественника к процессору – приемнику, и дальше к следующему процессору – приемнику до тех пор, пока сообщение не достигнет адресата. Как и в обычном кольце каждый процессор проверяет адрес сообщения. Если адрес соответствует текущему процессору, то сообщение читается целиком и передача прекращается. Если же адрес не соответствует, то текущий процессор посылает сообщение следующему приемнику. Данная структура отличается логической простотой и модульностью, то есть легко позволит наращивать количество узлов.
У каждого процессора имеется 2 процессора – приёмника. Если общее количество узлов N, то диаметр сети d=N/2.
Связи типа «звезда».
В этом случае информация передается по индивидуальным связям, которые существую между некоторыми центральными узлами и процессором:
В центральном узле помещается коммутатор, который осуществляет обмен между процессорами. Каждая передача требует прохождения по двум радиусам. Функционально эта структура соответствует общей шине коммутатора, но поскольку здесь используются индивидуальные траты, то пропускная способность в такой структуре лучше.
Улучшение возможностей связывания между процессорами.
При проектировании многопроцессорных систем приходится искать компромисс между уменьшением числа связей и улучшением возможностей связей. Если у нас есть N- узлов и структура типа полный граф, при этом имеется min d = 1, то число связей Kсв:
Kсв= N[(N-1)/ 2]
При построении больших систем возникает большое число связей, при этом хотелось бы, чтобы число связей возрастало медленнее, чем квадратичная зависимость от числа узлов, а число связей отдельного узла возрастало медленней, чем число узлов.
В рассмотренных выше цепочках: в кольце, «звезда» и сетка, число связей каждого узла не зависит от числа узлов N.
Если имеется структура – ортогональная сетка:
то в ней каждый процессор, кроме крайних, связан с четырьмя соседними. Диаметр в этом случае:
d =2*[√N - 1]
В приведенном примере N=16 и, следовательно, d=6.
Крайние узлы имеют меньшее число связей, и из-за этого нарушается регулярность связей на краях. Это приводит к нежелательным краевым эффектам, при создании обеспечения управления такой структурой. Для того, чтобы сделать все узлы идентичными, применяют тороидальную сетку: