
- •2. Архитектура вс параллельной обработки информации
- •2.1.Основные определения
- •2.2. Особенности архитектур эвм и вс прошедших поколений
- •2.3. Пути повышения производительности вычислительных средств и требования к вычислительным системам параллельной обработки информации
- •Перспективы и проблемы использования высокопроизводительных вс параллельной обработки информации
- •2.4. Способы параллельной обработки информации. Уровни обработки (гранулярность обработки)
- •2.5. Классификация вс с функциональной точки зрения
- •2.6. Проблемы неймановской архитектуры
- •2.7 . Особенности risс-архитектуры.
- •2.Х. Классификация вычислительных моделей и механизмов обработки
- •2.8. Вычислительные модели (системы) с управлением потоком данных (потоковые машины) и редукционные машины
- •2.9. Матричные (векторные) процессоры (simd-архитектуры)
- •2.10. Пример разрядно-модульного матричного процессора simd-архитектуры (параллельный процессор для обработки двухмерных изображений, передаваемых из космоса).
- •Разрядно-модульная матричная окмд
- •2.11. Особенности реализации мультимедийных алгоритмов на основе архитектур simd в современных простейших микропроцессорах
- •2.12. Процессоры со многими алу
- •2.13. Процессоры с конвейеризацией команд
- •2.14. Конвейерные операционные устройства обработки информации
- •2.15. Направления развития современных архитектур процессоров
- •2.16. Суперскалярные вычислительные системы
- •2.17. Микропроцессор Pentium 4.
- •2.18. Суперкомпьютер Gray
- •Секция регистров
- •2.19. Многопроцессорные системы.
- •Что это дает?
- •2.20. Разновидности ос многопроцессорных систем,
- •2.21. Мультипроцессорные системы на базе мп Alpha 21364
- •2.22. Однокристальные многопроцессорные системы
- •2.23. Векторно-конвейерные супер-эвм Cray c90, t90
- •2.24. Многопроцессорные вычислительные системы семейства мвс (мвс - 1000)
- •2.25. Многопроцессорная вычислительная система Эльбрус.
- •2.26. Многоядерные многопотоковые микропроцессоры
- •2.27. Кластерные системы.
- •2.28. Концепция grid-архитектур
- •2.29. Транспьютеры. Особенности архитектур мультитранспьютерных систем.
- •2.30. Транспьютерная многопроцессорная система для цифровой обработки сигналов. Транспьютерная многопроцессорная система цифровой обработки сигналов
- •2.31. Примеры формального представления сегментированных программ для параллельного исполнения.
- •2.32. Показатели производительности вычислительных систем.
2.18. Суперкомпьютер Gray
В основе - суперскалярная с возможностями векторной реализации операций архитектура.
Структура одного процессора:
Секция управления
программой
Буферы команд
1..4
. . .
Секция регистров

Блок выработки
команд и
управляющих
сигналов




Секция
памяти и
вв/вывода
24
канала




О
З
У
Адресные
регистры
Скалярные
регистры
КВВ
0 1… 7
…
Векторные
регистры
Первый Gray был создан в 1976-м году, выпущен – в 78-м году. Процессор имел объем 1м3, выполнял до 250 млн. операций/сек.
Состав Gray: 4 секции (12 устройств):
секция функциональных устройств (АЛУ);
секция регистров;
секция управления программой;
секция памяти и ввода-вывода.
4 независимые группы функциональных устройств:
адресная группа;
скалярная группа;
группа операций с плавающей запятой;
векторная группа.
АЛУ – это практически конвейерный процессор. Число сегментов в одном конвейере – до 14.
Длительность одного шага (сегмента) – 12.5 нс.
Число операций – 128. В мультипрограммном режиме могут одновременно выполняться 63 задачи. Имеется активизирующий компилятор с ФОРТРАНА, который распознает параллельные участки для векторных команд.
Большую роль играют быстрые регистры:
- адресные (А-регистры) -24-х разрядные, 8 шт.;
- скалярные (S-регистры) -64-х разр., 8 шт.;
- векторные (V-регистры) – 64 элемента*64 разр.,8 шт.
Время обращения к регистру 6 нс.
Ввод-вывод – по 24-м каналам (6*4 канала).
Gray2 – 2-х процессорный. GrayХ – MP/1 выполняет 1 млрд. операций/сек., в конфигурацию входит до 4-х процессоров. Был создан в 82-м году.
В Gary2 используется ОС типа Unix. Время реализации сегмента – 1.4нс.
2.19. Многопроцессорные системы.
В многопроцессорных системах гранулярность на уровне задач; в каждой ЭВМ свой счетчик команд. По классификации потоки-команд-потоки данных относятся к MIMD архитектурам.
Системы с общей памятью.
П – процессор, МП – модуль памяти.
Число процессоров ограничивается обстоятельствами, которые возникают при конфликтах при обращении к памяти.
От сети связи зависит эффективность всей многопроцессорной системы.
2. Системы с распределенной (индивидуальной) памятью (с коммутацией сообщений).
П – процессор, ЛП – локальная память.
В системе у каждого процессора имеется своя память и проблема конфликтов не столь актуальна.
Одна из наиболее серьезных проблем в проектировании многопроцессорных систем – необходимость использования сложных систем связи.
В идеале, для обеспечения высокой производительности и минимизации задержек при обмене информацией между процессорами и оперативным запоминающим устройством, желательно обеспечивать возможность связи в любой момент времени по принципу "каждый с каждым”, однако при построении таких систем уже при небольшом количестве процессоров сеть связи оказывается очень сложной и по оборудованию может даже превосходить другую часть системы. В случае использования сотен-тысяч процессоров нереально обеспечивать режим "каждый с каждым”. В связи с этим разработаны различные эвристические методы решения данной задачи на основе параллельно-последовательной передачи данных.
Рекомендуемая гранулярность при загрузке процессоров - на уровне задач или крупных частей задач.
Примеры способов (структур) реализации связей между процессорами.
Одношинная система.
Т
аким
способом более 4-х процессоров не
подключают.
Мультиплексная общая шина.
Матричный коммутатор.
К
– сложный коммутирующий элемент.
Разновидности сетей:
Полная сеть. Звездообразная сеть. Матричная сеть.
Матричная сеть типа «тор». Сеть типа «цепочка».
Кольцевая сеть.
Древовидная сеть.
Гиперкуб.
а) 22 процессоров, 2 связи на входе каждого процессора, не более двух участков для перехода от одного процессора к другому.
б) 23 вершин (процессоров). 3 связи на входе каждого процессора. Чтобы перейти из одной вершины в любую другую, нужно пройти не более 3-х участков.
В общем случае: 2L – количество процессоров, L связей на входе каждого процессора. Чтобы перейти из одной вершины в любую другую, нужно пройти не более L-х участков.
При формировании трафика связи между двумя процессорами эффективно используется особенность нумерации расположения соседних процессоров: их номера всегда отличаются только в значении одного из битов.