
- •2. Архитектура вс параллельной обработки информации
- •2.1.Основные определения
- •2.2. Особенности архитектур эвм и вс прошедших поколений
- •2.3. Пути повышения производительности вычислительных средств и требования к вычислительным системам параллельной обработки информации
- •Перспективы и проблемы использования высокопроизводительных вс параллельной обработки информации
- •2.4. Способы параллельной обработки информации. Уровни обработки (гранулярность обработки)
- •2.5. Классификация вс с функциональной точки зрения
- •2.6. Проблемы неймановской архитектуры
- •2.7 . Особенности risс-архитектуры.
- •2.Х. Классификация вычислительных моделей и механизмов обработки
- •2.8. Вычислительные модели (системы) с управлением потоком данных (потоковые машины) и редукционные машины
- •2.9. Матричные (векторные) процессоры (simd-архитектуры)
- •2.10. Пример разрядно-модульного матричного процессора simd-архитектуры (параллельный процессор для обработки двухмерных изображений, передаваемых из космоса).
- •Разрядно-модульная матричная окмд
- •2.11. Особенности реализации мультимедийных алгоритмов на основе архитектур simd в современных простейших микропроцессорах
- •2.12. Процессоры со многими алу
- •2.13. Процессоры с конвейеризацией команд
- •2.14. Конвейерные операционные устройства обработки информации
- •2.15. Направления развития современных архитектур процессоров
- •2.16. Суперскалярные вычислительные системы
- •2.17. Микропроцессор Pentium 4.
- •2.18. Суперкомпьютер Gray
- •Секция регистров
- •2.19. Многопроцессорные системы.
- •Что это дает?
- •2.20. Разновидности ос многопроцессорных систем,
- •2.21. Мультипроцессорные системы на базе мп Alpha 21364
- •2.22. Однокристальные многопроцессорные системы
- •2.23. Векторно-конвейерные супер-эвм Cray c90, t90
- •2.24. Многопроцессорные вычислительные системы семейства мвс (мвс - 1000)
- •2.25. Многопроцессорная вычислительная система Эльбрус.
- •2.26. Многоядерные многопотоковые микропроцессоры
- •2.27. Кластерные системы.
- •2.28. Концепция grid-архитектур
- •2.29. Транспьютеры. Особенности архитектур мультитранспьютерных систем.
- •2.30. Транспьютерная многопроцессорная система для цифровой обработки сигналов. Транспьютерная многопроцессорная система цифровой обработки сигналов
- •2.31. Примеры формального представления сегментированных программ для параллельного исполнения.
- •2.32. Показатели производительности вычислительных систем.
2.23. Векторно-конвейерные супер-эвм Cray c90, t90
Cray 1 – 1976 г.
Cray С90 – середина 90 – х гг.
Характеристики Cray T90 (2002 г.):
- 640 вычислительных узлов, в каждом узле по 8 векторных процессоров, то есть в сумме 5120 процессоров.
- пиковая производительность одного процессора 8 Gflops. Для всей системы – 40 Tflops (на тестах показывает 89% пика.)
Характеристики Cray С90 (2002 г.):
- 16 процессоров
- векторно-конвейерная архитектура позволяет решать задачи с матричными данными. Выделяется вектор однотипных данных, который потом передается потоком на конвейер. Также имеются и суперскалярные операции.
- имеются адресные регистры А, скалярные регистры S, векторные регистры, промежуточные регистры – B и Т. Все регистры связаны с памятью.
A- регистры – 32-х разрядные
S – регистры – 64 –х – разрядные
Каждый векторный регистр может содержать до 128 64-х – разрядных слов.
- ФУ – все конвейерного типа и выдают результат за один такт
Число векторных ФУ – 5-7 штук.
Для обработки вещественных чисел - 3 ФУ
Число скалярных ФУ – 4
Число адресных ФУ – 2
- может выполняться скалярная обработка с зацеплением операций (разнотипные данные следуют по конвейеру)
2.24. Многопроцессорные вычислительные системы семейства мвс (мвс - 1000)
МВС – 1000 – российская разработка (НПО «Квант»).
В основе системы лежат микропроцессоры фирмы DEC “Alpha 2116” на 500 МГц.
В 2001-ом году система содержала 1152 процессора (с производительностью 1 Tflops)- 18 стоек по 64 процессора на каждой стойке.
Особенность построения:
Исполнительские процессорные узлы базируются на МП Alpha, а процессоры для реализации коммуникационных функций взаимодействия – TMS320C44.
Характеристики системы:
- TMS320C44 имеет 4 связи, связь между узлами – топология двухмерного тора.
- базовая архитектура на 16 процессоров (базовый модуль).
- максимальная длинна связи между двумя процессорами не более трех участков
- возможно наращивание архитектуры модуля до 64 процессоров, при этом длина пути не более 5-ти участков.
-дальнейшее объединение – на основе свободных линков.
2.25. Многопроцессорная вычислительная система Эльбрус.
Российская разработка.
Эльбрус1 включала 4 процессора. Эльбрус-2 10 процессоров, в каждом процессоре -10 специализированных операционных устройств.
Эльбрус-3 – в 1991г. Структура системы Эльбрус-3:
ОП – оперативная память (содержится до 8-и модулей). ПВВ – процессоры ввода-вывода (до 8-и процессоров). НМД – накопители на магнитных дисках. МКТ – модульные комплексы телеобработки. УВВ – устройства ввода-вывода. ЦП – центральные процессоры (до 16-и процессоров). В системе содержатся сотни каналов телеобработки данных.
Глобальная оперативная память - до 2-х Гб.
В процессоре есть 7 АЛУ конвейерного типа. В конвейере один сегмент – 10нс. Пиковая производительность одного процессора – 700 млн. результатов/сек.
Пиковая производительность 16-ти процессорной конфигурации – 10млрд.результатов/сек.
Формируется 288-и битовая команда (VLIW-архитектура), которая одновременно загружает все операционные устройства в процессоре.
Обеспечивается параллельное обращение по 8-и каналам к ОП.
Команды выбираются на исполнение по готовности данных. Просматривается до 30-и команд. Применяется окно данных.
В системе Эльбрус используется язык высокого уровня ЭЛЬ-76.
Имеется конвейер команд. Одновременно реализуется две альтернативы при условных переходах. Используется виртуальная память (единое адресное пространство).
Ассемблер исключен. Компиляция выполняется на микропрограммные коды.