Информатика в техническом университете / Информатика в техническом университете. Архитектура вычислительных систем
.pdf6.7. Мультипроцессорные системы со структурно-процедурной организацией
жет быть запрограммирована адекватно структуре решаемых задач. для возможности настройки архитектуры суперВС оснащается соответствующими средствами. B состав суперВС включаются аппаратные и программные подсистемы, которые гарантируют пользователю возможность про-
гpаммировать и настраивать его архитектуру таким образом, чтобы можно
было получить любые виртуальные проблемно-ориентированные конфигурации, архитектура которых адекватна соответствующим структурам решаемых задач.
B состав многопроцессорной ВС (см. рис. 6.9) входят аппаратно -про- граммные подсистемы управления макрооперациями, макрокоммутациями и макpообращениями. Кроме того, необходимы еще три подсистемы, а имен-
но: подсистемы программирования и настро., ки поля макpокоммyтаторов и
й
распределенной памяти. B число этих подсистем входят: аппаратнопрогpаммная подсистема организации в поле макpопроцессоров вычислительного графа решаемой задачи или его подгpафов (кадров); аппаратнопрогpаммнaя подсистема программирования и настройки в коммутационной структуре в соответствии c кадром прямых каналов связи между макропроцессорами; аппаратно-программная подсистема управления организацией структуры распределенной памяти; и, наконец, аппаратно-программная подсистема управления организацией интерфейса. Все эти подсистемы, в свою очередь, находятся под управлением распределенного системного прогpаммного обеспечения.
6.7.6.Принципы синтеза суперВС c массовым параллелизмом
ипрограммируемой архитектурой
Исходя из вышесказанного, в основу синтеза ВС c массовым параллелизмом и программируемой архитектурой должен быть положен ряд фун-
даментальных принципов, обеспечивающих выполнение всех современных требований.
Принцип адекватности структуры задачи и архитектуры вычислительной системы. Этот принцип требует максимально адекватного отображения внутренней структуры любой решаемой задачи или любого моделируемого объекта в архитектуру многопроцессорной ВС c массовым параллелизмом.
Принцип использования внутренней параллельности решаемой задачи.
Принцип обеспечивает максимально широкое использование внутренней
естественной параллельности решаемой задачи или моделируемого объекта при организации параллельных вычислений в ВС c массовым параллелизмом.
Принцип обмена информацией без посредников . Согласно этому принципy, обеспечивается преимущественно прямая передача информации от
271
6. Мультипроцессорные вычислите гzьные системы
процессора к процессору по прямым каналаг связи без промежуточных процессоров, памяти или других элементов мнс гопроцессорнои системы.
Принцип кaлиброванного времени выполнения макроопераций. Этот принцип призван поддержать выполнение р ^азнотипных макроопераций (крупных операций), реализуемых в разных параллельно работающих процессорах ВС, в одинаковые промежутки врем мни и тем самым обеспечить согласованность работы всех процессоров.
Принцип бесконфликтного пар ann ельнс го доступа к информации.
Принцип обеспечивает условия для параллельн юго, бесконфликтного доступа без очередей всех одновременно работаю щих процессоров системы к необходимой информации, как хранящейся в f ^аспределенной памяти, так и к вырабатываемой другими процессорами.
Принцип структурно-процедурного кадрового процесса вычислений.
Данный принцип обеспечивает организацию п роцесса вычислений в многопроцессорной ВС на основе информационного графа задачи в кадровой структурно-процедурной форме. При этом формирование кадров осуществляeтся путем такого разрезания графа задачи на непересекающиеся подгpафы, когда каждый подграф заполняет весь процесс орный ресурс ВС и в каждом
кадре осуществляются парaллельно-конвейер- ые структурные вычисления, a обработка всех кадров информационного графа задачи ведется в виде последовательной процедуры c обменом информацией между кадрами.
Принцип модульности архитектуры. 'этот принцип предписывает синтез архитектуры ВС c массовым параллел: 4змом на основе однотипных стандартных модулей, каждый из которых, в с вою очередь, является много-
процессорной системой в минимальной конфигурации. Объединение моду-
., лей осуществляется стандартными однотипно тми коннекторными соедине-
ниями. При объединении ресурсы всех модулЕ й (включая процессорные поля, коммутационные структуры, распределенi ую память, интерфейс и ОС) порождается многомодульная ВС c массовым параллелизмом и программируемои архитектурой.
Принцип масштабируемости струкп урно-процедурных кадровых программ. Принцип обеспечивает эффектив :мое выполнение структурнопроцедурных программ c максимальным исп ользованием имеющихся вычислительных ресурсов при любых модульных конфигурациях многопроцессорных ВС c массовым параллелизмом и про ,раммируемой архитектурой.
6.7.7. Реализация многопроцессорных ю ычислительных систем со структурно-процедурной организацией вычислении
Научно-исследовательский институт многопроцессорных вычислительных систем Южного федерального yниF.epcитeтa в 2007 r. завершил
272
6.8. Сверхвысокопроизводительные вычислительные системы IBMBIue Gene
разработку модульно-наращиваемой многопроцессорной системы c программируемой архитектурой. Эта система компонyется из функционально и конструктивно законченных элементов вычислителей. Каждый такой вычислитель состоит из двух базовых модулей (см. рис. 6.13) и имеет следую-
щие характеристики:
•количество микропроцессоров 32;
•число элементарных процессоров 512;
•емкость памяти 1 Гбайт;
•производительность 50 GFLOPS;
•потребляемая мощность 0,44 кВт;
•габариты — 482,6Х595Х265,9 ммз
Макропроцессор ВС реализован на одной ПЛИС серии Virtex II-Pro фирмы Xilinx.
Любая конфигурация ВС работает под управлением хост-компьютера.
Архитекгура многопроцессорной ВС и тexнология ресypсонезaвисимого параллельного программирования позволяют вьшолнп3 ь параллельную про-
грамму на любом количестве базовых модулей. Создана интегрированная среда программирования, обеспечивающая возможность оперативного создания компонентов адаптирующихся (масштабируемьх) параллельны программ.
6.8. Сверхвысокопроизводительные вычислительные системы
семейства IBM Blue Gene
Проект создания вычислительной масштабируемой суперсистемы
В1ие Gene был анонсирован корпорацией ЭВМ в декабре 1999 г. Проект на-
правлен на создание суперВС c производительностью 1 PetaFLOPS и преду-
сматpивает поэтапное конфигypирование ряда моделей c производительно-
стью в диапазоне 10... iO3 TeraFLOPS.
Первая поставка простой конфигурации системы модели IВМ В1ие Gene/L была осуществлена в 2000 г. в Ливерморскую национальную лабо-
раторию им. Лоуренса (LLNL Lawrence Livermore National Laboratory).
Неоднократное наращивание первоначальной конфигурации ВС превратило ее уже в 2004 г. в самый мощный суперкомпьютер в мире. B 24-й редакции списка 500 наиболее мощных компьютеров мира (Тор500) было указано, что конфигурация ЭВМ В1ие Gene/L из 32 768 процессорных ядер (16 384
двухъядерных процессоров IBM PowerPC 440 c тактовой частотой 700 МГц) обладала п новой производительностью 91,75 TeraFLOPS (70,72 TeraFLOPS на тестовом наборе LINPACK).
Конфигурация IBM В1ие Gene/L, эксплуатировавшаяся в 2006-2007 гг. в LLNL (см. 28-ю и 29-ю рещжщш списка Тор500, 2006-2007 гг.; http://www.top500.org),
273
6. Мультипроцессорные вычислител,,ные системы
характеризовалась следующими показателями: L Висло процессорных ядер
131 072 (двухъядерных процессоров PowerPC 440 |
65536), пиковая про- |
||
изводительность |
367 TeraFLOPS (280,6 TeraFLOPS |
на наборе тестов |
|
UNPACK). |
|
|
|
Наращивание ресурсов IBM В1ие Gene/I,, произведенное к ноябрю
2007 г. в Ливерморской лаборатории, позволило преодолеть рубеж 0,5 Peta-
FLOPS (см. 30-ю редакцию Тор500). Конфигурация модели IBM В1ие Gene/L
2008 г. обладает следующими показателями: ЧИСЛО процессорных ядер
212 992, пиковая производительность |
596,38 TFLOPS (478,2 TFLOPS |
||
на UNPACK), емкость памяти |
53,248 Тбайга, пропускная способность |
||
канала «процессор-память» |
5,5 Гбайт/c, э Нергопотребление |
около |
|
3,25 Мегаватт, занимаемая площадь |
4060 кi:адратных футов (377,2 м2), |
||
цена 208 млн долл. |
|
|
|
B списке Тор 10 десяти самых высоко производительных суперВС мира модели семейства ЭВМ В1ие Gene занимают четыре позиции (2008 г.).
B ближайших планах корпорации IBM предуслiготрено построение моделей. В1ие Gene/P и В1ие Gene/Q c пиковой производительностью 1 PFLOPS и 3 PFLOPS соответственно. Реализованная конфигурация модели IBM В1ие
Gene/P, состоящая из б5 536 процессорньх ядер (из 32 768 двухъядерных микропроцессоров Power РС 450 c тактовой частотой 850 МГц), обладает пико-
вой производительностью 222,8 TFLOPS (167,3 TFLOPS на LINPACK).
Эта конфигурация является второй в 30-й редак:дии Тор500 (2007 г.) и самой мощной суперВС Европы. Она установлена F Научно-исследовательском
консорциуме FZJ (Forschungszentrum Juelich) в Германии.
6.8.1. Особенности архитектуры IBM В1ие Gene
Для интенсификации работ по проекту Е1ие Gene разработчики IBM
вынуждены были пересмотреть свою архитектурную платформу. B результате ими была декларирована «новая» (для IВМ, но не для российских раз-
работчиков, см. гл. 3, [5, 6]) архитектурная i<онцепция SMASH (Simple, Many, Self-Healing простая, множественная и самовосстанавливаемая).
Эта концепция ориентирована на использова Сие таких архитектурных и функциональных решений, которые позволяют интегрировать большое число процессоров (до 1 млн, для достижения петафлопсной производительности) и, следовательно, обеспечивают автомате :ческое устранение проблем, вызванных сбоями.
При разработке данной суперВС принцип масштабирования воплощался на всех уровнях и аппаратурного, и программного обеспечения.
Все модели семейства IBM В1ие Gene относятся к классу распреде-
ленных систем c массовым параллелизмом. Не; мотря на то, что они ориен-
274
