- •Параллельные
- •Мультипроцессоры и мультикомпьютеры
- •Мультикомпьютеры
- ••Поскольку процессоры в мультикомпьютере не могут взаимодействовать друг с другом простыми обращениями к
- •Недостатки
- •Схема мультикомпьютера
- •Коммуникационные сети
- •Топология
- •Характеристики
- •Пропускная способность
- ••Различные
- •Звезда
- •Полная взаимосвязь
- •Дерево
- ••Кольцо - это одномерная топология, поскольку каждый отправленный пакет может пойти направо или
- •Трехмерный тор
- •Кубы
- •параллелизмом
- ••Огромные объемы ввода-вывода
- •BlueGene
- •Цель проекта BlueGene
- ••июнь 2003 года - первая микросхема
- •Сердце BlueGene/L
- ••Узел состоит из двух ядер PowerPC 440, работающих с частотой 700 МГц
- ••BlueGene/L: микросхема (а), плата (б), панель (в), стойка (г), система (д)
- ••Для более высокого уровня была разработана специализированная плата, на которую устанавливается пара микросхем,
- ••Максимальная производительность - до 655 360 команд за цикл, или 4,6 х 1014
- •Основные коммуникации
- •Дополнительные
- •Rank - 1
- •Red Storm
- ••Для Red Storm был выбран процессор Opteron производства компании AMD
- •Размещение компонентов
- •Коммуникации
- ••Система при помощи механических переключателей разбивается на две части, секретную и несекретную, которые
- ••Вычислительные узлы работают под управлением облегченного ядра, названного Catamount («дикая кошка»)
- ••Rank - 6
- •Red Storm
- •Кластерные вычисления
- •Механизмом обработки
- •Обработка запроса в
- ••В Google купили дешевые персональные компьютеры со средней производительностью- много компьютеров
- •Типичный кластер Google
- •Производительность
- •Аппаратные метрики
- •Время запаздывания
- •Пропускная способность
- •Программные метрики
- •Приемы повышения производительности
- •Сокращение времени
- •Вопросы?
Цель проекта BlueGene
•Постройка МРР-машины, которая не только была бы самой быстрой, но и самой эффективной в отношении показателей терафлоп/доллар, терафлоп/ватт и терафлоп/м3
•Отказались от принципов, которые были положены
в основу разработки предыдущих МРР-машин и согласно которым применялись самые быстрые компоненты независимо от их цены
•Решено выпустить собственный однокристальный компонент, работающий с умеренной скоростью и обладающий низким энергопотреблением
•июнь 2003 года - первая микросхема
•ноябре 2004 - первая четверть BlueGene/L из 16 384 вычислительных узлов
•Сертифицирована как самый быстрый на Земле суперкомпьютер с производительностью 71 терафлоп/с, мощность - 0,4 мегаватт
•В целом система должна была содержать 65 536 узлов
Сердце BlueGene/L
•Специализированный микропроцессор в системе BlueGene/L
•Узел состоит из двух ядер PowerPC 440, работающих с частотой 700 МГц
•PowerPC 440 — это конвейеризованный сдвоенный суперскалярный процессор, популярный во встраиваемых системах
•В каждом ядре имеется пара сдвоенных блоков выполнения операций с плавающей точкой (Floating Point Unit, FPU), что в сумме позволяет за один цикл выполнять 4 команды с плавающей точкой
•BlueGene/L: микросхема (а), плата (б), панель (в), стойка (г), система (д)
•Для более высокого уровня была разработана специализированная плата, на которую устанавливается пара микросхем, а также оперативная память на 1 Гбайт
•Платы монтируются на встраиваемой панели, по 16 плат на панель, что дает 32 на панель
•На следующем уровне 16 этих панелей вставляются в верхнюю часть стойки, другие 16
— в нижнюю, в результате в стойке размером 60 х 90 см оказываются 1024 процессора
•Две группы панелей разделены переключателем, благодаря которому одну группу можно извлечь из системы для
обслуживания, а на это время подключить резервную
•Максимальная производительность - до 655 360 команд за цикл, или 4,6 х 1014 команд в секунду
•BlueGene/L система является самым большим компьютером из всех построенных в мире
•Система довольно проста и в ней не используются какие-либо особенные технологии, за исключением чрезвычайно плотного размещения узлов
•Среднее время наработки на отказ до 10 дней
•Узлы ввода-вывода работают под управлением традиционной ОС Linux и поддерживают многозадачность
Основные коммуникации
•Все соединения являются двухточечными и работают на скорости 1,4 Гбит/с
•От каждого из 65 536 узлов к «следующим по порядку» узлам идут три линии связи, по одной на каждое измерение - общая пропускная способность системы составляет 275 Тбайт/с
•Взаимодействие в трехмерном торе поддерживается в форме виртуальной сквозной маршрутизации (virtual cut through routing)
Дополнительные
коммуникации
• Вторая сеть имеет древовидную структуру
• Третья сеть используется для глобальных приостановок и прерываний
• Четвертая и пятая сети построены на основе технологии Gigabit Ethernet
– одна соединяет узлы ввода-вывода с файловыми серверами, не входящими в систему BlueGene/L
– другая используется для отладки системы
• На каждом вычислительном и коммуникационном узле работает специализированная малая операционная система, поддерживающая одного пользователя и один процесс
Rank - 1
Computer - BlueGene/L - eServer Blue Gene Solution Processors - IBM PowerPC 440 700 MHz - 212992 Year – Ноябрь 2007
Реальная производительность – 478 TFlops Пиковая производительность – 596 TFlops