- •Что такое параллельные вычислительные системы и зачем они нужны
- •Некоторые примеры использования параллельных вычислительных систем Об использования суперкомпьютеров
- •Классификация параллельных вычислительных систем
- •Классификация современных параллельных вычислительных систем с учетом структуры оперативной памяти, модели связи и обмена Симметричные скалярные мультипроцессорные вычислительные системы
- •Несимметричные скалярные мультипроцессорные вычислительные системы
- •Массово параллельные вычислительные системы с общей оперативной памятью
- •Массово параллельные вычислительные системы с распределенной оперативной памятью
- •Серверы
- •Требования к серверам Основные компоненты и подсистемы современных серверов
- •Структуры несимметричных мвс с фирмы Intel Структурные особенности процессоров со структурой Nehalem
- •Структуры мвс с процессорами Nehalem
- •Мвс на базе процессоров фирмы amd
- •Структура шестиядерного процессора Istanbul приведена на рис. 23.
- •Примеры структур несимметричных мвс с процессорами линии Opteron Barcelona, Shanghai, Istanbul
- •Сравнение структур мвс с процессорами Barcelona, Shanghai, Istanbul с мвс с процессорами со структурой Nehalem
- •12 Ядерные процессоры Magny-Cours
- •Основные особенности 12-ти и 8-ми ядерных микросхем Magny-Cours
- •Структуры мвс с процессорами Magny--Cours
- •Перспективы развития процессоров фирмы amd для мвс
- •Мвс на базе процессоров фирмы ibm power6, power7 Основные особенности процессоров power6, power7
- •Процессор power6
- •Структуры мвс на базе процессоров power4, power5
- •Структуры мвс на базе процессоров power6, power7
- •Требования к серверам
- •Основные компоненты и подсистемы современных серверов
- •Поддерживаемые шины ввода-вывода
- •Raid контроллеры
- •Сервер Superdome 2 для бизнес-критичных приложений
- •Структура сервера
- •Надежность и доступность
- •Конфигурации и производительность
- •Основные особенности симметричных мультипроцессорных систем?
- •Векторные параллельные системы
- •Скалярная и векторная обработка
- •Основные особенности векторных параллельных систем
- •Векторные параллельные системы sx-6, sx-7 фирмы nec
- •Особенности вычислительной системы sx-7
- •Параллельная векторная система Earth Simulator
- •Cуперкластерная система
- •Суперкомпьютер CrayXt5h
- •«Лезвия» векторной обработки Cray x2
- •«Лезвия» с реконфигурируемой структурой
- •Массово параллельные вычислительные системы с скалярными вычислительными узлами и общей оперативной памятью
- •Массово параллельные вычислительные системы с скалярными вычислительными узлами и распределенной оперативной памятью
- •Cуперкомпьютеры семейства cray xt Семейство Cray xt5
- •«Гибридные» суперкомпьютеры CrayXt5h
- •«Лезвия» векторной обработки Cray x2
- •«Лезвия» с реконфигурируемой структурой
- •Развитие линии Cray хт5 – Cray xt6/xt6m
- •Модель Cray xe6
- •Процессор
- •Коммуникационная среда с топологией «3-мерный тор»
- •Реализация коммуникационных сред
- •Операционная система
- •Суперкомпьютер RoadRunner
- •Топологии связей в массово параллельных системах
- •Оценка производительности параллельных вычислительных систем
- •Необходимость оценки производительности параллельных вычислительных систем
- •Реальная производительность параллельных вычислительных систем Анализ «узких мест» процесса решения задач и их влияния на реальную производительность
- •«Узкие» места, обусловленные иерархической структурой памяти
- •Влияние на реальную производительность параллельных вычислительных систем соответствия их структуры и структуры программ
- •Анализ реальной производительности («узких» мест) мвс с общей оперативной памятью
- •Анализ реальной производительности («узких» мест) кластерных систем с распределённой оперативной памятью
- •Какие «узкие места» процесса решения задач существенно влияют на реальную производительность параллельных вычислительных систем?
- •Тенденции развития суперкомпьютеров. Список top500
- •Что такое список тор 500 и как он создается?
- •38 Редакция списка (ноябрь 2011 г.)
- •Коммуникационные технологии
- •Архитектуры, модели процессоров и их количество в системах списка
- •Основные тенденции развития суперкомпьютеров
- •Перспективные суперкомпьютеры тера- и экзафлопного масштаба
- •Производительность 500 лучших суперкомпьютеров за последние 18 лет
- •Перспективные суперкомпьютеры тера- и экзафлопного масштаба
- •Программа darpa uhpc
- •Основные положения программы uhpc
- •Экзафлопсный барьер: проблемы и решения
- •Проблемы
- •Эволюционный путь
- •Революционный путь
- •Кто победит?
- •Примеры перспективных суперкомпьютеров Суперкомпьютер фирмы ibm Mira
- •Стратегические суперкомпьютерные технологии Китая
Сервер Superdome 2 для бизнес-критичных приложений
Сервер Superdome 2 – один из самых мощных современных серверов на базе процессоров Tukwila (Itanium 9300). Интерес к структуре сервера HP Superdome 2 вызван, в частности тем, что широкое распространение кластерных систем привело к тому, что масштабные SMP-серверы вообще появляются не часто. Однако кластерный подход к построению высокопроизводительной системы не всегда приемлем, хотя бы потому, что некоторым приложениям может потребоваться оперативная память слишком большой емкости. Кроме того, не все приложения умеют работать в параллельном окружении кластерных структур, поэтому большие системы с общим полем памяти (структуры SMP или ccNUMA) актуальны и сегодня — кроме сервера Superdome 2 появилось несколько не кластерных серверных систем: SGI Altix UV на базе процессора Intel Xeon, IBM Power 795 на базе Power7, IBM zSeries/z10.
Одной их важнейших черт сервера Superdome 2 является выочайшая надежность — средняя наработка на отказ инфраструктуры cерверов превышает 300 лет.
Структура серверов HP Superdome
Серверы линии Superdome с структурой ccNUMA допускают установку до 64 микросхем процессоров, и в линейке выпускаемых компанией HP серверов они являются самыми мощными. Серверы Superdome ориентированы на выполнение как научно-технических, так и критичных для бизнеса приложений. Каковы перспективы данных систем?
Как следует из данных тестов SPECint_rate2006 и SPECfp_rate2006, процессор Itanium 9300/Tukwilla отстает и от процессора Power7, и от процессоров архитектуры x86, а заявленное фирмой Intel увеличение производительности вдвое обусловлено в первую очередь увеличением числа ядер. В процессоре Tukwilla были реализованы давно провозглашенные фирмой Intel идеи слияния компонентов инфраструктуры процессоров линии Xeon и линии Itanium. В частности, общими c процессорами со структурой Nehalem EX стали каналы межпроцессорной связи QPI (QuickPath Interconnect), интерфейсы работы с памятью — SMI (Scalable Memory Interconnect) и SMB (Scalable Memory Buffer), а также набор микросхем (концентратор ввода-вывода, IOH). Все это позволило снизить стоимость систем на базе Itanium 2, но сегодня этот процессор отстает по производительности от наиболее производительных процессоров линии Xeon. Однако, как отмечают в фирме Intel, процессор Tukwilla ориентирован для работы с бизнес-критичными приложениями, что обеспечивается рядом его особенностей, гарантирующих высокий уровень отказоустойчивости, а также поддержкой многопотоковой обработки (HyperThreading) — (два потока на ядро) и технологии виртуализации Intel VT.
Кроме однотактного кэша L1 (по 16 Кбайт для данных и команд), в структуре процессора Tukwilla представлены кэши L2 (256 Кбайт и 512 Кбайт) и кэш L3, емкость которого зависит от модели, например для модели 9350 — это 24 Мбайт (по 6 Мбайт на ядро). Емкость адресуемой оперативной памяти составляет 1024 Тбайт. В процессоре Tukwilla применяются два встроенных контроллера оперативной памяти, обеспечивающих пропускную способность 34 Гбайт/с, и такое решение доказало свою эффективность. Применение высокопроизводительного последовательного дифференциального интерфейса SMI в Tukwilla предполагает работу с технологией DDR3.
Тактовая частота старшей модели 9350 составляет 1,73 ГГц, которая благодаря технологии Turbo Boost, известной по процессорам линии Xeon, может быть увеличена до 1,86 ГГц. Процессор Tukwilla coдержит 2 млрд транзисторов и производится по технологии 65 нм. «Тепловой пакет» (TDP) микросхемы процессора составляет 185 Вт, обеспечиваются продвинутые средства термического управления процессором и памятью, а для уменьшения энергопотребления предусмотрены средства оптимизации напряжения и тактовой частоты.
32-нм процессоры Itanium Poulson
. Спустя год после анонса процессора Tukwila в 2011 г. было представлено новое семейство серверных процессоров Itanium – Poulson.
Чипы Poulson выполнены с соблюдением норм 32-нм техпроцесса из 3,1 млрд транзисторов и полностью совместимы с платформой Itanium 9300. Новая структура процессора содержит 8 вычислительных ядер и 54 Мбайт кеш-памяти.
Фирма Intel утверждает, чтосемейство процессоров лини Itanium Poulson получилось надежнее и стабильнее, чем процессоры линии Itanium Tukwila. Значительно оптимизировано потребление энергии в сравнении с предшественником. Так, решения на базе структуры Poulson потребляют меньше энергии, даже если процессоры Tukwila перевести на 32-нм техпроцесс (рис. 3).

Рис. 3.
В дальнейших планах фирмы Intel стоит выпуск процессоров Itanium 2 Kittson.
