
- •Что такое параллельные вычислительные системы и зачем они нужны
- •Некоторые примеры использования параллельных вычислительных систем Об использования суперкомпьютеров
- •Классификация параллельных вычислительных систем
- •Классификация современных параллельных вычислительных систем с учетом структуры оперативной памяти, модели связи и обмена Симметричные скалярные мультипроцессорные вычислительные системы
- •Несимметричные скалярные мультипроцессорные вычислительные системы
- •Массово параллельные вычислительные системы с общей оперативной памятью
- •Массово параллельные вычислительные системы с распределенной оперативной памятью
- •Серверы
- •Требования к серверам Основные компоненты и подсистемы современных серверов
- •Структуры несимметричных мвс с фирмы Intel Структурные особенности процессоров со структурой Nehalem
- •Структуры мвс с процессорами Nehalem
- •Мвс на базе процессоров фирмы amd
- •Структура шестиядерного процессора Istanbul приведена на рис. 23.
- •Примеры структур несимметричных мвс с процессорами линии Opteron Barcelona, Shanghai, Istanbul
- •Сравнение структур мвс с процессорами Barcelona, Shanghai, Istanbul с мвс с процессорами со структурой Nehalem
- •12 Ядерные процессоры Magny-Cours
- •Основные особенности 12-ти и 8-ми ядерных микросхем Magny-Cours
- •Структуры мвс с процессорами Magny--Cours
- •Перспективы развития процессоров фирмы amd для мвс
- •Мвс на базе процессоров фирмы ibm power6, power7 Основные особенности процессоров power6, power7
- •Процессор power6
- •Структуры мвс на базе процессоров power4, power5
- •Структуры мвс на базе процессоров power6, power7
- •Требования к серверам
- •Основные компоненты и подсистемы современных серверов
- •Поддерживаемые шины ввода-вывода
- •Raid контроллеры
- •Сервер Superdome 2 для бизнес-критичных приложений
- •Структура сервера
- •Надежность и доступность
- •Конфигурации и производительность
- •Основные особенности симметричных мультипроцессорных систем?
- •Векторные параллельные системы
- •Скалярная и векторная обработка
- •Основные особенности векторных параллельных систем
- •Векторные параллельные системы sx-6, sx-7 фирмы nec
- •Особенности вычислительной системы sx-7
- •Параллельная векторная система Earth Simulator
- •Cуперкластерная система
- •Суперкомпьютер CrayXt5h
- •«Лезвия» векторной обработки Cray x2
- •«Лезвия» с реконфигурируемой структурой
- •Массово параллельные вычислительные системы с скалярными вычислительными узлами и общей оперативной памятью
- •Массово параллельные вычислительные системы с скалярными вычислительными узлами и распределенной оперативной памятью
- •Cуперкомпьютеры семейства cray xt Семейство Cray xt5
- •«Гибридные» суперкомпьютеры CrayXt5h
- •«Лезвия» векторной обработки Cray x2
- •«Лезвия» с реконфигурируемой структурой
- •Развитие линии Cray хт5 – Cray xt6/xt6m
- •Модель Cray xe6
- •Процессор
- •Коммуникационная среда с топологией «3-мерный тор»
- •Реализация коммуникационных сред
- •Операционная система
- •Суперкомпьютер RoadRunner
- •Топологии связей в массово параллельных системах
- •Оценка производительности параллельных вычислительных систем
- •Необходимость оценки производительности параллельных вычислительных систем
- •Реальная производительность параллельных вычислительных систем Анализ «узких мест» процесса решения задач и их влияния на реальную производительность
- •«Узкие» места, обусловленные иерархической структурой памяти
- •Влияние на реальную производительность параллельных вычислительных систем соответствия их структуры и структуры программ
- •Анализ реальной производительности («узких» мест) мвс с общей оперативной памятью
- •Анализ реальной производительности («узких» мест) кластерных систем с распределённой оперативной памятью
- •Какие «узкие места» процесса решения задач существенно влияют на реальную производительность параллельных вычислительных систем?
- •Тенденции развития суперкомпьютеров. Список top500
- •Что такое список тор 500 и как он создается?
- •38 Редакция списка (ноябрь 2011 г.)
- •Коммуникационные технологии
- •Архитектуры, модели процессоров и их количество в системах списка
- •Основные тенденции развития суперкомпьютеров
- •Перспективные суперкомпьютеры тера- и экзафлопного масштаба
- •Производительность 500 лучших суперкомпьютеров за последние 18 лет
- •Перспективные суперкомпьютеры тера- и экзафлопного масштаба
- •Программа darpa uhpc
- •Основные положения программы uhpc
- •Экзафлопсный барьер: проблемы и решения
- •Проблемы
- •Эволюционный путь
- •Революционный путь
- •Кто победит?
- •Примеры перспективных суперкомпьютеров Суперкомпьютер фирмы ibm Mira
- •Стратегические суперкомпьютерные технологии Китая
Примеры структур несимметричных мвс с процессорами линии Opteron Barcelona, Shanghai, Istanbul
Процессоры Barcelona, Shanghai, Istambul с тройным интерфейсом HyperTransport позволяли создавать несимметричные 4-х и 8-ми сокетные вычислительные системы. Пример четырехсокетной вычислительной системы с процесорами Barcelona приведен на рис. 25, а 8-ми сокетной – на рис. 26.
Рис. 25. Структура 4-хсокетной вычислительной системы
Рис. 26. Структура 8-ми сокетной вычислительной системы
Сравнение структур мвс с процессорами Barcelona, Shanghai, Istanbul с мвс с процессорами со структурой Nehalem
Так как в микросхемах процессоров Barcelona, Shanghai, Istanbul имеется только три порта HT, то в 4-х сокетной МВС при обращении в наиболее удаленную оперативную память необходимо выполнить 2 перехода, вместо одного в идеальном варианте.
В микросхемах процессоров со структурой Nehalem имеется 4 порта QPI (аналог портов HT) и при обращении в наиболее удаленную оперативную память необходимо выполнить 1 переход (идеальный вариант).
В восьмисокетных МВС с процессорами Barcelona, Shanghai, Istanbul при обращении в наиболее удаленную оперативную память необходимо выполнить 3 перехода, в то время как в системах с процессорами со структурой Nehalem - только 2 перехода.
В процессорах Barcelona, Shanghai, Istanbul реализован только двухканальный контроллер оперативной памяти стандарта DDR2, в то время как в процессорах со структурой Nehalem имеется трехканальный контроллер оперативной памяти стандарта DDR3. Оперативная память стандарта DDR3 обеспечивает большую пропускную способность по сравнению с оперативной памятью стандарта DDR2.
В n-ядерной МВС с процессорами со структурой Nehalem одновременно может выполняться 2n потоков, так как в каждом ядре имеется технология Hyper Threading (в одном физическом ядре выполняются одновременно 2 потока).
В процессорах Barcelona, Shanghai, Istanbul отсутствует технология подобная технологии Hyper Threading. Это означает, что в n-ядерной МВС с одновременно может выполняться только n потоков.
Конечно, технология Hyper Threading не обеспечивает удвоения производительности отдельно взятого ядра. В зависимости от типов выполняемых потоков реальное ускорение может составлять от одного до несколько десятков процентов. Однако, даже такое ускорение обеспечивает превосходство МВС с процесорами линии Nehalem.
12 Ядерные процессоры Magny-Cours
Для упрочения позиций в секторе МВС и преодоления отставания от фирмы Intel фирма AMD разработала 12- и 8-ядерные процессоры Magny-Cours. Эта платформа была представлена в конце марта 2010 г.
Микросхемы процессоров Magny-Cours состоят из двух кристаллов (процессоров Istanbul): двух шестиядерных в случае 12-ядерных микросхем и двух четырехъядерных - для 8-ядерных. Тем самым, фирма AMD отказалась от размещения всех ядер на одном кристалле в пользу микросборки из двух отдельных кристаллов.
Каждый 6- или 4-х ядерный кристал процессора Istanbul 12-ти или 8-ми ядерной микросхемы (процессора Magny-Cours) фирма AMD назвала термином "узел". Итак, микросхема (процессор) Magny-Cours состоит из двух "узлов", которые общаются друг с другом посредством четырех 16-разрядных линий интерфейса HyperTransport.
Чтобы удержать тепловыделение в приемлемых рамках, пришлось ограничить тактовую частоту 12-ядерных моделей значением 2,3 ГГц, а 8-ядерных -- 2,4 ГГц.