Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Jaguar_XK-6.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
1.01 Mб
Скачать
  1. Процессор amd Opteron

AMD Opteron 6200 Series первый в мире 16-ядерный серверный процессор архитектуры x86 с самой высокой плотностью ядер для высокой масштабируемости и работы с многопоточной рабочей нагрузкой (к примеру: виртуализация, облачные и высокопроизводительные вычисления, базы данных и бизнес-приложения).

Инновационная модульная архитектура «Bulldozer» позволяет включить больше ядер, в сравнении с предыдущими поколениями.

Рисунок 4 - Архитектура модуля AMD Bulldozer

В основе чипов Bulldozer лежат модули с двумя вычислительными блоками x86. При этом блоки не являются полностью автономными – некоторые ресурсы общие для обоих ядер. В частности, блок предварительной выборки, декодер инструкций, FPU (регистры общего назначения) и кеш-память второго уровня (L2). Монолитный двухъядерный модуль обеспечивает одновременное выполнение двух потоков.

Организация кэша также заметно отличается о той, что была у предшественников. Кеш-данных L1 уменьшился с 64 КБ до 16 КБ на ядро, в то же время существенно возросла его пропускная способность. L2 объемом 2 МБ является общим для обоих ядер каждого модуля, т.е. 2МБх8. Латентность его несколько увеличена – обусловлено платой за оптимизацию для работы на повышенных частотах. Чипы с архитектурой Bulldozer также оснащены L3-кешем объемом 16 МБ.

Размер кеша

Общий кеш: 32MB (16 ядер)

L1 Cache: 16KB/ядро + 64KB instruction/module

L2 Cache: 1MB (на ядро)

L3 Cache: 16MB (на сокет)

Технология процесса

32-nanometer SOI (silicon-on-insulator) technology

Скорость системной шины

HyperTransport™ 3.0

4X HT3 соединение с пропускной способностью 6.4 GT/s на канал

Память

Интегрированный контроллер памяти DDR3 с 102.4 GB/s пропускной спобосности на CPU для Socket G34

Число каналов/Типы памяти

4 канала поддерживающих U/RDDR3до DDR3-1600 и ULV (1.25V) RDDR3 до DDR3-1333 и LRDIMM до DDR3-1333

Размер

316мм2

Установка

Socket G34 — 1944-pin organic Land Grid Array (LGA)

Мощность

115 W

Основные характеристики процессора AMD Opteron 6274:

  1. Процессор nVidia Tesla x2090.

Являясь дополнительными процессорами к CPU, графические процессоры Tesla увеличивают скорость приложений для высокопроизводительных вычислений до 10 раз. Основанные на архитектуре NVIDIA CUDA под кодовым названием «Kepler», графические процессоры Tesla X2090 позволяют достигать до 665 гигафлоп производительности при операциях с двойной точностью, 1,3 терафлоп при операциях с одинарной точностью, поддерживают защиту памяти ECC и КЭШ L1 и L2.

Платформа параллельных вычислений CUDA обеспечивает набор расширений для языков C и С++, позволяющих выражать как параллелизм данных, так и параллелизм задач на уровне мелких и крупных структурных единиц. Программист может выбрать средства разработки: языки высокого уровня, такие как C, C++, Fortran или же открытые стандарты, такие как директивы OpenACC. Платформа параллельных вычислений CUDA используется на сегодняшний день в тысячах приложений с GPU-ускорением и тысячах опубликованных научных статьях.

Архитектура SMX обеспечивает большую энергоэффективность и производительность обработки данных благодаря новому инновационному строению потоковых мультипроцессоров, которое позволяет использовать большую площадь для размещения ядер по сравнению с управляющей логикой.

Динамика Kepler GPU упрощает процесс программирования GPU, позволяя программистам с легкостью ускорять все параллельные вложенные циклы. Это приводит к тому, что GPU динамически порождает новые потоки без возврата к CPU.

Hyper-Q сокращает время ожидания CPU, позволяя многочисленным ядрам CPU одновременно использовать один GPU на базе архитектуры Kepler и значительно увеличивая возможности программирования и энергоэффективность.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]