Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции / Приложения / AppCompHistory.doc
Скачиваний:
25
Добавлен:
20.06.2014
Размер:
947.2 Кб
Скачать

Intel Teraflops Research Chip

В 2007 был продемонстрирован опытный работающий образец процессора Intel Teraflops Research Chip (Larrabee), анонс которого был намечен на 2009 год, выпуск — на 2010 год

Intel Teraflops Research Chip — суперкомпьютер на одном кристалле ("Era of Tera" — Патрик Гелсингер).

Для сравнения — впервые терафлопная производительность была достигнута на суперкомпьютере ASCI Red, созданном в 1996 году Intel для Sandia National Laboratory. ASCI Red включал 10 тыс. процессоров Pentium Pro 200 МГц, состоял более чем из сотни шкафов, занимал площадь 185 кв. м и потреблял 500 КВт электроэнергии. Еще 500 КВт требовалось для его охлаждения.

Основные характеристики Intel Teraflops Research Chip:

  • количество ядер — 80;

  • технология 65 нм;

  • размер кристалла 2214 мм;

  • корпус LGA-1248, 343 вывода — сигнальные, остальные — питание;

  • 96-разрядная VLIW-архитектура;

  • производительность — 1,01-1,81 Тфлопс.

80 независимых вычислительных ядер расположены на кристалле в виде прямоугольного массива 810 ячеек.

Структура ядра:

  • вычислительный блок — два FPU и кэш 5 Кбайт;

  • пятипортовый маршрутизатор для передачи данных и команд в другие ядра.

Межъядерные соединения представляют "внутрикристальную сеть" с пропускной способностью несколько терабит в секунду.

Для снижения энергопотребления вычислительный блок каждого ядра запитывается независимо от маршрутизатора, что позволяет ядру в случае отсутствия вычислительной нагрузки работать только в качестве канала передачи данных.

Характеристики основных моделей Teraflops Research Chip:

Тактовая частота, ГГц

Напряжение питания, В

Потребляемая мощность, Вт

Пропускная способность, Тбит/с

Производительность Тфлопс

3,16

0,95

62

1,62

1,01

5,10

1,20

175

2,61

1,63

5,70

1,35

265

2,92

1,81

Для программирования процессора Intel разработала расширение языка C/C++ под названием Ct. Программный код оптимизируется (распараллеливается) и во время компиляции, и во время исполнения.

В конце 2009 года на конференции SC09 Intel продемонстрировала ПК с Larrabee производительностью 1 Тфлопс. Однако на тот момент это уже не было достижением, некоторые графические процессоры AMD-ATI уже имели такую производительность. Поэтому планы выпуска процессоров Larrabee были скорректированы.

В мае 2010 г. Intel прекратила работу над проектом Larrabee и сосредоточилась на разработке следующего поколения процессоров Core с интегрированной графикой.

Core 2 Extreme

Core 2 Extreme QX6850 (2007):

  • 65 нм;

  • 3 ГГц;

  • FSB 1333 МГц;

  • 4 ядра;

  • L2 8 Мбайт.

Celeron Dual Core

Celeron Dual Core E1200 (2007):

  • 1,6 ГГц;

  • FSB 800 МГц;

  • Socket 775;

  • 2 ядра;

  • L2 512 Кбайт.

Penryn

Penryn (2007) — линия 45-нм процессоров. Ниже перечислены некоторые представители этой линии и их основные характеристики.

Core 2 Extreme QX9650:

  • 45 нм;

  • 3 ГГц;

  • FSB 1333 МГц;

  • 4 ядра;

  • L2 12 Мбайт.

Core 2 Extreme QX9775:

  • 45 нм;

  • 3,2 ГГц;

  • FSB 1600 МГц;

  • 4 ядра;

  • L2 12 Мбайт.

Core 2 Quad Q9550:

  • 45 нм;

  • 2,83 ГГц;

  • FSB 1333 МГц;

  • 4 ядра;

  • L2 12 Мбайт.

Семейство VIA Nano

В конце мая 2008 VIA Technologies объявила о выпуске нового семейства VIA Nano.

Основные характеристики семейства VIA Nano:

  • 64-разрядная архитектура x86;

  • микроархитектура Isaiah;

  • технология 65 нм.

Семейство VIA Nano включает несколько моделей, отличающихся тактовой частотой и потребляемой мощностью:

  • L2100 — 1,8 ГГц, 25 Вт;

  • L2200 — 1,6 ГГц, 17 Вт;

  • U2300 — 1,3 ГГц, 8 Вт;

  • U2400 — 1,2 ГГц, 6,8 Вт;

  • U2500 — 1,0 ГГц, 5 Вт.

Компьютер IBM Roadrunner

Roadrunner был разработан IBM в 2008 году для Лос-Аламосской национальной лаборатории министерства энергетики США. Это был первый компьютер, достигший петафлопной производительности. В рейтинге Top500 за ноябрь 2008 года Roadrunner занял первое место.

Его характеристики:

  • 12960 процессоров PowerXCell8i 3,2 ГГц и 6948 процессоров Opteron DC 1,8 ГГц;

  • общее число ядер — 122400;

  • память — 80 Тбайт;

  • пиковая производительность 1375776 GFlops;

  • максимально достигнутая реальная производительность 1042 TFlops;

  • операционная система Linux;

  • занимаемая площадь — 560 кв. м;

  • масса — 227 т;

  • потребляемая мощность — 2,4 МВт;

  • стоимость — 100 млн. долл.

Atom

В 2008 появилось новое семейство процессоров Intel — Atom с одноименной микроархитектурой. Основной чертой микроархитектуры Atom является наличие двух 16-стадийных конвейеров без переупорядочивания команд (in-order pipeline), так что за один такт могут быть выполнены две команды.

Отсутствие переупорядочивания снижает производительность, зато уменьшает энергопотребление. Процессоры этого семейства имеют низкое энергопотребление — единицы и доли ватта — и предназначены для мобильных и встроенных систем. Однако наиболее производительные представители этого семейства могут быть использованы и в обычных настольных персональных компьютерах.

Один из самых производительных процессоров этого семейства Atom330 имеет следующие характеристики:

  • архитектура Intel64;

  • 2 ядра с технологией HT (Hyper Threading), т.е. четыре потока;

  • кэш 1 Мбайт;

  • технология 45 нм;

  • 94 млн. транзисторов;

  • тактовая частота 1,6 ГГц;

  • FSB 533 МГц;

  • потребляемая мощность 8 Вт;

  • корпус PBGA437;

  • чипсет Intel 945GC Express или Nvidia ION.

Впоследствии на основе процессоров Atom появились проекты кластеров с ориентацией, в первую очередь, на роль серверов ЦОДа, поскольку в этой области проблема энергопотребления стоит особенно остро.

Примером такого кластера является FAWN (Fast Array of Wimpy Nodes, быстродействующая матрица маломощных узлов) (рис.).

Рис. Кластер FAWN на процессорах Atom

Он был представлен на дне открытых дверей 28 сентября 2010 года в Intel Labs. Каждый модуль кластера включает процессор Atom и полупроводниковый накопитель (SSD).

Еще один пример кластера на основе Atom — система SM10000 компании SeaMicro, которая может масштабироваться до 512 процессоров.

Соседние файлы в папке Приложения