Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВССиТ_учебник.doc
Скачиваний:
48
Добавлен:
29.03.2016
Размер:
4.89 Mб
Скачать

2.5. Процессоры для высокопроизводительных вычислительных машин и систем

В сфере разработки и применения процессоров для высокопроизводительных вычислительных машин и систем в последние годы произошли значительные стратегические изменения. До середины 1980-х годов высокопроизводительные вычислительные машины и системы (МВК, суперкомпьютеры) создавались как единичные экземпляры специализированного назначения, для которых проектировались уникальные архитектуры дорогостоящих многокомпонентных векторно-конвейерных процессоров, собираемых из большого коли­чества микросхем. К настоящему времени высокопроизводительные вычислительные машины и системы переходят в разряд серийно выпускаемых и относительно широко востребуемых изделий. Поэтому разработчикам таких систем экономически целесообразнее использовать в своей продукции серийно выпускаемые микроэлектронные компоненты, тем более что прогресс в их характеристиках и производстве превратил микропроцессоры, микросхемы памяти и адаптеры вне­шних устройств со стандартными интерфейсами в доступные и эффективные устройства. В свою очередь применение серийных компонентов позволило относительно легко масштабировать МВК до значительного числа процессоров (см. раздел 13). Ориентация на массовый рынок изделий микроэлектроники, выпуск которых достаточно хорошо освоен промышленностью, также дает возможность значительно сократить сроки и стоимость производства МВК, сконцентрировав при этом основные усилия на совершенствовании и разработке новых архитектурных решений вычислительных комплексов в целом.

На рынке процессоров для высокопроизводительных вычислительных машин и систем (особенно в сегменте самых мощных из них) до последнего времени преобладали традиционные для этой сферы применения процессоры, такие как Alpha корпорации DEC, UltraSPARC корпорации Sun Microsystems, PA-RISC корпорации Hewlett-Packard, Power корпорации IBM, MIPS корпорации SGL. Однако лидирующие позиции на нем начинают занимать производители х86-процессоров, которым удалось практически полностью занять средний и нижний ценовые сегменты. И AMD, и Intel пользуются на этом рынке примерно той же стратегией, что и на мобильном. Они предлагают адаптированные для данных условий процессоры своих модельных рядов, доля продаж которых применительно к высокопроизводительным вычислительным машинам и системам благодаря относительно невысокой цене и большому количеству программного обеспечения для х86-архитектуры непрерывно увеличивается. Intel предлагает серию процессоров Хеоn двух модификаций. Первая из этих модификаций – Хеоn DP для рабочих станций и двухпроцессорных серверов – представляет собой практически полный аналог Pentium 4 с поддержкой многопроцессорности. Другая модификация – многопроцессорная версия Хеоn МP – оснащается кэш-памятью третьего уровня, объем которой составляет 1 или 2 Мбайт. Эти процессоры чаще всего используются в четырехпроцессорных конфигурациях, они имеют 400-МГц системную шину и оснащены средствами Hyper-Threading. AMD для высокопроизводительных вычислительных машин и систем до недавнего времени предлагала серию процессоров Athlon MP, представляющих собой полный аналог Athlon ХP, но способных работать в двухпроцессорных конфигурациях. Athlon MP смог завоевать немалую популярность благодаря выгодному сочетанию цена/производительность.

Дальнейшее усиление позиций корпораций Intel и AMD связано с внедрением 64-разрядных процессоров. Самые производительные вычислительные системы уже давно строятся на базе 64-разрядных RISC-процессоров, таких, например, как вышеупомянутые процессоры Alpha, Power, UltraSPARC, PA-RICS. Переход на 64 разряда дает то же, что в свое время дал переход от 8 к 16 и затем от 16 к 32 разрядам: значительное увеличение объема прямоадресуемой памяти и повышение скорости и/или точности некоторых вычислений. Intel и AMD при проектировании 64-разрядных процессоров используют почти прямо противоположные подходы. Создаваемая Intel архитектура не является продолжением х86. Хотя возможность использования программного обеспечения для х86 остается, делать это нецелесообразно, так как достигаемый при этом уровень производительности невысок. AMD же, наоборот, предлагает 64-разрядное расширение архитектуры х86, способное эффективно работать как на 32-, так и на 64-разрядных задачах. 64-разрядная архитектура IA-64 разрабатывается Intel с 1994 года при активном участии корпорации Hewlett-Packard. Эта архитектура имеет идеологию VLIW и реализована в ее усовершенствованном варианте EPIC. Архитектура IA-64 впервые была применена Intel в 2001 году в процессоре Itanium с ядром Merced. Это сложный и дорогой процессор, содержащий 325 млн транзисторов: 25 млн в процессорном ядре, включая кэш-память первого и второго уровней объемом 32 и 96 Кбайт соответственно, и по 75 млн в каждой из четырех дополнительных микросхем, составляющих в сумме кэш-память третьего уровня объемом 4 Мбайт. Itanium поддерживает до 4 включенных параллельно процессоров (для их большего количества необходим соответствующий мост). На этом процессоре удалось достичь тактовой частоты 800 МГц и не более. Следующим шагом стал выпуск в 2002 году процессора Itanium 2 на базе ядра McKinley. По сравнению с Merced он быстрее, компактнее и намного лучше по всем основным параметрам. В Itanium 2 кэш-память второго уровня увеличена до 256 Кбайт, кэш-память третьего уровня ( до 3 Мбайт) интегрирована в процессорное ядро.

Предлагаемое AMD 64-разрядное решение х86-64 реализуется в архитектуре Hammer, относящейся к восьмому поколению процессоров х86. Архитектура Hammer достаточно близка к архитектуре процессора Athlon, то есть является ее 64-разрядным расширением. Также имеется девять исполнительных блоков и конвейер длиной 12 стадий (конвейер увеличен на две стадии для увеличения предельных тактовых частот). Длина регистров увеличена до 64 бит, добавлено несколько новых регистров. Введено некоторое количество новых 64-разрядных инструкций. Поддерживается новый и весьма эффективный набор операций с плавающей точкой, использующий 16 новых 128-разрядных регистров. Объем кэш-памяти второго уровня – до 1 Мбайт.

64-разрядный процессор AMD Opteron представлен в 2003 году. Он стартовал с частоты 1400 МГц. Opteron имеет много преимуществ как перед 64-разрядными серверными процессорами Intel, так и перед традиционными 64-разрядными процессорами Alpha, Power PC, UltraSPARC, MIPS. Основной плюс Opteron: при относительно невысоких значениях цены и тепловыделения эти процессоры обладают высокой производительностью. Важным моментом следует признать и то, что разработка корпорации AMD, несмотря на 64-разрядную архитектуру, уже сейчас обеспечена достаточным количеством программного обеспечения. В первую очередь это заслуга архитектуры х86-64, которая благодаря своей обратной совместимости с 32-разрядной системой команд х86 позволяет без потерь и даже с выигрышем в быстродействии исполнять обычный 32-битный программный код.

Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем представлены в табл. 2.2.

Таблица 2.2

Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем

Модель

процессора

Кодовое

наименование процессорного

ядра

Тактовая частота

процессора, ГГц

Частота системной шины, MГц

Кэш-память L2,

Кбайт

Норма тех-

процесса, мкм

Типичное

тепловыделение,

Вт

Intel

Xeon DP

Gallatin

Nocona

Irwindale

3,2

3,6

3,6

533

800

800

512

512

2048

0,13

0,09

0,09

70–75

70–75

70–75

Intel

Xeon MP

Gallatin

Potomac

Cranford

3,0

3,33

3,66

400

400

400

512

1024

1024

0,13

0,09

0,09

67–74

67–74

67–74

Intel

Itanium 2

McKinley

Madison

Deerfield

Madison 9M

1,0

1,6

1,6

1,6

400

533

667

800

256

256

256

256

0,18

0,13

0,13

0,09

100

120

120

120

Intel

Pentium D

Prescott

3,2

800

2048

0,09

69

AMD

Opteron

SledgeHammer

Venus/Troy/Athens

Denmark/Italy

2,4

2,6

2,2

800

1000

1000

1024

1024

2048

0,13

0,09

0,09

55–95

55–95

55–95

IBM

Power4+,

Power5

1,9

800

2048

0,13

140

Резюме

Центральный процессор (или просто – процессор) является основным вычислительным устройством ВМ, в задачу которого входит исполнение находящейся в памяти машины программы. В состав процессора входят арифметико-логическое устройство, устройство управления и набор устройств локальной памяти процессора (регистры памяти). АЛУ осуществляет функции арифметической и логической обработки информации. УУ выполняет функции управления вычислительным процессом и осуществляет автоматическое исполнение программы. Регистры памяти используются для хранения данных, необходимых для выполнения текущих операций. В состав современных процессоров также входит некоторый набор дополнительных буферных запоминающих устройств, называемых кэш-памятью. Эту память процессор использует для временного (промежуточного) хранения текущей и наиболее часто востребуемой информации.

Главным показателем эффективности работы и технического совершенства процессора является его производительность, которая зависит от параметров самого процессорного ядра, подсистемы памяти, процессорной шины. Разрядность регистров процессора определяет диапазон допустимых значений операндов (длину слова). Одним из основных путей увеличения тактовой частоты работы процессоров является снижение проектных норм технологического процесса, определяющих размеры элементарных электронных компонентов. Увеличение количества операций, выполняемых за один такт работы процессора, достигается путем эффективного использования кэш-памяти и совершенствования архитектурного построения процессора.

Одним из наиболее действенных способов повышения производительности процессоров является внедрение в вычислительный процесс механизма конвейерной обработки команд. Производи­тельность конвейера может существенно снижаться в силу имеющих место в конвейере конф­ликтных ситуаций, таких как конф­ликты по ресурсам, по данным и по управлению. Для преодоления конф­ликтных ситуаций в процессоре используются различные аппаратные и программные схемы и механизмы. Наибо­лее эффективными способами борьбы с конфликтами по управлению в современных процессорах являются стратегии статического и динамического предсказания условных переходов. Прогрессивным архитектурным решением является суперконвейеризация, которая заключается в увеличении количества сту­пеней конвейера как за счет добавления новых ступеней, так и путем дробле­ния имеющихся ступеней на несколько более простых подступеней.

Процессоры с расширенной системой команд, реализующих на аппаратурном уров­не сложные операторы языков программирования высокого уровня, принято называть процессорами с полным набором команд или процессорами с CISC-архитектурой. Более простая по аппаратной реализации архи­тектура процессоров с сокращенным набором команд или RISC-архитектура базируется на использовании менее сложных команд и построении в результате этого максимально эф­фективного конвейера команд.

Еще одним эффективным архитектурным решением, вводящим в вычислительный процесс определенный уровень параллелизма, является применение векторных (потоковых) и матричных схем работы процессоров, которые используются для обработки многокомпонентных операндов типа векторов и массивов. Дополнительный параллелизм вычислений реализуется в суперскалярных процессорах, включающих в свой состав не­сколько самостоятельных функциональных исполнительных блоков, каждый из которых отвечает за определенный класс выполняемых операций.

В последнее время внедряется новая VLIW-архитектура процессора со сверхдлинными командами, образуемыми более простыми командами типа RISC. При этом благодаря отсутствию сложных аппаратных механизмов, характерных для суперскалярных процессоров, (таких, как предсказание переходов, внеоче­редное исполнение и т. п.), достигается значительный выигрыш в производительности.

Процессоры ВМ прошли сложный путь эволюции от первого относительно простого 4-разрядного микропроцессора i4004 до современных 32- и 64-разрядных высокопроизводительных процессоров Pentium 4, Xeon, Itanium корпорации Intel и Athlon XP, Athlon 64, Opteron корпорации AMD, а также других менее распространенных моделей. Для рынка недорогих массовых компьютеров корпорациями Intel и AMD предлагаются более дешевые варианты своих базовых процессоров: Celeron, Duron, Sempron. Ведущие производители процессоров (а это, главным образом, Intel и AMD) все более четко позиционируют свои изделия по классам компьютеров, для которых эти процессоры предназначаются. Процессоры для мобильных переносных ПК характеризуются малыми величинами энергопотребления и тепловы­деления. Процессорам для высокопроизводительных вычислительных машин и систем присущи более сложные схемные решения. Специфическими особенностями таких процессоров являются повышенные частотные характеристики и увеличенные объемы кэш-памяти, а также переход на 64-разрядную архитектуру.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Оставленные комментарии видны всем.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]