Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Восточноукраинский национальный университет им. В. Даля

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

3_Тексты лекций ПВС 2011.doc

Скачиваний:

Добавлен:

24.12.2018

Размер:

5.46 Mб

Скачать

☆

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 1718 / 4618 19 20 21 22 23 24 25 26 27 28 29 30 > Следующая >>>

Конфигурации и производительность

Кроме процессоров Itanium 9350, в сервере Superdome 2 могут применяться модели 9340 с тактовой частотой 1,6 ГГц и кэшем L3 емкостью 20 Гбайт. Имеются три группы моделей серверов, отличающихся числом процессорных разъемов (8, 16 и 32): сервер Superdome 2 8s, -16s и -32s. Старшие модели отличаются также числом IOX — до 4 в сервере Superdome 2 8s, и до 8 — в остальных. Сервер Superdome 2 32s содержат до 128 ядер и обеспечивают суммарную пропускную способность ввода/вывода до 816 Гбайт/с, а производительность межсоединения достигает при этом рекордного в индустрии показателя — 1,248 Тбайт/с.

Серверы Superdome 2 могут работать c разными ОС, включая Windows Server 2008 R2, но основной следует считать HP UX 11i — рекордные показатели производительности были установлены именно в этой среде. На тестах TPC-H (для систем поддержки принятия решений) c емкостью хранения в 1 Тбайт сервер Superdome 2 в конфигурации с 64 ядрами в среде HP-UX 11i v3/Oracle 11g R2 Enterprise Edition достиг результата 140181 QphH. Предыдущий рекорд — 123323 QphH, принадлежащий серверу Superdome, был получен тоже на 64 ядрах (32 процессора Itanium 2 9140N 1,6 ГГц).

Имеется целая иерархия средств организации сервера Superdome 2 в виде набора изолированных разделов, в которых можно образовать виртуальные разделы vPars (c гранулярностью до одного ядра и одной платы PCI-E). Применяя средства HPVM (HP Integrity Virtual Machines), можно достигнуть гранулярности меньше одного ядра, а надежность обеспечивается средствами HP UX SRP (Secure Resource Partitions).

Серверы Superdome нашли широкое применение при решении самых различных вычислительных проблем, включая ресурсоемкие задачи квантовой химии, требующие больших объемов памяти на один процесс, а использование Superdome 2 для таких задач оказывается еще эффективнее. В любом случае, как следует из анализа структуры, наиболее важная область применения серверов Superdome 2 — критические для бизнеса приложения.

Контрольные вопросы

Основные особенности структуры МВС?
По каким признакам классифицируются современные МВС?
Основные особенности симметричных мультипроцессорных систем?
Основные особенности несимметричных мультипроцессорных систем?
Почему симметричные МВС плохо масштабируются?
Какие процессоры фирмы AMD используются в современных несимметричных МВС?
Какие процессоры фирмы IBM используются в современных несимметричных МВС?
Основные особенности процессоров со структурой Nehalem?
Основные особенности процессоров линии Opteron?
Основные особенности процессоров POWER7?
Структуры МВС на базе процессоров со структурой Nehalem
Структуры МВС на базе процессоров линии Opteron
Структуры МВС на базе процессоров POWER7
Что такое сервер?
Основные области применения серверов?
Требования к серверам?
Основные компоненты и подсистемы современных серверов?
Какие требования предъявляются к дисковой подсистеме сервера?
Почему в серверах используют RAID-контроллеры для работы с дисками?

Векторные параллельные системы

Содержание

Методы повышения быстродействия вычислительных систем

Принципы векторной обработки данных

Скалярная и векторная обработка

Что такое векторизация?

Как осуществить векторизацию?

Реализация принципов векторной обработки

Основные особенности векторных параллельных систем

Векторные параллельные системы SX-6, SX-7 фирмы NEC

Векторная параллельная система Earth Simulator

Векторная параллельная система CrayXT5h

Методы повышения быстродействия вычислительных систем

Область применения методов достижения высокого и сверхвысокого быстродействия охватывает все уровни создания вычислительных систем.

На самом нижнем уровне - это передовая технология конструирования и изготовления быстродействующих элементов и плат с высокой плотностью монтажа. В этой сфере лежит наиболее прямой путь к увеличению скорости, поскольку если бы, например, удалось все задержки в вычислительной системе сократить в к раз, то это привело бы к увеличению быстродействия в такое же число раз. В последние годы были достигнуты огромные успехи в создании быстродействующей элементной базы и соответствующих методов монтажа, и ожидается дальнейший прогресс, основанный на использовании новых технологий и снижения размеров устройств. Этот путь, однако, имеет ряд ограничений:

1. Для определенного уровня технологии обеспечивается определенный уровень быстродействия элементной базы: как только он оказался достигнутым, дальнейшее увеличение быстродействия сопровождается огромными расходами вплоть до достижения того порога, за которым уже нет технологий, обеспечивающих большее быстродействие.

2. Более быстродействующие элементы обычно имеют меньшую плотность монтажа, что, в свою очередь, требуют более длинных соединительных кабелей между платами и, следовательно, приводит к увеличению задержек (за счет соединений) и уменьшению выигрыша в производительности.

3. Более быстродействующие элементы обычно рассеивают больше тепла. Поэтому требуются специальные меры по отводу тепла, что еще больше снижает плотность монтажа и, следовательно, быстродействие. Для того чтобы избежать дополнительных расходов, задержек за счет соединений и увеличения рассеяния тепла, целесообразно, по-видимому, применять быстродействующие элементы не везде, а только в тех частях, которые соответствуют «узким местам». Однако, путь увеличения быстродействия элементов имеет свои ограничения и может наступить момент, когда станет необходимым или более целесообразным использовать для реализации операции сложения другие способы.

Следующий шаг в направлении повышения быстродействия предполагает уменьшение числа логических уровней при реализации комбинационных схем. Хорошо известно, что любая функция может быть реализована с помощью схем с двумя логическими уровнями. Однако в сложных системах это приводит к появлению громоздких устройств, содержащих очень большое число вентилей с чрезмерными коэффициентами соединений по входу и выходу. Следовательно, на данном этапе конструкторская задача состоит в создании схем с малым числом логических уровней, которое бы удовлетворяло ограничениям по количеству вентилей и их коэффициентам соединений по входу и выходу. В настоящее время разработаны принципы построения схем, требующих меньшее число вентилей и обладающих меньшими задержками, и предложены методы их создания. В силу присущих ограничений только один этот путь, как правило, не может дать требуемого увеличения производительности.

Следующий уровень охватывает способы реализации основных операций, таких как сложение, умножение и деление. Для того, чтобы увеличить cкорость выполнения этих операций, необходимо использовать алгоритмы, которые приводили бы к быстродействующим комбинационным схемам и требовали небольшого числа циклов. В результате успешных исследований и разработок в области арифметических устройств создан ряд алгоритмов, которые могут быть использованы в условиях тех или иных ограничений. С точки зрения применения высокопроизводительных вычислительных систем для научных расчетов особый интерес представляет реализация принципа опережающего просмотра при операциях сложения, сложения с сохраняемым переносом и записи при матричном умножении. Сюда же относятся проблемы использования избыточности при делении и реализация деления в виде цепочки операций умножения.

Еще один резерв, используемый для повышения эффективности работы процессора - это сокращение временных затрат при обращениях к оперативной памяти. Обычные подходы здесь состоят, во-первых, в расширении путей доступа за счет разбиения оперативной памяти на модули, обращение к которым может осуществляться одновременно; во-вторых, в применении дополнительной сверхбыстродействующей памяти (кэш-памяти) и, наконец, в увеличении числа внутренних регистров в процессоре.

Использование всех перечисленных способов тесно связано с организацией вычислительных систем. Длительность исполнения одной команды может быть уменьшена за счет временного перекрытия различных ее фаз. К примеру, вычисление адреса, по которому нужно записать результат, может быть выполнено одновременно с самой операцией. Этот подход требует, разумеется, дополнительного оборудования, поскольку модули оперативной памяти не могут быть одновременно задействованы в совмещаемых фазах. Увеличение быстродействия, которое можно при этом достичь, зависит от формата (состава) команды, поскольку именно им определяется наличие независимых фаз.

Одним из методов повышения производительности вычислительных систем является конвейеризация. Основу конвейерной обработки составляет раздельное выполнение некоторой операции в несколько этапов (за несколько ступеней) с передачей данных одного этапа следующему. Производительность при этом возрастает благодаря тому, что одновременно на различных ступенях конвейера выполняются несколько операций. Конвейеризация эффективна только тогда, когда загрузка конвейера близка к полной, а скорость подачи новых операндов соответствует максимальной производительности конвейера. Если происходит задержка, то параллельно будет выполняться меньше операций и суммарная производительность снизится.

Наконец, необходимо рассмотреть структуру алгоритма, по которому работает система. На этом уровне основной подход к повышению быстродействия состоит в том, чтобы выполнять одновременно несколько команд. Этот подход отличается от того, который реализован в обычной фон-неймановской машине, когда команды исполняются строго последовательно одна за другой. Параллельный подход приводит к различным вариантам структуры в зависимости от способа, по которому осуществляется задание очередности следования команд и управление их исполнением. Распараллеливание позволяет значительно увеличить производительность систем при решении широкого класса прикладных задач.

Перечисленные подходы касаются аппаратуры, логической организации и структуры систем. Усилия, затрачиваемые в этих областях, необходимо поддержать на программно-алгоритмическом уровне. На этом уровне должны использоваться либо специальные языки программирования, предоставляющие средства для явного описания параллелизма, либо методы выявления параллелизма в последовательных программах. Кроме того, алгоритм приложений должен обладать внутренним параллелизмом, соответствующим особенностям данной структуры вычислительной системы. Использование неадекватных алгоритмов и языков способно практически свести на нет возможности для реализации высокоскоростных вычислений, заложенные в структуре.

Использование конвейерного принципа и других структурных методов позволило существенно повысить производительность вычислительных систем – еще примерно на 3-4 десятичных порядка. Однако возможности традиционных структурных методов ускорения выполнения команд практически исчерпаны.

Следовательно, единственное направление, ведущее к дальнейшему повышению производительности - это более полное использование параллелизма при обработке данных, в частности, использование векторной обработки.

Принципы векторной обработки данных

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 1718 / 4618 19 20 21 22 23 24 25 26 27 28 29 30 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.03.201649.22 Кб1536.docx
#
07.11.20182.22 Mб8385485_43FDF_shvecova_vodka_g_n_obshaya_teoriya....doc
#
25.03.20152.55 Mб1939.doc
#
25.03.2015230.4 Кб93_Konstitutsiyne_pravo.doc
#
07.05.2019221.7 Кб53_Konstitutsiyne_pravo.doc
#
24.12.20185.46 Mб263_Тексты лекций ПВС 2011.doc
#
07.09.20192.6 Mб414 Книга - Формула личности.doc
#
26.03.2015504.06 Кб404 лабораторная работа (оператор Switch).pdf
#
28.09.201966.05 Кб74-5_inoz_mov.doc
#
25.03.201539.94 Кб244.doc
#
25.03.2015161.79 Кб94.СУОП.doc

Конфигурации и производительность

Основные особенности симметричных мультипроцессорных систем?

Векторные параллельные системы