- •Высокопроизводительные вычислительные системы
- •Лекция № 2 (1.03.12)
- •Лекция № 3 (15.03.12)
- •Лекция № 4 (22.03.12)
- •Лекция № 5 (29.03.12)
- •Лекция № 6 (.12) Классификация параллельных компьютеров и систем Классификация Флинна
- •Классификация Хокни
- •Классификация Фекта
- •Векторно – конвейерные компьютеры
- •Лекция № 7 (12.04.12)
- •Лекция № 8 (26.04.12)
- •Лекция № 9 (03.05.12)
- •Вычислительные системы с распределенной памятью.
- •Кластерные вс
- •Метакомпьютер
- •Лекция № 10 (10.05.12) Функционирование процессора. Исполнение команд.
- •Трассировка
- •Регистрация программных событий
- •Милликод (millicode) в процессорах z/series
- •Организация внутренней памяти. Уровни процессорной памяти.
- •Лекция № 11 (17.05.12) Адресация внутренней памяти.
- •Динамическая трансляция адреса
- •Подсистемы ввода/вывода Назначение и компоненты системы в/в
- •Лекция № 12 (24.05.12)
- •Множественная подканальная система mcss.
- •Лекция № 13 (12)
Высокопроизводительные вычислительные системы
Горшков Виктор Николаевич
Лекция №1 от 9.02.2012г.
Литература:
“Архитектура ВС IBM S/390” – мет. пособие;
«e-server z-series 900» - мет. пособие;
“Язык управления заданиями ОС 390” – мет. пособие.
Состав ВС определяет эффективность решения различного рода задач.
Единица измерения производительности – - или флопс.
Необходимость повышения производительности процессоров привела к появлению многоядерных процессоров.
При помощи распараллеливания процессов можно уменьшить время выполнения задачи, повысить общую производительность системы и т.д. Но задача не всегда распараллеливаема. Рассмотрим пример:
;
П1 -> -> -> ;
П2 -> -> -> ;
Видно, что вычисления будут дублироваться.
Одной из первых задач, решенных с применением ВС, были сложные научно-технические расчеты по созданию водородной бомбы. Без ЭВМ эта задача была бы неразрешима.
1950 г. – первая серийная машина в СССР – «Стрела»;
1953 г. – Карцев создал достаточно высокопроизводительную систему, основным принципом которой была «пирамида сумматоров».
В качестве примера ВВС также можно привести вычислительный комплекс «Эльбрус», который одно время считался самым высокопроизводительным в мире.
Следующий этап – появление в СССР машин ЕС (единой серии). Машины этой серии были практически полностью скопированы с IBM 360. Выражение «единая серия» означает то, что любая программа, написанная для одной машины, будет интерпретируемой на любой машине из этой серии.
При помощи высокопроизводительных ЭВМ решались и решаются задачи биофизики, аэродинамики, генетики и др.
Одно из направлений развития ВС – создание АСУ для различных отраслей – например, для банковской отрасли, военной и т.д.
Для повышения производительности используется большое количество процессоров; важно, чтобы производилось сопряжение с другими системами.
В зависимости от решаемых задач производится повышение или понижение производительности.
Лекция № 2 (1.03.12)
Методы повышения производительности эвм
Усложнение и наращивание аппаратных средств. (это достаточно эффективный подход)
Развитие микроэлектронной техники является одним из основных факторов повышения производительности, однако, повышение быстродействия электронных схем не является единственной причиной роста производительности. Производительность возрастает в первую очередь за счет использования принципа параллельной обработки информации, т.е. когда одновременно выполняется несколько действий.
Методы параллельной обработки данных
Существует 2 способа параллельной обработки данных:
Явный параллелизм.
Рассмотрим пример нахождения суммы 2-х векторов в вещественном пространстве размерности 100. Если пара чисел суммируется за 4 такта, и нет распараллеливания, то потребуется 400 тактов. Если параллельно работают N-сумматоров, то необходимое время суммирования будет 400/N тактов.
Конвеерность
Пусть операция может быть разбита на l-ступеней, каждая из которых выполняется за 1 такт. Например, сложение вещественных чисел состоит из следующих микроопераций: сравнение порядков, выравнивание порядков, сложение мантисс, нормализация. Для каждой пары слагаемых задействована одна из микроопераций, другие микрооперации можно использовать для других слагаемых. [1|2|3…..|l]. l – длина конвейера для сложения потребуется l тактов. Число тактов для сложения n-чисел будет l+(n-1). Если бы не было конвеера то потребовалось бы время l*n.
В высокопроизводительных ЭВМ часто используются операции с векторами. При использовании векторных команд время выполнения векторной конвейерной операции будет σ+ l+(n-1), где сигма – число тактов необходимых для инициализации векторной команды. Реальная производительность – Е конвейерного устройства определяется как отношение числа выполняемых операций n ко времени их выполнения t. Е=n/T = n/[(σ + l + n-1) *τ] = 1/[τ +(σ + l - 1)*τ /n].
τ – время выполнения одной операции (временной промежуток соответствующий одному такту).
При n → бесконечности производительность конвейерной системы приближается к пиковой Епик=1/τ . здесь было сделано предположение, что операцию можно разбить на ступени с одинаковой длительностью выполнения.
Параллельное использование памяти компьютеров. Идея параллельности заключается в том, что заполнение сверхбыстродействующей памяти идет параллельно с выполнением вычислений.
Совмещение во времени различных этапов выполнения соседних команд. Используется опережающий просмотр, считывание, декодирование, вычисление адресов, предварительная выборка операндов нескольких команд.
Расслоение памяти - разбиение ОЗУ на 2 независимых блока способных параллельно передавать данные в ЦП.
Конвейерный принцип обработки команд - цикл обработки команды разбивается на 4 ступени: выборка команд, вычисление адреса операнда, выборка операнда, выполнение операции.
Параллельность работы устройств печати и устройств ввода-вывода – позволяет избежать простоя устройств во время выполнения операций ввода-вывода.
Использование микропроцессорных устройств. Используется параллелизм в явном виде.
Первый такой компьютер был создан в 1964 году. CDC – 6600 - Он содержал независимые функциональные устройства которые могли работать одновременно. Операции – сложение фиксированная запятая, сложение с плавающей точкой, умножение ФЗ ПТ, деление, логические операции и сдвиги. Память – 32 независимых блока по 4096 64-ти разрядных слов. Производительность от 2 до 3 млн. операций в секунду.
В 1976 году выпускается первый векторно-конвейерный процессор Cray-1. В нем использовалась конвейерность и независимость функциональных устройств. Это позволяло получить высокую производительность компьютера - 166 млн. операций в секунду.
Особенности архитектуры суперкомпьютеров.
Современные технологии позволяют объединять тысячи процессоров в рамках одной вычислительной системы с производительностью несколько терафлопс (1 терафлопс = 10^12 операций в секунду с плавающей запятой). Повышение степени параллелизма ведет к увеличению разрыва между пиковой и реальной производительностью ЭВМ. Если программа не поддается векторизации, то она не может использовать всех преимуществ векторно-конвейерных машин.