Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВВС.docx
Скачиваний:
10
Добавлен:
20.09.2019
Размер:
283.44 Кб
Скачать

Лекция № 4 (22.03.12)

  • Топология двумерной решетки.

1

2

3

4

5

6

7

8

9

10

12

11

Эта структура была использована в начале 90-х годов при построении суперкомпьютера фирмы Intel.

  • Топология двумерного тора.

Такая структура уменьшает среднее расстояние между узлами.

  • Может быть использована умная связь между узлами.

Все узлы связанны между собой. У каждого узла n-1 связь. Общее количество связей (n(n-1))/2. При большом n реализовать сложно.

  • Топология двоичного гиперкуба.

В n-мерном пространстве рассматриваются точки (X1, X2, Xn), в которых координаты Xi принадлежат множеству [0;1], в эти точки условно помещены вычислительные узлы. Каждый узел соединяется с ближайшим непосредственным соседом вдоль каждой из n измерений. Число узлов N=2^n. Каждый узел непосредственно связан с n другими узлами. Каждый узел непосредственно связан с n-другими узлами, т.е. с . Если n=2, то двумерный куб соответствует квадрату. Максимальное расстояние между вершинами гиперкуба равно n. В 1975 году выпущен промышленный гиперкуб NCURE Corporation, состоящий из 1024 узлов.

Компьютеры с архитектурой NUMA (Non Uniform Memory Access)компьютеры с неоднородным доступом к памяти.

Компьютеры с неоднородным доступом к памяти. Данный компьютер состоит из наборов кластеров, соединенных межкластерной шиной. Каждый кластер объединяет процессор, контроллер памяти, модуль памяти и устройства ввода вывода, которые соединены посредством локальной шины.

Процессор посылает запрос и анализируя старшие разряды адреса, контроллер определяет в каком модуле памяти хранятся данные. Если адрес локальный, то запрос выставляется на локальную шину, иначе направляется на межкластерную шину. В таком режиме программа, хранящаяся в одном модуле памяти, может выполняться любым процессором системы. Если формируется обращение к памяти другого узла, то это время обращения на 5-10% больше, чем к своей памяти. Если разница достигает 200-700%, то требуется правильно расположить данные. Позволяет объединить более 256 процессоров.

Производительность ВС.

Система функциональных устройств.

Система состоит из функциональных устройств, включающих устройства арифметические, логические, ввода – вывода, пересылки из модуля в модуль и т.д. Будем считать, что время срабатывания одного и того же функционального узла одинаковое. Разные ФУ могут иметь разные времена срабатывания. ФУ называется простым, если ни какой последующей операции, если ни какой последующей операции не может начинаться раньше, чем следующая операция, то есть ФУ использует монопольно свое оборудование для выполнения каждой операции. Конвейерные ФУ распределяют свое оборудование для реализации нескольких операций. Часто разбиваются на линейные цепочки, которые реализуются простыми элементарными ФУ, имеющими одинаковые времена срабатывания. Элементарными ФУ называют ступень конвейера, а их число – длинной конвейера. Простое ФУ можно считать конвейеров с длиной 1. Будем считать стоимостью операции время ее реализации, а стоимостью работы сумму всех выполненных операций с общей суммой.

Таким образом, стоимость работы – это время последовательной реализации всех рассматриваемых операций на простых ФУ. Загруженность устройства – отношение стоимости реально выполненной работы к максимально возможной стоимости.

0≤P≤1 загруженность

Реальная производительность системы устройств – среднее количество реальных операций в единицу времени. Пиковая производительность – максимальное количество операций, которое может быть выполнено системой в единицу времени при отсутствии связей между функциональными устройствами. Если S – число ФУ, то реальная производительность системы будет r=Σ(i=1,S) ρi* πi. πi - производительность, ρi - загруженность ФУ, i- номер ФУ.

Вводится понятие ускорения реализации алгоритма на многопроцессорной системе.

R=( Σ(i=1,S) ρi * πi))/max πi

S- количество процессоров, πi – пиковая производительность процессора, pi—загруженность процессора.

Равенство только в случае, когда все процессоры имеют одинаковые пиковые производительности и полностью загружены.

ρi =1, I от 1 до S.

Методы определения реальной производительности суперкомпьютеров.

Естественной характеристикой любого компьютера является его пиковая производительность. Она определяет тот максимум, на который способен данный компьютер. При этом предполагается, что все устройства работают с максимальной производительностью. Производительность компьютера на любой реальной задаче (программе) всегда меньше его пиковой производительности. Полагаться на значения пиковой производительности нельзя, так как разброс в значениях реальной производительности может колебаться от 2-90% от пиковой. Пиковую производительность можно оценивать можно оценивать в MIPS (Million Instructions Per Second) – в миллионах машинных команд в секунду. При этом необходимо учитывать формат данных. Если используется 32-разрядные вещественные числа, то при работе с 64-х разрядными вещественными числами производительность может упасть во много раз.

Для вычисления при выполнении различных задач важна скорость выполнения операций с вещественными числами. Она измеряется в Flops.

Для оценки реальной производительности необходимо учитывать программно – аппаратную среду выполнения программы. Например, если компилятор не эффективен, то реальная производительность может быть намного меньше пиковой. Реальную производительность надо оценивать не по характеристике аппаратуры, а на основе фиксированного набора эталонных тестовых программ.

Наиболее известный тест LINPACK. Эта программа для решения системы линейных алгебраических уравнений с плотной матрицей. Сначала размер матрицы был 100*100, матрица легко помещается в в кэш-памяти процессора, это вызывало завышение производительности компьютера, поэтому позже стала использоваться матрица 1000*1000, производительность оценивается по числу операций.

n– размерность матрицы, сейчас n больше 10^6, чтобы использовать всю оперативную память.

LINPACK используются для формирования списка топ 500.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]