Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВВС.docx
Скачиваний:
15
Добавлен:
20.09.2019
Размер:
283.44 Кб
Скачать

Лекция № 9 (03.05.12)

Кол-во процессоров

одно приложения

много приложений

4

174

235

8

208

266

16

228

296

32

261

336

64

275

360

При увеличении приложений задержки будут увеличиваться.

Рассмотрим процессор ПА-8700. Тактовые частоты 750 мГЦ. При работе с максимальной нагрузкой, может выполняться 4 арифметические операции за один такт. Пиковая производительность 3гФлопса. Процессор содержит 10 ФУ: 4 для целочисленной арифметики, 4 для вещественной арифметики, 2 для чтения-записи. На каждом устройстве может производиться выборка 4-х команд из кэш-памяти. В кэш-памяти 1,5 Гб данные, 0,75-команды.

Необходимо учитывать: если в программе 20% всех операций выполняется строго последовательно, то в данной системе не удается получить ускорение больше 5, независимо от числа используемых процессоров. Этот комп используется в сбербанке и госбанках.

Вычислительные системы с распределенной памятью.

В такой системе вычислительные узлы объединяются друг с другом некоторой коммуникационной средой. Каждый вычислительный узел может иметь один или несколько процессов и свою локальную память, которая разделяется этими процессами. Доступ к данным, расположенным в других узлах идет через коммутационную среду. В качестве примера можно привести компьютер семейства Cray T3D/TJE. Это комп с распределенной памятью. В максимальной конфигурации может содержаться примерно 1000 процессоров. Основные компоненты-узлы и коммутационная среда.

Узлы делятся на 3 группы:

-управляющие(работают в многопользовательском режиме, на них выполняются однопроцессорные программы и формируются команды работы. Служат для общения с пользователями.)

-узлы ОС(недоступны напрямую пользователю. Осуществляют выполнение системных функций ОС, в том числе работу с файловой системой)

-вычислительные узлы(выполняют программы пользователя в монопольном режиме. При запуске программе выделяется требуемое число узлов.)

Гарантируется, что никакая программа не сможет занять вычислительные узлы, на которых уже работают другие программы. Количество узлов зависит от конфигурации системы. Каждый узел состоит из процессорного элемента(ПЭ) и сетевого интерфейса. ПЭ содержит один процессор типа Alpha, локальную память и вспомогательные подсистемы. Например, процессор 21169А с тактовой частотой 675 мГЦ, и пиковой производительностью 1,35 гФлопс.

Каждый ПЭ через свой сетевой интерфейс может обращаться к памяти любого другого ПЭ, не прерывая его работы. Сетевой интерфейс узла связан с соответствующим сетевым маршрутизатором, который является частью коммуникационной сети. Все маршрутизаторы расположены в узлах в трехмерной целочисленной прямоугольной решетке и соединены между собой в соответствии с топологией трехмерного тора. Т.Е. каждый узел имеет 6 непосредственных соседей.

+быстрая связь граничных узлов и небольшое число перемещений по Тору, при взаимодействии ПЭ.

Каждая элементарная часть между узлами состоит из двух однонаправленных каналов ПД. Это допускает обмен данными в противоположных направлениях. В Cray максимальная скорость передачи между узлами 480 гбайт/с.