Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы 2014.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.93 Mб
Скачать

14.1. Способы выбора количества уровней совмещения (ступеней) в командном конвейере.

Количество уровней совмещения в процессоре должно выбираться в соответствии со следующими факторами:

  1. Тип решаемой задачи.

а. количество условных переходов. Много условных переходов: большое число уровней совмещения неэффективно.Большое число условных переходов приводит неэффективности использования конвейера команд. В современных вычислительных машинах используются два буфера команд – главный и вспомогательный. В главном буфере располагается основная ветвь вычислений. Во вспомогательном – возможная ветвь, прогнозируемая, которая начнет выполняться в случае успешности условного перехода. Если условный переход успешен, то происходит переключение вспомогательного буфера на главный. Дополнительные расходы по стоимости, но повышение быстродействия.

б. процент конфликтов по адресам операндов. Конфликт – если результат предыдущей команды будет использоваться следующей командой, то есть, когда наблюдается сильная зависимость по данным при организации вычислительного процесса. Большое число уровней совмещения нецелесообразно.

  1. Стоимость организации вычислений.

Способы выбора количества уровней совмещения в процессоре:

1-й: Алгоритм выбора количества уровней совмещения в процессоре(количество уровней опережения). TАЛУ – время выполнения операции в АЛУ. Найдем общее время выполнения команды при организации вычислений.

обр_к – обращение в ОП за командой; обр_о – обращение в ОП за операндом.

tУУ – время на организацию управления

количество уровней совмещения

2-ой: имитация моделирования конвейера команд.

  1. Выбирают варианты реализации конвейера команд. (B0,B1,B2…). B0 – базовый вариант, процессор без совмещения. B1,B2 – различные способы организации процессора совмещения. Предположим, что имеются варианты B0,B1,B2.

В ариант 1(2 ур.):

В ариант 2 (3ур.):

  1. Моделирование: B1 и B2 сравнивать с В0. Необходимо ввести критерий сравнения, по которому происходит выбор.

З акон Гроша: производительность пропорциональна квадрату стоимости. . Стоимость определяется количеством интегральных схем, необходимых для реализации процессора:

P~V2

P2 > P1 в 2 раза. Закон Гроша может быть переписан в виде: (P+P)/P~((V+V)/V)^2

P – прирост производительности;1+P/P ~ (V^2+2V*V+V^2)/V^2 ~ 1+2V/V

P/P ~ 2V/V данная формула используется, чтобы определить, насколько целесообразным является введенное изменение.

  1. проведение моделирования и сравнение результатов

Аппроксимируя полученные зависимости, определяем, насколько выполняется для каждого из вариантов в большей степени

(P/P)В2>>(P/P)В1

Сравнивают В1/В0 и В2/В0 и выбирают большее.

14.2 Кластерные проекты (на примере мвс-1000 м). Коммуникационные технологии построения кластеров. Beowulf- кластеры. Beowulf- кластеры. The-hive.

МВС-1000М (Россия, разработан академиком Левиным). Производительность – 1 терафлокс. Имеется 6 базовых блоков по 64 двухпроцессорных модуля, процессор – «Альфа».

В 1994 году Томас Стерлинг (Sterling) и Дон Беккер (Becker) создали 16-и узловой кластер из процессоров Intel DX4, соединенных сетью 10Мбит/с Ethernet с дублированием каналов. Они назвали его «Beowulf» по названию старинной эпической поэмы. Кластер возник в центре NASA Goddard Space Flight Center для поддержки необходимыми вычислительными ресурсами проекта Earth and Space Sciences. Проектно-конструкторские работы над кластером быстро превратились в то, что известно сейчас под названием проект Beowulf. Проект стал основой общего подхода к построению параллельных кластерных компьютеров и описывает многопроцессорную архитектуру, которая может с успехом использоваться для параллельных вычислений. Beowulf-кластер, как правило, является системой, состоящей из одного серверного узла (который обычно называется головным узлом), а также одного или нескольких подчинённых узлов (вычислительных узлов), соединённых посредством стандартной компьютерной сети. Система строится с использованием стандартных аппаратных компонент, таких как ПК, запускаемых под Linux, стандартных сетевых адаптеров (например, Ethernet) и коммутаторов. Нет особого программного пакета, называемого «Beowulf». Вместо этого имеется несколько кусков программного обеспечения, которые многие пользователи нашли пригодными для построения кластеров Beowulf. Beowulf использует такие программные продукты как операционную систему Linux, системы передачи сообщений PVM, MPI, системы управления очередями заданий и другие стандартные продукты. Серверный узел контролирует весь кластер и обслуживает файлы, направляемые к клиентским узлам.

T he HIVE {NASA} – Highly-parallel integrated Virtual Environment.

В сего 768 процессоров. Все процессоры связаны между собой двумя сетями. Сеть Myrinet используется для обмена данными в процессе вычисления, FastEthernet используется ОС для выполнения сервисных функций.

Кэш 2-го уровня – 4Мбайта. Пропускная способность каналов – 110-170 Мбайт/сек.

Основные параметры, которыми характеризуются кластерные системы: стоимость, производительность, масштабируемость (возможность создавать различные системы).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]