Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоргалка / hpory.docx
Скачиваний:
144
Добавлен:
15.02.2014
Размер:
622.63 Кб
Скачать

25. Векторные конвейерные процессоры.

Векторные конвейерные процессоры (на примере суперкомпьютера Cray SV1)

Рынок многопроцессорных векторных (векторно-параллельных) суперкомпьютеров достаточно узок. Прежде всего это американская компания SGI, производящая компьютеры с маркой Cray, и японские NEC и Fujitsu. Векторные процессоры NEC SX-5 и Cray SV-1 по-прежнему опережают по производительности вычислений с плавающей запятой самые быстродействующие микропроцессоры.

Из обычных процессоров Cray SV1 можно сконфигурировать так называемые многопоточные процессоры путем объединения четырех стандартных двухконвейерных процессоров в один. SMP-система SV1 может масштабироваться до 32 двухконвейерных центральных процессоров. Общее число каналов GigaRing на систему может при этом достигать восьми.

Архитектура машины Cray-1Cray-1 имеет 12 функциональных устройств. Они разделены на группы в зависимости от типа выполняемых ими операций и адресуемых регистров. Выполняют вычисление адресов, логические, скалярные и векторные операции над целыми числами, операции с плавающей запятой над скалярами и векторами. Большинство простых операций центрального процессора выполняется за один такт, который составляет 12.5 нс.

Производительность однопроцессорной машины Cray-1 составляет примерно 100 000000 операций с плавающей точкой в секунду (100 Мфлопс).

26. Ассоциативный процессор

В ассоциативной памяти параллельный поиск идет сразу по большой группе ячеек и в итоге поисковому признаку может удовлетворять содержимое нескольких ячеек. Возможности выполнения различных видов поиска и разнообразие структур ассоциативной памяти объясняют, почему для обозначения этого устройства существует так много синонимов: память с параллельным поиском, запоминающее устройство с многозначным ответом, память с распределенной логикой, логико-запоминающее устройство и т.д. Одновременность в работе —неотъемлемое свойство ассоциативной памяти, что можно пояснить следующим образом: имеется большое число элементов памяти; поиск идет по всем элементам сразу.

Ассоциативным процессором (АП) называют ассоциативное запоминающее устройство, дополненное логикой и микропрограммным управлением. В основе архитектур ассоциативных процессоров с пословной организацией лежит параллелизм на уровне слов, и в большинстве конфигураций обработка слов выполняется последовательно по разрядам.

Регистр компаранда (компаранд – признак, по которому ведется поиск в АЗУ; он записывается в регистр компарандов, затем пересылается в регистр маски)

Множество слов образует ассоциатив массив или ассоциативное запоминающее устр-во (АЗУ) пословно организованного ассоциативного процессора.

Регистр маски можно (фильтр разрядов регистра компаранда). Выделяет указанный признак, остальные маскирует, т.е. соответствующие разряды регистра маски устанавливаются в 0, а соответствующие полю компаранда, устанавливаются в 1. Обычно каждый регистр хранения ответов представляет собой множество триггеров, образующих одноразрядный двоичный вектор вдоль всего массива АЗУ.

Маска вывода слов – последовательно по словам выводит содержимое АЗУ.

Соединительная сеть – используется для логической комбинации полей в данной физической среде. Контроллер – управляет всеми подсистемами.

27. Концепция вычислительных систем с управлением потоком данных. Закон Амдала и его следствия.

Существуют трудности, связанные с решением проблемы автоматизации параллельного программирования, необходимой в целях эффективного использования для широкого круга задач матричных ВС. Поэтому актуальны исследования новых методов построения высокопроизводительных ВС, одними из которых являются ВС с управлением потоком данных, или потоковые ВС.

В системах с управлением потоками данных предполагается наличие большого числа специализированных операционных блоков для определенных видов операций (сложения, умножения и т.п., отдельных для разных типов данных). Данные снабжаются указателями типа данных (тегами), на основании которых по мере готовности данных к обработке они загружаются в соответствующие свободные операционные блоки. При достаточном количестве операционных блоков может быть достигнут высокий уровень распараллеливания вычислительного процесса.

Принципиальное отличие потоковых машин состоит в том, что команды выполняются не в порядке следования команд в тексте программы, а по мере готовности их операндов.

«Потоковая программа» размещается в массиве ячеек команд. Команда наряду с кодом операции содержит поля, куда заносятся готовые операнды, и поле, содержащее адреса команд, в которые должен быть направлен в качестве операнда результат операции. Кроме того, каждой команде поставлен в соответствие двухразрядный тег (располагаемый в управляющем устройстве), разряды которого устанавливаются «1» при занесении в тело команды соответствующих операндов. В состоянии тега «11» (оба операнда готовы) инициируется запрос к операционному коммутатору (ОК) на передачу готовой команды в соответствующее коду операции операционное устройство. Результат выполнения команды над ее непосредственно адресуемыми операндами направляется через командный коммутатор (КК) согласно указанным в команде адресам в ячейки команд и помещается в их поля операндов. Далее указанная процедура циклически повторяется.

Закон Амдала. Предположим, что в программе доля операций, которые нужно выполнять последовательно, равна f, где 0<=f<=1. Крайние случаи в значениях f соответствуют полностью параллельным (f = 0) и полностью последовательным (f = 1) программам.

Для того, чтобы оценить, какое ускорение U может быть получено на компьютере из n процессоров при данном значении f, можно воспользоваться законом Амдала:

Если 9/10 программы исполняется параллельно, а 1/10 по-прежнему последовательно, то ускорения более, чем в 10 раз получить в принципе невозможно.

Следствие из закона Амдала Для того чтобы ускорить выполнение программы в q раз необходимо ускорить не менее, чем в q раз не менее, чем (1-1/q)-ю часть программы.

Таким образом, для эффективного использования МПС необходимо тщательное согласование структуры программ и алгоритмов с особенностями архитектуры параллельных вычислительных систем.

Соседние файлы в папке шпоргалка