Добавил:

Medi Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

История информатики

Файл:

Реферат, презентация по векторным процессорам и Cray-2 / vect_ref_cray2.docx

Скачиваний:

Добавлен:

03.06.2014

Размер:

328.27 Кб

Скачать

☆

<<< < Предыдущая 12 / 72 3 4 5 6 7 > Следующая >>>

Понятие векторного процессора.

Векторный процессор – это процессор, в котором операндами некоторых команд могут выступать упорядоченные массивы данных – векторы. Векторный процессор может быть реализован в двух вариантах:

дополнительный блок к универсальной ВС.
основа самостоятельной ВС.

Возможные подходы к архитектуре средств векторной обработки. Наиболее распространенные из них сводятся к трем группам:

конвейерное АЛУ;
массив АЛУ;
массив процессорных элементов.

Последний вариант – один из случаев многопроцессорной системы, известной как матричная ВС. Понятие векторного процессора имеет отношение к двум первым группам, причем, как правило, к первой (рис. 3).

Рис. 3 Векторные процессоры первого и второго типов.

В варианте с конвейерным АЛУ (рис. 3, слева) обработка элементов векторов производится конвейерным АЛУ для чисел с плавающей запятой (ПЗ). Операции с числами в форме с ПЗ достаточно сложны, но поддаются разбиению на отдельные шаги. Так, сложение двух чисел может быть сведено к четырем этапам (рис. 4):

сравнению порядков,
сдвигу мантиссы меньшего из чисел,
сложению мантисс
нормализации результата.

Каждый этап может быть реализован с помощью отдельной ступени конвейерного АЛУ. Очередной элемент вектора подается на вход конвейера, как только освобождается первая ступень. Ясно, что такой вариант вполне годится для обработки векторов.

Одновременные операции над элементами векторов можно проводить и с помощью нескольких параллельно используемых АЛУ, каждое из которых отвечает за одну пару элементов.

Рис. 4 Структура арифметического конвейера для чисел с плавающей запятой.

Если параллельно используются конвейерные АЛУ, то возможен еще один уровень конвейеризации. Вычислительные системы, где реализована эта идея, называют векторно-конвейерными. Коммерческие векторно-конвейерные ВС, в состав которых для обеспечения универсальности включен также скалярный процессор, известны как суперЭВМ.

Структура векторного процессора

Обобщенная структура векторного процессора приведена на рис. 5 На схеме показаны основные узлы процессора, без детализации некоторых связей между ними.

Рис. 5. Упрощенная структура векторного процессора.

Обработка всех n компонентов векторов-операндов задается одной век- торной командой. Элементы векторов представляются числами в форме с пла-вающей запятой (ПЗ). АЛУ векторного процессора может быть реализовано в виде единого конвейерного устройства, способного выполнять все предусмот-ренные операции над числами с ПЗ. Однако более распространена иная струк-тура, в которой АЛУ состоит из отдельных блоков сложения и умножения, а иногда и блока для вычисления обратной величины, когда операция деления реализуется в виде. Каждый из таких блоков также конвейеризирован. Кроме того, в составвекторной вычислительной системы обычно включается и скалярный процессор, что позволяет параллельно выполнять векторные и скалярные команды.

Для хранения векторов-операндов вместо множества скалярных регистров используются векторные регистры, представляющие собой совокупность скалярных регистров, объединенных в очередь типа FIFO, способную хранить 50–100 чисел с плавающей запятой. Набор векторных регистров (V_a, V_b, V_c,…) имеется в любом векторном процессоре. Система команд векторного процессора поддерживает работу с векторными регистрами и обязательно включает в себя команды:

загрузки векторного регистра содержимым последовательных ячеек памяти, указанных адресом первой ячейки этой последовательности;
выполнения операций над всеми элементами векторов, находящихся в векторных регистрах;

сохранения значении векторного регистра в последовательности ячеек памяти, указанных адресом первой ячейки этой последовательности.

Примером одной из наиболее распространенных операций, возлагаемых на векторный процессор, может служить операция перемножения матриц.

Рассмотрим перемножение двух матриц А и В размерности 3×3.

Элементы матрицы результата С связаны с соответствующими элементами исходных матриц A и B операцией скалярного произведения:

Так, элемент с₁₁ вычисляется как

с_11 =a₁₁×b₁₁+ a₁₂×b₂₁ +a₁₃×b_31.

Это требует трех операций умножения и после инициализации с₁₁ нулем – трех операций сложения. Общее число умножений и сложений для рассматриваемого примера составляет 9×3=27. Если рассматривать связанные операции умножения и сложения как одну кумулятивную операцию с+a×b, то для умножения двух матриц n×n необходимо n³операций типа «умножение-сложение». Вся процедура сводится к получению n²скалярных произведений, каждое из которых является итогом n операций «умножение-сложение», учитывая, что перед вычислением каждого элемента с_ijего необходимо обнулить. Таким образом, скалярное произведение состоит из k членов:

С = А₁В₁+А₂В₂+А₃В₃+A₄B₄+ … +A_kB_k.

Векторный процессор с конвейеризированными блоками обработки для вычисления скалярного произведения показан на рис. 7.7.

Рис. 6. Векторный процессор для вычисления скалярного произведения.

Векторы А и В, хранящиеся в памяти начиная с адресов adr_Aи adr_B, за-гружаются в векторные регистры V_A и V_Bсоответственно. Предполагается, что конвейерные умножитель и сумматор состоят из четырех сегментов, которые вначале инициализируются нулем, поэтому в течение первых восьми циклов, пока оба конвейера не заполнятся, на выходе сумматора будет 0. Пары (A_i,B_i) подаются на вход умножителя и перемножаются в темпе одна пара за цикл. После первых четырех циклов произведения начинают суммироваться с данными, поступающими с выхода сумматора. В течение следующих четырех циклов на вход сумматора поступают суммы произведений из умножителя с нулем. К концу восьмого цикла в сегментах сумматора находятся четыре первых произведенияA₁B₁,…,A₄B₄, а в сегментах умножителя–следующие четыре произведения: A₅B₅,…,A₈B₈. К началу девятого цикла на выходе сумматора будет A₁B₁, а на выходе умножителя–А₅В₅. Таким образом, девятый цикл начнется со сложения в сумматоре А₁В₁и А₅В₅. Десятый цикл начнется со сложения A₂B₂+A₆B₆ и т.д. Процесс суммирования в четырех секциях выглядит так:

C = A₁B₁+A₅B₅+A₉B₉+A₁₃B₁₃+…

+A₂B₂+A₆B₆+A₁₀B₁₀+A₁₄B₁₄+…

+A₃B₃+A₇B₇+A₁₁B₁₁+A₁₅B₁₅+…

+A₄B₄+A₈B₈+A₁₂B₁₂+A₁₆B₁₆+…

Когда больше не остается членов для сложения, система заносит в умножитель четыре нуля. При этом в четырех сегментах конвейера сумматора содержатся четыре скалярных произведения, соответствующие четырем суммам, приведенным в четырех строках показанного выше уравнения.

Частичные суммы складываются для получения окончательного результата.

Программа для вычисления скалярного произведения векторов А и В, хранящихся в областях памяти с начальными адресами adr_A и adr_B,

имеет вид:

<<< < Предыдущая 12 / 72 3 4 5 6 7 > Следующая >>>

Соседние файлы в папке Реферат, презентация по векторным процессорам и Cray-2

#
03.06.20142.62 Mб25vector_proc_cray2.ppt
#
03.06.2014328.27 Кб53vect_ref_cray2.docx