Функциональные устройства

ФУ исполняют свой набор команд и могут работать одновременно друг с другом. Все ФУ конвейерные и делятся на четыре группы: адресные, скалярные, векторные и для работы с плавающей точкой.

Два адресных функциональных устройства предназначены для выполнения сложения/вычитания и умножения 32-разрядных целых чисел. Скалярных устройств в процессоре всегда четыре. Они используются для целочисленного сложения/вычитания, логических поразрядных операций, для выполнения операций сдвига и нахождения числа нулей до первой единицы в слове. Скалярные устройства оперируют с 64-разрядными данными и предназначены для выполнения только скалярных команд.

Число векторных устройств в зависимости от конфигурации компьютера меняется от пяти до семи. В их число могут входить устройства для целочисленного сложения/вычитания, сдвига, логических поразрядных операций, устройство для нахождения числа нулей до первой единицы в слове, для умножения битовых матриц. Некоторые из перечисленных устройств могут быть продублированы. Все векторные функциональные устройства предназначены для выполнения только векторных команд.

Три функциональных устройства для вещественной арифметики работают с 64-разрядными числами, представленными в форме с плавающей запятой. Они предназначены для сложения/вычитания, умножения и нахождения обратной величины числа. Отдельного устройства для выполнения явной операции деления вещественных чисел нет. Все устройства данной группы могут выполнять как векторные, так и скалярные команды.

Векторные ФУ и ФУ с плавающей точкой продублированы: векторные команды разбивают 128 элементов векторных регистров на четные и нечетные, обрабатываемые одновременно двумя конвейерами (pipe 0, pipe 1). Когда завершается выполнение очередной пары операций результаты записываются на соответствующие четные и нечетные позиции выходного регистра. В полностью скалярных операциях, использующих ФУ с плавающей точкой, работает только один конвейер.

ФУ имеют различное число ступеней конвейера, но каждая ступень срабатывает за один такт, поэтому при полной загрузке все ФУ могут выдавать результат каждый такт.

20 Вопрос. Параллельное выполнение программ. 6 особенностей архитектуры Конвейеризация выполнения команд

Все основные операции, выполняемые процессором: обращения в память, обработка команд и выполнение инструкций являются конвейерными.

Независимость функциональных устройств

Большинство ФУ в CRAY C90 являются независимыми, поэтому несколько операций могут выполняться одновременно. Для операции A=(B+C)*D*E порядок выполнения может быть следующим (все аргументы загружены в S регистры). Генерируются три инструкции: умножение D и E, сложение B и C и умножение результатов двух предыдущих операций. Первые две операции выполняются одновременно, затем третья.

Векторная обработка

Векторная обработка увеличивает скорость и эффективность обработки за счет того, что обработка целого набора (вектора) данных выполняется одной командой. Скорость выполнения операций в векторном режиме приблизительно в 10 раз выше скорости скалярной обработки. Для фрагмента типа

Do i = 1, n

A(i) = B(i)+C(i)

End Do

в скалярном режиме потребуется сгенерировать целую последовательность команд: прочитать элемент B(I), прочитать элемент C(I), выполнить сложение, записать результат в A(I), увеличить параметр цикла, проверить условие цикла. В векторном режиме этот фрагмент преобразуется в: загрузить порцию массива B, загрузить порцию массива C (эти две операции будут выполняться со сдвигом в один такт, т.е. практически одновременно), векторное сложение, запись порции массива в память, если размер массивов больше длины векторных регистров, то повторить эту последовательность некоторое число раз.

Перед тем, как векторная операция начнет выдавать результаты, проходит некоторое время (startup), связанное с заполнением конвейера и подкачкой аргументов. Чем больше длина векторов, тем менее заметным оказывается влияние данного начального промежутка времени на все время выполнения программы.

Векторные операции, использующие различные ФУ и регистры, могут выполняться параллельно.

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 1415 / 3215 16 17 18 19 20 21 22 23 24 25 26 27 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
27.11.201941.33 Кб6podgotovka_k_besede.docx
#
01.07.2025151.55 Кб1podgotovka_k_ekzamenu_prakt_zadanie_na_17_g_dekabr_45_46_306_302.doc
#
23.09.2019117.25 Кб7Podgotovka_k_kortave.doc
#
25.11.201872.19 Кб16podgotovka__k__ege.__slovosochetanie.__vidy__sv....doc
#
01.05.2025162.3 Кб1Podkhody_k_otsenke_obekta_otsenki.docx
#
01.03.20253.02 Mб3PODs 2.0 release Marina_Lesha version beta3 vir...doc
#
01.07.2025112.04 Кб0Podstawy rachunkowości.docx
#
01.05.202541.07 Кб1podvizhnaya_igra_kartoteka.docx
#
01.03.202576.29 Кб1podvizhnye_igry_dlya_1-4_klassov.doc
#
26.10.2018651.78 Кб41Poetic_philosophy_of_the_Chinari_2.doc
#
01.05.202572.25 Кб3pogramma_po_zhivopisi_i._n._zemlyachenko.docx