Добавил:

ICK Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный институт электроники и математики (технический университет)

Предмет:

Организация ЭВМ

Файл:

Архитектура фон Неймана.doc

Скачиваний:

144

Добавлен:

20.05.2014

Размер:

571.39 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 2113 14 15 16 17 18 19 20 21 > Следующая >>>

№31. Суперскалярная архитектура процессора.

Процессоры, имеющие в своем составе более одного конвейера, называются суперскалярными. Смысл суперскалярной обработки - наличие в аппаратуре средств, позволяющих одновременно выполнять две и более скалярных операций, т.е. команд обработки пары чисел. В самом деле, суть этого метода довольно проста: имеется в виду дублирование устройств процессора. Так например,Pentiumимеет два конвейера выполнения команд (Рис. 11.4). При этом существуют различные способы реализации суперскалярной обработки. Первый способ чаще всего применяется в RISC-процессорах и заключается в чисто аппаратном механизме выборки из буфера инструкций (или кэша команд) несвязанных команд и параллельном запуске их на исполнение. Обычно процессор выполняет две несвязанные команды одновременно, как например, в процессорах DEC серии Alpha. Этот метод хорош тем, что он "прозрачен" для программиста - составление программ для подобных процессоров не требует никаких специальных усилий, ответственность за параллельное выполнение операций возлагается в основном на аппаратные средства.

Второй способ реализации суперскалярной обработки заключается в кардинальной перестройке всего процесса трансляции и исполнения программ. Уже на этапе подготовки программы компилятор группирует не связанные операции в пакеты, содержимое которых строго соответствует структуре процессора. Например, если процессор содержит функционально независимые устройства сложения, умножения, сдвига и деления, то максимум, что компилятор может "уложить" в один пакет - это четыре разнотипные операции: сложение, умножение, сдвиг и деление. Сформированные пакеты операций преобразуются компилятором в командные слова.

Функции стадии С1 (выборка команд а также тезис – один конвейер хорошо, а два лучше) позволяют реализовать структуру с двойным конвейером.

С1 С2 С3 С4 С5

Блок

Выборки

Команд

Блок

декодирования

Блок

Выб.

опер.

Блок

Вып.

команд

Блок

возврата

Блок

декодирования

Блок

Выб.

опер.

Блок

Вып.

команд

Блок

возврата

Рис. 11.4 Двойной конвейер из пяти стадий

Можно и дальше наращивать число конвейеров, но это значительно осложнило бы аппаратную часть. Вместо этого было предложено использовать один конвейер с большим количеством функциональных блоков (PentiumII– суперскалярный процессор).

С4

АЛУ

С1 С2 С3 С5

Блок

Выборки

команд

Блок декодирования

Блок

Выб.

Опер.

Блок

Умнож.

Блок

возврата

Блок

с пл.

точкой

Рис 11.5 Суперскалярный процессор с пятью функциональными блоками

До сих пор мы с вами рассматривали возможности увеличения производительности вычислительной системы на основе параллелизма на уровне команд. При этом к системе предъявлялись следующие требования:

все обычные команды непосредственно выполняются аппаратным обеспечением, они не интерпретируются микрокомандами, устранение уровня интерпретации обеспечивает высокую скорость выполнения большинства команд;
компьютер должен приступать к одновременному выполнению большого числа команд (при этом не имеет значения сколько времени занимает само выполнение этих команд);
команды должны легко декодироваться (количество вызываемых команд в секунду зависит от процесса декодирования), для этого, например, используются регулярные команды с фиксированной длиной и небольшим количеством полей;
к памяти должны обращаться только команды загрузки и сохранения (операнды для большинства команд берутся из регистров и возвращаются туда же), понятно, что это требование выдвигает необходимость иметь большое количество регистров.

Недостатком суперскалярных микропроцессоров является необходимость синхронного продвижения команд в каждом из конвейеров. К тому же, как мы уже отмечали, кроме параллелизма на уровне команд существует параллелизм на уровне данных, реализация этого вида параллелизма требует применения многопроцессорной архитектуры.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 2113 14 15 16 17 18 19 20 21 > Следующая >>>

Соседние файлы в предмете Организация ЭВМ

#
20.05.2014571.39 Кб144Архитектура фон Неймана.doc
#
20.05.201423.04 Кб17Вопросы к экзамену Организация ЭВМ 2007-2008.doc
#
20.05.2014110.08 Кб34История процессоров Интел.doc
#
20.05.20143.24 Mб117Лекции 2007.doc
#
20.05.20141.16 Mб86Ответы на вопросы.doc
#
20.05.20141.4 Mб303Ответы на экзаменационные вопросы.doc