Добавил:

ICK Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный институт электроники и математики (технический университет)

Предмет:

Организация ЭВМ

Файл:

Лекции 2007.doc

Скачиваний:

117

Добавлен:

20.05.2014

Размер:

3.24 Mб

Скачать

☆

<<< < Предыдущая 51 52 53 54 55 56 57 58 59 60 61 6263 / 8763 64 65 66 67 68 69 70 71 72 73 74 75 > Следующая >>>

Суперскалярные архитектуры

Смысл суперскалярной обработки - наличие в аппаратуре средств, позволяющих одновременно выполнять две и более скалярных операций, т.е. команд обработки пары чисел. В самом деле, суть этого метода довольно проста: имеется в виду дублирование устройств процессора. Так например, Pentiumимеет два конвейера выполнения команд (Рис. 11.4). При этом существуют различные способы реализации суперскалярной обработки. Первый способ чаще всего применяется в RISC-процессорах и заключается в чисто аппаратном механизме выборки из буфера инструкций (или кэша команд) несвязанных команд и параллельном запуске их на исполнение. Обычно процессор выполняет две несвязанные команды одновременно, как например, в процессорах DEC серии Alpha. Этот метод хорош тем, что он "прозрачен" для программиста - составление программ для подобных процессоров не требует никаких специальных усилий, ответственность за параллельное выполнение операций возлагается в основном на аппаратные средства.

Второй способ реализации суперскалярной обработки заключается в кардинальной перестройке всего процесса трансляции и исполнения программ. Уже на этапе подготовки программы компилятор группирует не связанные операции в пакеты, содержимое которых строго соответствует структуре процессора. Например, если процессор содержит функционально независимые устройства сложения, умножения, сдвига и деления, то максимум, что компилятор может "уложить" в один пакет - это четыре разнотипные операции: сложение, умножение, сдвиг и деление. Сформированные пакеты операций преобразуются компилятором в командные слова.

Функции стадии С1 (выборка команд а также тезис – один конвейер хорошо, а два лучше) позволяют реализовать структуру с двойным конвейером.

С1 С2 С3 С4 С5

Блок

Выборки

Команд

Блок

декодирования

Блок

Выб.

опер.

Блок

Вып.

команд

Блок

возврата

Блок

декодирования

Блок

Выб.

опер.

Блок

Вып.

команд

Блок

возврата

Рис. 12.4 Двойной конвейер из пяти стадий

Можно и дальше наращивать число конвейеров, но это значительно осложнило бы аппаратную часть. Вместо этого было предложено использовать один конвейер с большим количеством функциональных блоков (PentiumII– суперскалярный процессор).

С4

АЛУ

С1 С2 С3 С5

Блок

Выборки

команд

Блок декодирования

Блок

Выб.

Опер.

Блок

Умнож.

Блок

возврата

Блок

с пл.

точкой

Рис 12.5 Суперскалярный процессор с пятью функциональными блоками

До сих пор мы с вами рассматривали возможности увеличения производительности вычислительной системы на основе параллелизма на уровне команд. При этом к системе предъявлялись следующие требования:

все обычные команды непосредственно выполняются аппаратным обеспечением, они не интерпретируются микрокомандами, устранение уровня интерпретации обеспечивает высокую скорость выполнения большинства команд;
компьютер должен приступать к одновременному выполнению большого числа команд (при этом не имеет значения сколько времени занимает само выполнение этих команд);
команды должны легко декодироваться (количество вызываемых команд в секунду зависит от процесса декодирования), для этого, например, используются регулярные команды с фиксированной длиной и небольшим количеством полей;
к памяти должны обращаться только команды загрузки и сохранения (операнды для большинства команд берутся из регистров и возвращаются туда же), понятно, что это требование выдвигает необходимость иметь большое количество регистров.

Недостатком суперскалярных микропроцессоров является необходимость синхронного продвижения команд в каждом из конвейеров. К тому же, как мы уже отмечали, кроме параллелизма на уровне команд существует параллелизм на уровне данных, реализация этого вида параллелизма требует применения многопроцессорной архитектуры.

<<< < Предыдущая 51 52 53 54 55 56 57 58 59 60 61 6263 / 8763 64 65 66 67 68 69 70 71 72 73 74 75 > Следующая >>>

Соседние файлы в предмете Организация ЭВМ

#
20.05.2014571.39 Кб142Архитектура фон Неймана.doc
#
20.05.201423.04 Кб16Вопросы к экзамену Организация ЭВМ 2007-2008.doc
#
20.05.2014110.08 Кб33История процессоров Интел.doc
#
20.05.20143.24 Mб117Лекции 2007.doc
#
20.05.20141.16 Mб85Ответы на вопросы.doc
#
20.05.20141.4 Mб300Ответы на экзаменационные вопросы.doc
#
20.05.201492.67 Кб41Составленные экзаменационные билеты.doc
#
20.05.201473.73 Кб12Список вопросов на экзамен.doc
#
20.05.201486.53 Кб38Формат команды процессора i486 и адресация операндов.doc