Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Arhitektura_EVM.doc
Скачиваний:
7
Добавлен:
21.12.2018
Размер:
529.92 Кб
Скачать

Развитие архитектуры мп для высокопроизводительных вычислительных систем.

Основные характерные способы повышения производительности:

    1. увеличение ёмкости и памяти внутри кристалла;

    2. увеличение состава и числа функционирующих устройств.

Рассмотрим организацию внутрикристальной памяти. Традиционно такая память включает регистры процессора и встроенную КЭШ память одного, либо двух уровней. В последних разработках, кроме встроенных КЭШей, на кристалл размещают динамическую память DRAM. Такая память используется не только как буфер, но и как часть рабочей операционной памяти. Фирмой IMB на кристалле достигнут размер памяти 16мб, со скоростью обмена с ядром процессора 50гб в сек, но при этом малая память занимает всего лишь 20% площади кристалла.

Существенной частью внутрикристаллической памяти процессора является его регистры. В архитектуре имеется не один, а несколько регистровых наборов (регистровых файлов). Каждый регистровый файл обслуживает один вычислительный процесс, т.е. поток команд. Этот поток называется Тред- Tred. В общем случае в каждом процессоре может быть n-регистровых файлов. В каждом такте происходит переключение процессора на работу к очередным регистрам файла. Поэтому запрос, выданный в ОП, может обрабатываться в течении n-1 такта вплоть до того момента времени, пока процессор не вернется на начальный регистровый файл. Выбор значения n определяется соотношением времени доступа в память ко времени выполнения команд.

Увеличение состава и числа функциональных устройств.

С ростом уровня интеграции возникает задача распределения дополнительных ресурсов на кристалле между функциональными блоками системы. Хотя память и является ресурсом, не производящим вычисления, но размещение её на кристалле уменьшает задержки, связанные с изменениями из памяти затребованных данных и команд. За счет этого увеличение ёмкости памяти на кристалле дает прирост производительности системы. Однако, при достижении определенной ёмкости памяти, прирост производительности оказывается меньше, чем тот, который можно достичь за счет размещения на кристалле других функциональных модулей. В этом случае основная проблема заключается в том, что дополнительные функциональные узлы необходимо эффективно загружать.

Параллельное выполнение команд в процессоре предполагает использование следующих механизмов:

- переименование регистров с целью устранения зависимостей ресурсов;

- предсказание – переход;

- динамическое назначение команд на исполнение параллельно-работающими процессов;

В некоторых МП системах динамическое назначение команд на исполнительные устройства осуществляет блок, который называется резервирующая станция. Этот блок состоит из совокупности элементов ассоциативной памяти. Каждый элемент этой станции содержит позиции для размещения следующих информации:

1) код операции, имя первого операнда, его значение, признаки доступности первого операнда;

2) имя второго операнда, его значения, признак доступности второго операнда;

3) имя регистра результата;

Схема организации динамического распределения:

Резервирующая станция работает следующим образом: когда завершается исполнение очередной команды и вырабатывается результат, то имя этого результата сравнивается с именами операндов в резервирующей станции. Если в резервирующей станции обнаруживается команда, которая ждет этого результата, то данные записываются в соответствующую позицию элемента ассоциативной памяти и устраняется признак их доступности. Когда у команды доступны все операнды - есть исполнение. Таким образом здесь используется механизм управления потоком команд, основанный на потоке данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]