16.4 Комп’ютерні системи з явним паралелізмом команд

Подальшим розвитком ідеї VLIW стала нова архітектура IA-64 - сумісна розробка фірм Intel і Hewlett-Packard (IA - це абревіатура від Intel Architecture). У IA-64 реалізований новий підхід, відомий як обчислення з явним паралелізмом команд (EPIC, Explicitly Parallel Instruction Computing), що є вдосконаленим варіантом технології VLIW. Першим представником даної стратегії став мікропроцесор Itanium компанії Intel. Корпорація Hewlett-Packard також реалізує даний підхід в своїх розробках.

В архітектурі IA-64 передбачається наявність в процесорі 128 64-розрядних регістрів загального призначення (PЗH) і 128 80-розрядних регістрів з плаваючою комою. Крім того, процесор IA-64 містить 64 однобітових регістра предикатів.

Формат команд в архітектурі IA-64 показаний на рис.16.6.

Рисунок 16.6 – Формат наддовгої команди в архітектурі IA-64

Команди упаковуються (групуються) компілятором в наддовгу команду - зв’язку (bundle) завдовжки в 128 розрядів. Зв’язка містить три команди і шаблон, в якому указуються залежності між командами (чи можна з командою I₀ запустити паралельно I₁, або ж I₁ повинна виконуватися тільки після I₀), а також між іншими зв’язками (чи можна з командою I₂ із зв’язки S₀ запустити паралельно команду I₃ із зв’язки S₁).

Перерахуємо всі варіанти складання зв’язки з трьох команд:

- I₀ ║ I₁ ║ I₂ - команди виконуються паралельно;

- I₀ & I₁ ║ I₂ - спочатку I₀, потім виконуються паралельно I₁ і I₂;

- I₀ ║ I1 & I₂ - паралельно обробляються I₀ і I₁, після них - I₂;

- I₀ & I1 & I₂ - команди виконуються в послідовності I₀, I₁, I₂ .

Одна зв’язка, що складається з трьох команд, відповідає набору з трьох функціональних блоків процесора. Процесори IA-64 можуть містити різну кількість таких блоків, залишаючись при цьому сумісними за кодом. Завдяки тому, що в шаблоні вказана залежність і між зв’язками, процесору з N однаковими блоками з трьох ФБ відповідатиме наддовга команда з N х 3 команд (N зв’язок). Тим самим забезпечується масштабованість IA-64.

Поле кожної з трьох команд в зв’язці складається з п’яти полів:

- 13-розрядного поля коду операції;

- 6-розрядного поля предикатів, що зберігає номер одного з 64 регістрів предиката;

- 7-розрядного поля першого операнда (першого джерела), де указується номер регістра загального призначення або регістра з плаваючою комою, в якому міститься перший операнд;

- 7-розрядного поля другого операнда (другого джерела), де указується номер регістра загального призначення або регістра з плаваючою комою, в якому міститься другий операнд;

- 7-розрядного поля результату (приймача), де указується номер регістра загального призначення або регістра з плаваючою комою, куди повинен бути занесений результат виконання команди.

Предикація - це спосіб обробки умовних розгалужень. Якщо в початковій програмі зустрічається умовне розгалуження (за статистикою через кожні 6 команд), то команди з різних гілок позначаються різними регістрами предиката (команди мають для цього відповідні поля), далі вони виконуються спільно, але їх результати не записуються, поки значення регістрів предиката (РП) не визначені. Коли обчислюється умова розгалуження, РП, якій відповідає “правильній” гілці, встановлюється в 1, а інший - в 0. Перед записом результатів процесор перевіряє поле предиката і записує результати тільки тих команд, поле предиката яких указує на РП з одиничним значенням.

Предикати формуються як результат порівняння значень, що зберігаються в двох регістрах. Результат порівняння (“Істина” або “Брехня”) заноситься в один з РП, але одночасно з цим в другій РП записується інверсне значення отриманого результату. Такий механізм дозволяє процесору ефективніше виконувати конструкції типа IF-THEN-ELSE.

Логіка видачі команд на виконання складніша, ніж в традиційних процесорах типу VLIW, але набагато простіша, ніж у суперскалярних процесорів з неврегульованою видачею. Особливостями архітектури EPIC є:

- велика кількість регістрів;

- масштабованість архітектури до великої кількості функціональних блоків, тобто система команд, що спадково масштабується (Inherently Scaleable Instruction Set);

- явний паралелізм в машинному коді. Пошук залежностей між командами здійснює не процесор, а компілятор;

- предикація - команди з різних гілок умовної пропозиції забезпечуються полями предикатів (полями умов) і запускаються паралельно;

- попереднє завантаження - дані з повільної основної пам’яті завантажуються наперед.

<<< < Предыдущая 7 8 9 10 11 12 13 14 15 16 17 1819 / 3419 20 21 22 23 24 25 26 27 28 29 30 31 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.2025947.71 Кб02011методичка держ екз хірургія УКР.doc
#
12.11.201971.68 Кб52012 Тема Память ПК.doc
#
01.05.2025867.33 Кб02013_10_26_IS SD_konspekt_text_new.doc
#
01.07.20251.32 Mб02013_11_05_Lekcija_Neuron_meregi_text.doc
#
01.05.2025464.9 Кб02013РПНДкс_ОХОРОНА ПРАЦІ В ГАЛУЗІ.doc
#
01.07.20254.05 Mб02014_01_08 конспект лекцій КС новий2_ частина2.doc
#
01.05.20253.11 Mб021 поза для женского портрета.doc
#
07.08.201943.04 Кб121-25в.docx
#
01.07.202570.66 Кб021-30.doc
#
01.05.202535.57 Кб021-31.docx
#
01.07.2025358.53 Кб021-40 питання.docx