
- •Лабораторний практикум
- •Загальні методичні вказівки
- •Технології оперативної пам'яті
- •1.3 Постановка завдання
- •1.5 Контрольні запитання
- •2.3 Постановка завдання
- •2.5 Контрольні запитання
- •3.3 Постановка завдання
- •Основні риси risc-процесорів
- •Risc-процесори 3-го покоління
- •Структура процесорів Alpha: 21064, 21264
- •Порівняльні характеристики Alpha 21164 і 21264
- •4.3 Постановка завдання
- •Паралельна обробка даних на еом
- •Закон Амдала
- •5.3 Постановка завдання
- •5.5 Контрольні запитання
- •Лабораторна робота №6 сучасна архітектура обчислювальних систем
- •6.1 Мета роботи
- •6.2 Теоретичні відомості
- •Vliw архітектура
- •Архітектура ia-64
- •Опис ia-64
- •6.3 Постановка завдання
- •Лабораторна робота №7
- •7.3 Постановка завдання
- •7.5 Контрольні запитання
- •Лабораторна робота №8 визначення швидкодії обчислювальної системи
- •8.1 Мета роботи
- •8.2 Теоретичні відомості
- •Порівняння за швидкістю процесора обчислювальної системи
- •Оцінка обчислювальної системи за тестами
- •Приклади тестів швидкодії/ефективності обчислювальних систем
- •Рекомендації щодо виконання роботи
- •8.3 Постановка завдання
- •8.5 Контрольні запитання
- •Перелік рекомендованих джерел
- •В.Г. Хорошевский. Архитектура вычислительных систем/ в.Г. Хорошевский. – м.: мгту им. Баумана,2008 - 530 с.
Порівняльні характеристики Alpha 21164 і 21264
Процесор Alpha 21264 відрізняється значною новизною в порівнянні з попередником 21164. Він володіє кеш-пам'яттю першого рівня більшого об'єму, додатковими функціональними блоками, ефективнішими засобами передбачення галужень, новими інструкціями обробки відеоданих і широкою шиною.
Alpha 21264 читає до чотирьох інструкцій за один такт і може одночасно виконувати до шести інструкцій. Найбільша його відмінність від моделі 21164 - це здатність виконувати команди (вперше для Alpha) із зміною їх черговості (Out-of-Order).
Ефективність виконання Out-of-Order визначається кількістю інструкцій, якими може маніпулювати ЦП в цілях визначення оптимального порядку виконання команд. Чим більше інструкцій ЦП може для цього використовувати, тим краще, тим далі він може заглядати вперед. Процесори Intel класу Р6 (Pentium Pro, Pentium II, Xeon) можуть одночасно звертатися не менше чим з 40 командами. В інших процесорів даний показник значно більше: PA-8000 фірми HP оперує 56 командами, а процесор Alpha справляється з 80 командами.
Як і більшість RISC-процесорів, Alpha містить набір з 32 цілочисельних і 32 регістрів з плаваючою комою, всі вони мають розрядність 64 біта. Для підвищення ефективності позачергового виконання команд процесор 21264 додатково до звичайного набору регістрів забезпечений ще 48 цілочисельними регістрами і 40 регістрами з плаваючою комою.
Кожен регістр може тимчасово зберігати значення поточних команд. Якщо обробляється яка-небудь інструкція, немає необхідності перенавантажувати результат в цільовий регістр - замість цього ЦП просто перейменовує тимчасовий регістр (Register Renaming).
Подібне перейменування регістрів є і в інших процесорах. Проте в 21264 реалізована унікальна "хитрість" - він має набір цілочисельних регістрів, що задублював, кожен з 80 цілочисельних регістрів дублюється ще раз. Таким чином, на чіпі в цілому - 160 цілочисельних регістрів. Це одна з причин, чому, не дивлячись на складність виконання Out-of-Order, допустима висока частота процесора 21264.
Блоки цілочисельних операцій в обох групах ідентичні не повністю. Одна з них містить блок множення, а друга - спеціальну логіку для обробки рухомих зображень (MPEG). Для цього набір команд Alpha був доповнений п'ятьма новими командами. Найцікавіша з них - PERR - служить для оцінки руху, тобто виконання завдання, що виникає як при стискуванні, так і декомпресії MPEG. Команда PERR виконує роботу дев'яти звичайних інструкцій. Таким чином, процесор 21264 може декодувати відеопослідовності MPEG-2, а також DVD-аудіодані AC-3 в режимі реального часу без використання додаткових периферійних пристроїв.
У процесорі 21264, на відміну від його попередників практично повністю реорганізована ієрархія кеш-пам'яті. Він забезпечений одним 64-Кбайт кешем першого рівня (L1) для інструкцій і ще одним 64-Кбайт кешем першого рівня для даних; обоє є двократно-асоціативними. Кеш-пам'ять другого рівня була винесена за межі чіпа - до неї можна звертатися через 128-біт backside-шину.
Порівняльні характеристики Alpha 21164 і 21264 наведені в таблиці 4.1.
Таблиця 4.1 - Порівняльні характеристики Alpha 21164 і 21264
ЦП
|
Alpha 21164
|
Alpha 21264
|
Тактова частота, Мгц
|
600 |
600 |
Кеш L1
|
Ємність:8(I)+8(D)
|
Ємність: 64(I)+64(D)
|
Блокується при числі непопадань, рівному
|
2 |
8 |
Число ФІУ
|
4 |
6 |
Ємкість файлу
|
32 (I)
|
80 (I), 2 копії
|
Регістрів
|
32 (FP)
|
72 (FP)
|
Перейменування регістрів
|
немає
|
так
|
Позачергове виконання команд
|
немає
|
так
|
Динамічне передбачення переходів
|
так
|
вдосконалене
|
Шина верхнього кешу
|
системна
|
виділена
|
Підтримка мультимедіа
|
немає
|
так
|
Число транзисторів
|
9,3 млн
|
15,2 млн
|
Площа, мм2
|
298 |
302 |
Процесори PA-RISC компанії Hewlett-Packard
Процесор PA-8000 увібрав в себе всі відомі методи прискорення виконання команд. У його основі лежить концепція "інтелектуального виконання", яка базується на принципі позачергового виконання команд. Ця властивість дозволяє PA-8000 досягати пікової продуктивності завдяки широкому використанню механізмів автоматичного дозволу конфліктів за даними і управлінням апаратними засобами. Ці засоби добре доповнюють інші архітектурні компоненты, закладені в структуру кристала: велике число виконавчих функціональних пристроїв, засоби прогнозування напряму переходів і виконання команд по припущенню, оптимізована організація кеш-пам'яті і високопродуктивний шинний інтерфейс.
Висока продуктивність PA-8000 багато в чому визначається наявністю великого набору функціональних пристроїв. До складу PA-8000 входять 10 виконавчих пристроїв: два арифметико-логічні пристрої (АЛП) для виконання цілочисельних операцій, два пристрої для виконання операцій зсуву/суміщення даних, два пристрої для виконання множення/сдодавання чисел з плаваючою крапкою, два пристрої ділення/обчислення квадратного кореня і два пристрої виконання операцій загрузки/записи.
Засоби позачергового виконання команд процесора PA-8000 забезпечують апаратне планерування завантаження конвеєрів і краще використання функціональних пристроїв. У кожному такті на виконання можуть видаватися до чотирьох команд, які поступають в 56-рядковий буфер переупорядковування. Цей буфер дозволяє підтримувати постійну зайнятість функціональних пристроїв і забезпечує ефективну мінімізацію конфліктів по ресурсах.
Кристал може аналізувати все 56 командних рядків одночасні і видавати в кожному такті по 4 готових для виконання команди у функціональні пристрої. Це дозволяє процесору автоматично виявляти паралелізм рівня виконання команд.
Суперскалярний процесор PA-8000 забезпечує повний набір засобів виконання 64-бітових операцій, включаючи адресну арифметику, а також арифметику з фіксованою і плаваючою крапкою. При цьому кристал повністю зберігає сумісність з 32-бітовими застосуваннями і з попередніми і майбутніми реалізаціями PA-RISC. Це перший процесор, в якому реалізована 64-бітова архітектура PA-RISC.
Пікова продуктивність RISC-процесорів
Пікова продуктивність RISC - процесорів представлена в таблиці 4.2.
Таблиця 4.2. Пікова продуктивність RISC - процесорів
Мікропроцесор
|
Частота, Мгц
|
Продуктивність, MFLOPS
|
DEC Alpha 21164
|
700 |
1400 |
DEC Alpha 21264
|
800 |
1600 |
HP PA-8000
|
180 |
720 |
HP PA-8200
|
236 |
944 |
HP PA-8500
|
400 |
1600 |
SGI/MIPS R10000
|
250 |
500 |
SGI/MIPS R12000
|
300 |
600 |
Sun Ultra SPARC II
|
300 |
600 |
Sun Ultra SPARC III
|
600 |
1200 |
Сфери застосування RISC-процесорів
Сучасні RISC-процесори застосовуються як:
Робочі станції вищого цінового класу (12-15 тисяч доларів). Працюють під ОС VMS, Unix.
Персональні робочі станції (3-7 тис. $). ОС: Windows NT, Solaris.
Сервери.
RISC ПК.