- •Принцип двоичного кодирования
- •0 D 0 0 1 0 0 0 инверт
- •1) Проверить, выровнены ли порядки, и. Если нет. То выровнять.
- •2} Сложить мантиссы (одна из них. Возможно, денормализовша).
- •С 1992 г. - неотъемлемая часть Intel и amd.
- •271 Команда - групповые арифметические и логические операции , сдвиги , сравнения , перегруппировка и извлечение отдельных чисел , различные варианты пересылок .
- •Команды управления виртуальной памятью .
- •6} В режиме ss&2
- •3 Register ImmediateFormat 1a
- •Instruction -Level Pa га I lei ism
- •Instruction -Level Parallel ism
- •Su perscalarArch itectu res
- •Intel 486 - один конвейер , Pentium - 2 конвейера из 5 стадий .
- •Su perscalarArch itectu res
- •Su perscalarArch itectu res
- •Instruction
- •1011X j|I 2 - все параллельно
- •1 Упрощается архитектура процессора ; вместо распараллеливающей логики на eric процессоре можно разместить больше регистров , функциональных устройств .
- •BusWidth
- •1. Арбитраж пин
- •3. Методы повышения эффективности пин
- •4. Стандарты шинS Примеры
- •Bus Arbitration (2)
- •Способы расширения полосы пропускания шин :
- •Pci BusTransactions
- •Сокращённые обозначения -kj,Mi7 Gi.Ti.Pi и Ei.
- •Vax/1980 pPra/1996
- •MemoryChips
- •Volatile
- •1. Блочная организация основной памяти
- •2. Микросхемы памяти
- •Расслоение памяти
- •Расслоение памяти
- •1. Динамические сву
- •Динамические сву для видеоадаптеров
- •Многопортовые os/
- •Volatile
- •2. (Пни -память
- •3. Ассоциативные 3/
- •4. Организация fau -памяти
- •Пример 2
- •Пример 2
- •1. Организация fcu -памяти
- •2. Система ввода -вывода
- •Ёмкость каи - 32kb , строки го 25б байт .
- •Address
- •64 Kb cache, direct -mapped,32 -byte cache block
- •32 Kb cache, 2 -wayset -associative, 16 -byteblocks
- •16Kb,4 -wayset-associativecache732 -bitaddress, byte -addressablememory/32 -byte cache blocks/lines
- •Write -through - прежде всего обновляется слово ,
- •Средства обнаружения и защиты от ошибок . Архитектура современных н)¥щ основана на полностью ассоциативном отображении .
- •Структура гу
- •1. Понятие конвейера
- •If: Instruction fetch
- •Id: Instruction decode/ register file read
- •Риск го данным - взаимосвязь команд го данным
- •Pipelined Datapath
- •Hazards
- •Superscalar Architectures
- •Instruction
- •Instruction decode
- •1. Очередность вьщачи декодированных команд на исполнительные блоки отличается от последовательности предписанной программой -неупорядоченная выдача команд (out-of-orderissue ),
- •Sisd,misd,simd,mimd.
- •Классификация Флинна
- •Heterogeneous multiprocessor chip with six cores
- •Организация памяти вс
- •Message-passing interconnection network
- •3 Stages
- •3 Stages
- •Num am ulti processors
- •Interconnection network
- •18Bits 8
- •18Bits 8
- •And memories are not shown.
- •(A) a star, (b) a complete interconnect.
- •(C) a tree, (d) a ring, (e) a grid, (f) a double torus.
- •(G) a cube, (h) a 4d hypercube.
- •Red Storm (2)
Организация памяти вс
Задача
правильной организации памяти в ЕЕ
-одна
из важнейших . Помимо основной проблемы
памяти , в
многопроцессорных системах дополнительная
-одновременный
доступ к памяти ю стороны нескольких
процессоров
.
Два типа К - с общей (sharedmemory ) и распределённой (distributedmemory ) памятью .
Системы с JM называют сильно связанными (closelycoupled ) или мультипроцессорами . Бывают как в SIM) классе 04 -SIMD), так и в MIMD(SM -MIMD).
Слайд 10
В системах с CM (looselycoupled ) - каждый процессор имеет собственную память . Ц1 объединяются в сеть и передают данные через сообщения . Выделяют CM -SIM) и СМ -ММ) мультикомпьютеры .
Printed
with FinePrint- purchase atwww.fineprint.com
Мультипроцессоры
|
р |
р |
р |
р |
I I I Г
CPU
|
р |
р |
р |
р |
1 I I Г

г
<■ -
|
1 |
1 |
1 |
1 |
|
р |
р |
р |
р |
|
1 |
1 |
1 |
1 |
|
р |
р |
р |
р |
(а)
Мультипроцессор с 16 ЦП и общей памятью .
Изображение , разделённое на 16 частей , анализируемое каждымпроцессором го отдельности .
Сяаяд 11
Мул
ьтиком пьютеры

|
м |
м |
м |
м | |||
|
1 |
1 |
1 |
1 | |||
|
р |
р |
р |
р | |||
|
- |
р |
— |
м | |||
|
- |
р |
м | ||||
|
|
р |
н |
~м1 | |||
|
- |
р |
- |
м | |||
|
м |
— |
р |
| |||
|
м |
— |
р |
| |||
|
м |
|
р |
| |||
|
м |
— |
р |
| |||
|
1 |
1 |
1 |
1 | |||
|
p |
p |
p |
p | |||
|
1 |
t |
1 |
1 | |||
|
M |
M |
M |
M | |||
|
Private
memory
CPU
\
I
Г
Message-
passing
interconnection
network |
|
|
О | ||
|
1 |
1 |
1 |
|
| |
|
р |
р |
р |
р | ||
Message-passing interconnection network
i i
|
|
н |
р |
| ||||
|
|
р |
| |||||
|
□ |
Н |
|
| ||||
|
|
- |
р |
| ||||
|
1 |
1 |
1 |
|
| |||
|
р |
р |
р |
р | ||||
|
1 |
1 |
J |
|
| |||
|
|
i |
|
'Д | ||||
CPU
(a)

(b)
(а) Мультикомпьютер с 16 ЦП , каждый из которых имеет свою собственную память .
(Ь) Изображение , разделённое между 16 независимыми СЕУ .
Printed
with FinePrint- purchase atwww.fineprint.com
Классификация параллельных ВС



Parallel
computer architectures
Vector
processor
Urifcrrn
Merncry
Access
|
|
Multi-computers |
| |
|
|
/\ |
| |
|
MPP |
COW | ||
![]()
|
Bus |
Switched |
CC-NUMA |
NC-NUMA |
Grid |
Hyper-cube |
Shared
memory
Message passing
COMA - Cash Only Memory Access, CC -NUMA - CacheCoherentNUMA, INC-NUMA - NoCachingNUMA,MPP - Massively Parallel Processors, INQ/V - Network of Workstation s, CD/V - Cluster of Workstations. сш*> в
Классификация
параллельных ВС
UMA
-
системы
с однородным доступом к памяти ,
доступ любого
процессора к любому участку памяти
- за одинаковое
время . Наиболее распространённая
архитектура
.

Техническая реализация нэ базе узла , соединяющего каждый из п процессоров с каждым из m модулей памяти . Простейший вариант - с общей шиной . Недостаток -проблемы с доступом к шине . Уне для трёх процессоров производительность подобной архитектуры начинает падать . fty наличии Ю процессоров - кривая производительности горизонтальная -добавление 11-го Ц1 нэ даст никакого эффекта . Ситуация усугубляется медленностью работы памяти и шины . В случае , если каждый из 1_П снабдить кш -памятью , насыщение происходит после добавления 25-30 Ц1 .
Слюй И-
Printed with FinePrint- purchase atwww.fineprint.com
UMA Symmetric Multiprocessor Architectures
Shared
memory


i
|
CPU |
|
CPU |
|
M | |||
|
|
|
|
|
|
|
|
|
Bus
Private memory
|
CPU |
|
CPU |
|
M | |
|
1 1 |
L 1 | ||||
|
Cache |
|
| |||
CPU
CPU
Shared memory
\
M
(a)
(b)
(c)
Три варианта мультипроцессоров с общей шиной . (а) Без гаи -памяти . (Ь) С гаи -памятью . (с) С гаи и собственной памятью .
Слайд Б
Классификация
параллельных ВС
Альтернативный
способ - коммутация вместо общей
шины
. Коммутатор способен параллельно
обслуживать несколько
запросов . Конфликты возможны лишь
при одновременном
доступе нескольких ф к одному модулю
памяти .

Недостатки UMA :
- системы плохо масштабируются . Большинство UMA систем на базе 4-8 ЦП ,32 -64 - очень редки .
- низкая отказоустойчивость . Выход из строя одного модуля памяти или ЦП - отказ всей системы .
Слайд 16
Printed with FinePrint- purchase atwww.fineprint.com
Мультипроцессоры с координатными коммутаторами

S
S 5
5 2 2 =
Open
crosspoinl
switch
7
Closed
crosspoint
switch
(a) Координатныйкоммутатор 8x8.
(b) Открытыйкоординатныйпереключатель .
(c) Закрытыйкоординатныйпереключатель .
[al
Плюсы - HK представляет собой всегда будет связан с нужным какая -то линия или узел учоз планирования нэ требуется .
Минусы - число узлов растет как
неблокируемую сеть . Т.е. ЦП блоком памяти , даже если заняты . Предварительного
п2.
Слайд 17
Мультипроцессоры
UWK
с
многоступенчатыми сетями
А —
В —
X
Y
|
Module |
Address |
Opcode |
Value J
(a) (b)
(а) Коммутатор 2x2. (b) Формат сообщения .
Поле «Модуль »сообщает , какую память использовать (X иги Y). Поле «Ацрвс»определяет адрес в этом модуле памяти . В поле «Кщ операции »содержится операция , например 9ЕЮ или WRITE. Дополнительное поле «Значение » может содержать операнд , например 32 -битное слово , которое нужно записать при выполнении операции WRITE.
Коммутатор исследует попе «Модуль »и использует его для определения f через какую выходную линию нужно отправить сообщение : через X или через Y.
Слюй 18
Printed with FinePrint- purchase atwww.fineprint.com
Мультипроцессоры с многоступенчатыми сетями














