
- •Оглавление
- •Введение (новый весь раздел)
- •Архитектуры, характеристики, классификация эвм
- •Однопроцессорные архитектуры эвм
- •Конвейерная обработка команд из раздела 3.5
- •Cуперскалярная обработка из раздела 1.1.1 с дополнением
- •Архитектура sisd
- •Vliw-архитектура
- •Simd-архитектура
- •Многоядерные структуры процессора и многопотоковая обработка команд
- •Технические и эксплуатационные характеристики эвм
- •Классификация эвм
- •Классификация эвм по назначению
- •Классификация эвм по функциональным возможностям
- •Функциональная и структурная организация эвм
- •Обобщенная структура эвм и пути её развития
- •Типы данных
- •Структура и форматы команд эвм
- •Способы адресации информации в эвм
- •2.4.1. Абсолютные способы формирования исполнительного адреса
- •2.4.2. Относительные способы формирования исполнительных адресов ячеек памяти
- •Примеры форматов команд и способов адресации
- •Форматы команд и способы адресации в интеловских процессорах
- •Форматы команд и способы адресации в risc-процессорах
- •Особенности системы команд ia-64
- •Раздел 2.6 перенесен из раздела 3.6 предыдущего пособия
- •Принципы организации системы прерывания программ
- •ФункциональнаЯ и структурнаЯ организация центрального процессора эвм
- •НИзменен номер азначение и структура центрального процессора
- •Назначение, классификация и организация цуу
- •Регистровые структуры процессоров amd64 (Intel64)
- •Регистровые структуры процессоров ia-64
- •Структурная организация современных универсальных микропроцессоров
- •Стратегия развития процессоров Intel
- •Особенности многоядерной процессорной микроархитектуры Intel Core
- •Микроархитектура Intel Nehalem
- •Семейство процессоров Intel Westmere
- •Микроархитектура amd к10
- •Современное состояние и перспективы развития микропроцессоров для Unix-серверов
- •Микропроцессоры семейства Ultra sparc
- •Микропроцессор ibm power 7
- •Микропроцессор Intel Itanium 9300 (Tukwila)
- •Микропроцессор Intel Nehalem ex
- •Принципы организации подсистемы памяти эвм и вс
- •Иерархическая структура памяти эвм
- •Организация стека регистров
- •Способы организации кэш-памяти
- •Типовая структура кэш-памяти
- •Способы размещения данных в кэш-памяти
- •Методы обновления строк основной памяти и кэша
- •Методы замещения строк кэш-памяти
- •МУбран абзац ногоуровневая организация кэша
- •Принципы организации оперативной памяти
- •Общие положения
- •Методы повышения пропускной способности оп
- •М Изменён номер етоды управления памятью
- •ОИзменен номер рганизация виртуальной памяти
- •Методы ускорения процессов обмена между оп и взу
- •ОрганизациЯ системНого интерфейса и вВода-вывода информации
- •Общая характеристика и классификация интерфейсов
- •Способы организации передачи данных
- •Системная организация компьютеров на базе современных чипсетов
- •Системная организация на базе чипсетов компании Intel
- •Системная организация на базе чипсета amd
- •Многопроцессорные и многомашинные вычислительные системы
- •Архитектуры вычислительных систем
- •Сильносвязанные многопроцессорные системы
- •Слабосвязанные многопроцессорные системы
- •Список литературы
- •Организация эвм и систем
Системная организация на базе чипсета amd
В качестве примера рассмотрим структуру чипсета AMD 890GX (см. рис. 5.6). Чипсет представляет собой классический набор из двух микросхем. Северный мост 890GX соединяется с процессорным сокетом AM3 через шину Hyper Transport 3.0 (с пропускной способностью 20,6 Gb/s) и с южным мостом SB850 через шину PCI Express x4, которая теперь называется «A-Link Express III» и имеет пропускную способность 2 Gb/s. Северный мост поддерживает шину PCI Express 2.0 x16, которая может быть разбита на две шины (PCI-E x8+x8) для Cross Fire и поддерживает 6 линий PCI-E 2.0 x1 для дополнительных слотов на материнской плате. Интегрированная графика, встроенная в северный мост 890 GX, использует ядро RV620, которое работает на тактовой частоте 700 МГц.
Рис. 5.6. Схема чипсета AMD 890 GX
Ю
Убран раздел
5.3.3
Многопроцессорные и многомашинные вычислительные системы
Архитектуры вычислительных систем
Точно также, как однопроцессорные компьютеры представлены по классификации М. Флина архитектурами с одним потоком данных SISD и множеством потоков данных SIMD, так и многопроцессорные системы могут быть представлены двумя базовыми типами архитектур в зависимости от параллелизма данных:
MISD (Multiple Instruction Single Data) – множество потоков команд – один поток данных;
MIMD (Multiple Instruction Multiple Data) – множество потоков команд – множество потоков данных.
Класс MISD долгое время пустовал, поскольку не существовало практических примеров реализации систем, в которых одни и те же данные обрабатываются большим числом параллельных процессов. В дальнейшем для MISD нашлась адекватная организация вычислительной системы – распределённая мультипроцессорная система с общими данными. Наиболее простая и самая распространённая система этого класса – обычная локальная сеть персональных компьютеров, работающая с единой базой данных, когда много процессоров обрабатывают один поток данных. Впрочем, тут есть одна тонкость. Как только в такой сети все пользователи переключаются на обработку собственных данных, недоступных для других абонентов сети, MISD-система превращается в систему с множеством потоков команд и множеством потоков данных, соответствующую MIMD-архитектуре.
Так как только MIMD-архитектура включает все уровни параллелизма от конвейера операций до независимых заданий и программ, то любая вычислительная система этого класса в частных приложениях может выступать как SISD и SIMD-система. Например, если многопроцессорный комплекс выполняет одну единственную программу без каких-либо признаков векторного параллелизма данных, то в этом конкретном случае он функционирует как обычный SISD-компьютер, и весь его потенциал остается невостребованным. Таким образом, употребляя термин «MIMD», надо иметь в виду не только много процессоров, но и множество вычислительных процессов, одновременно выполняемых в системе.
Другая классификация многопроцессорных вычислительных систем (МВС), основана на разделении МВС по двум критериям: способу построения памяти (общая или распределенная) и способу передачи информации. Основные типы машин представлены в табл. 6.1. Здесь приняты следующие обозначения: Р – элементарный процессор, М – элемент памяти, К – коммутатор, С – кэш-память.
Параллельная вычислительная система с общей памятью и шинной организацией обмена (машина 1) позволяет каждому процессору системы «видеть», как решается задача в целом, а не только те части, над которыми он работает. Общая шина, связанная с памятью, вызывает серьёзные проблемы для обеспечения высокой пропускной способности каналов обмена. Одним из способов обойти эту ситуацию является использование кэш-памяти (машина 2). В этом случае возникает проблема когерентности (адекватности) содержимого кэш-памяти и основной памяти. Другим способом повышения производительности систем является отказ от общей памяти (машина 3).
Идеальной машиной является вычислительная система, у которой каждый процессор имеет прямые каналы связи с другими процессорами, но в этом случае требуется чрезвычайно большой объём оборудования для организации межпроцессорных обменов. Определенный компромисс представляет сеть с фиксированной топологией, в которой каждый процессор соединен с некоторым подмножеством процессоров системы (машины 4, 5, 6).
Если процессорам, не имеющим непосредственного канала обмена, необходимо взаимодействовать, они передают сообщения через промежуточные процессоры. Одно из преимуществ такого подхода – не ограничивается рост числа процессоров в системе. Недостаток – требуется оптимизация прикладных программ, чтобы обеспечить выполнение параллельных процессов, для которых необходимо активное воздействие на соседние процессоры.
Наиболее интересным вариантом для перспективных параллельных вычислительных комплексов является сочетание достоинства архитектур с распределенной памятью и каналами межпроцессорного обмена. Один из возможных методов построения таких комбинированных архитектур – конфигурация с коммутацией, когда процессор имеет локальную память, а соединяются процессоры между собой с помощью коммутатора (машина 9). Коммутатор может оказаться весьма полезным для группы процессоров с распределяемой памятью (машина 8). Данная конфигурация похожа на машину с общей памятью (машина 7), но здесь исключены проблемы пропускной способности шины.
Таблица 6.1
Основные типы машин
Типы передачи сообщений |
Типы памяти |
||
Общая память |
Общая и распределенная |
Распределенная память |
|
Шинные соединения |
|
|
|
Фиксированные перекрестные соединения |
|
|
|
Коммутационные структуры |
|
|
|
MIMD-системы по способу взаимодействия процессоров (рис. 6.1) делятся на системы с сильной и слабой связью.
Системы с сильной связью (иногда их называют «истинными» мультипроцессорами) основаны на объединении процессоров на общем поле оперативной памяти.
Системы со слабой связью представляются многопроцессорными и многомашинными системами с распределенной памятью. Разница организации MIMD-систем с сильной и слабой связью проявляется при обработке приложений, отличающихся интенсивностью обменов между процессами.
Рис.
6.1. Классификация вычислительных систем
с MIMD-архитектурой