
- •2. Архитектура вс параллельной обработки информации
- •2.1.Основные определения
- •2.2. Особенности архитектур эвм и вс прошедших поколений
- •2.3. Пути повышения производительности вычислительных средств и требования к вычислительным системам параллельной обработки информации
- •Перспективы и проблемы использования высокопроизводительных вс параллельной обработки информации
- •2.4. Способы параллельной обработки информации. Уровни обработки (гранулярность обработки)
- •2.5. Классификация вс с функциональной точки зрения
- •2.6. Проблемы неймановской архитектуры
- •2.7 . Особенности risс-архитектуры.
- •2.Х. Классификация вычислительных моделей и механизмов обработки
- •2.8. Вычислительные модели (системы) с управлением потоком данных (потоковые машины) и редукционные машины
- •2.9. Матричные (векторные) процессоры (simd-архитектуры)
- •2.10. Пример разрядно-модульного матричного процессора simd-архитектуры (параллельный процессор для обработки двухмерных изображений, передаваемых из космоса).
- •Разрядно-модульная матричная окмд
- •2.11. Особенности реализации мультимедийных алгоритмов на основе архитектур simd в современных простейших микропроцессорах
- •2.12. Процессоры со многими алу
- •2.13. Процессоры с конвейеризацией команд
- •2.14. Конвейерные операционные устройства обработки информации
- •2.15. Направления развития современных архитектур процессоров
- •2.16. Суперскалярные вычислительные системы
- •2.17. Микропроцессор Pentium 4.
- •2.18. Суперкомпьютер Gray
- •Секция регистров
- •2.19. Многопроцессорные системы.
- •Что это дает?
- •2.20. Разновидности ос многопроцессорных систем,
- •2.21. Мультипроцессорные системы на базе мп Alpha 21364
- •2.22. Однокристальные многопроцессорные системы
- •2.23. Векторно-конвейерные супер-эвм Cray c90, t90
- •2.24. Многопроцессорные вычислительные системы семейства мвс (мвс - 1000)
- •2.25. Многопроцессорная вычислительная система Эльбрус.
- •2.26. Многоядерные многопотоковые микропроцессоры
- •2.27. Кластерные системы.
- •2.28. Концепция grid-архитектур
- •2.29. Транспьютеры. Особенности архитектур мультитранспьютерных систем.
- •2.30. Транспьютерная многопроцессорная система для цифровой обработки сигналов. Транспьютерная многопроцессорная система цифровой обработки сигналов
- •2.31. Примеры формального представления сегментированных программ для параллельного исполнения.
- •2.32. Показатели производительности вычислительных систем.
2.10. Пример разрядно-модульного матричного процессора simd-архитектуры (параллельный процессор для обработки двухмерных изображений, передаваемых из космоса).
Процессорная матрица: 16384 ПЭ; один ПЭ имеет локальную память 1024 бит.
Разрядно-модульная матричная окмд
ПЭ связан с четырьмя соседними элементами. ПЭ однобитовые, коды поступают последовательные, все элементы настраиваются на выполнение одной команды. Переходная память для стыковки и подготовки форматов.
2.11. Особенности реализации мультимедийных алгоритмов на основе архитектур simd в современных простейших микропроцессорах
2.11.1. Pentium MMX (простейшая организация SIMD-архитектуры в микропроцессоре)
Система команд Pentium MMX имеет 57 специальных дополнительных команд, ориентированных на мультимедийные алгоритмы; введено специальное дополнение в виде устройства ММХ. Добавлено: 8 ММХ регистров, появились новые команды. Добавлены типы данных (8 упакованных байт в 64 битовом пакете, четыре 16 битовых слова, упакованные двойные слова по 32 бита (два слова) и учетверенное слово 64 бита).
Пример выполнения команды ММХ.
Выполнение умножения с накоплением четырех 16 разрядных слов на другие 4 слова, при этом используются 3 команды MMX.
На Pentium-е без использования MMX требуется 12 команд для выполнения таких действий. В Pentium-е MMX реализуется параллельно-конвейерный принцип.
Команды:
1. Загрузка операндов в ММХ регистр:
16р А3 |
16р А2 |
16р А1 |
16р А0 |
2. Умножение и сложение содержимого ММХ регистра и памяти:
А3 |
А2 |
А1 |
А0 |
ММХ регистр
В3 |
В2 |
В1 |
В0 |
const
А3*В3+А2*В2 |
А1*В1+А0*В0 |
3. Сложение результата с содержимым аккумулятора:
АСС1 |
АСС2 |
В итоге в аккумуляторе накапливаются результаты.
2.11.2. Особенности реализации SIMD в микропроцессоре PowerPC (G5)
Имеется 128-и разрядный блок векторной обработки, который параллельно функционирует с имеющимся целочисленным блоком и блоком обработки с плавающей точкой.
Данные, которые могут обрабатываться: 16 8-и битовых целых (и символы) или 8 16-и битовых целых (и символы), или 4 32-х битовых целых чисел или чисел с плавающей запятой.
В блоке векторной обработки предусматривается 32 регистра по 128 разрядов (как регистры общего назначения). Их можно использовать для хранения исходных данных.
Команды могут содержать до 3-х входных операндов и один выходной. Общее количество команд – 162, включая векторную обработку.
Могут реализовываться не только массовые скалярные операции, но и сложные векторные операции (скалярное умножение векторов, матриц) и операции, работающие с несколькими регистрами.
2.12. Процессоры со многими алу
Процессоры имеют гранулярность на уровне операций. АЛУ обслуживаются регистром, а не общей памятью.
Особенность системы: множество одновременно работающих АЛУ; используется многопортовый регистровый файл.
Для управления n АЛУ могут использоваться длинные микрокоманды, состоящие из n полей, и каждое поле управляет отдельным АЛУ.
АЛУ может носить как универсальный по набору команд (микроинструкций), так и специализированный характер.
Данный принцип организации лежит в основе построения операционных ядер современных микропроцессоров, в частности, суперскалярных архитектур, ядер многоядерных процессоров. В основе реализации АЛУ - конвейерный принцип, на основе которого достигается получение одного результата за один такт.
Особенности организации работы современных процессоров с многими АЛУ согласуются с методологией RISK-архитектуры.