
- •2. Архитектура вс параллельной обработки информации
- •2.1.Основные определения
- •2.2. Особенности архитектур эвм и вс прошедших поколений
- •2.3. Пути повышения производительности вычислительных средств и требования к вычислительным системам параллельной обработки информации
- •Перспективы и проблемы использования высокопроизводительных вс параллельной обработки информации
- •2.4. Способы параллельной обработки информации. Уровни обработки (гранулярность обработки)
- •2.5. Классификация вс с функциональной точки зрения
- •2.6. Проблемы неймановской архитектуры
- •2.7 . Особенности risс-архитектуры.
- •2.Х. Классификация вычислительных моделей и механизмов обработки
- •2.8. Вычислительные модели (системы) с управлением потоком данных (потоковые машины) и редукционные машины
- •2.9. Матричные (векторные) процессоры (simd-архитектуры)
- •2.10. Пример разрядно-модульного матричного процессора simd-архитектуры (параллельный процессор для обработки двухмерных изображений, передаваемых из космоса).
- •Разрядно-модульная матричная окмд
- •2.11. Особенности реализации мультимедийных алгоритмов на основе архитектур simd в современных простейших микропроцессорах
- •2.12. Процессоры со многими алу
- •2.13. Процессоры с конвейеризацией команд
- •2.14. Конвейерные операционные устройства обработки информации
- •2.15. Направления развития современных архитектур процессоров
- •2.16. Суперскалярные вычислительные системы
- •2.17. Микропроцессор Pentium 4.
- •2.18. Суперкомпьютер Gray
- •Секция регистров
- •2.19. Многопроцессорные системы.
- •Что это дает?
- •2.20. Разновидности ос многопроцессорных систем,
- •2.21. Мультипроцессорные системы на базе мп Alpha 21364
- •2.22. Однокристальные многопроцессорные системы
- •2.23. Векторно-конвейерные супер-эвм Cray c90, t90
- •2.24. Многопроцессорные вычислительные системы семейства мвс (мвс - 1000)
- •2.25. Многопроцессорная вычислительная система Эльбрус.
- •2.26. Многоядерные многопотоковые микропроцессоры
- •2.27. Кластерные системы.
- •2.28. Концепция grid-архитектур
- •2.29. Транспьютеры. Особенности архитектур мультитранспьютерных систем.
- •2.30. Транспьютерная многопроцессорная система для цифровой обработки сигналов. Транспьютерная многопроцессорная система цифровой обработки сигналов
- •2.31. Примеры формального представления сегментированных программ для параллельного исполнения.
- •2.32. Показатели производительности вычислительных систем.
2.4. Способы параллельной обработки информации. Уровни обработки (гранулярность обработки)
1. Способы параллельной и параллельно-последовательной обработки.
Многоэлементная одновременная обработка:
…
Многостадийная (многосегментная, конвейерная) обработка:
…
Комбинированная обработка:
Уровни обработки (гранулярность обработки):
а) Программы (задачи); части программ, задач. Реализация обычно на основе центральных процессоров, мощных универсальных процессоров.
б) Команды. В команды включается как обращение к памяти (чтение/запись операндов), так и выполнение операции. Реализуется на основе процессорных элементов (множество одинаковых процессорных элементов, SIMD - архитектуры).
в) Операции. Выполнение операции, не включая обращение к памяти. Обычно реализация осуществляется на основе множественных АЛУ, взаимодействующих с регистрами общего назначения.
Учитывая вышесказанное, можно выделить следующие классы ЭВМ:
а) Многопроцессорные системы. На основе универсальных процессоров типа; гранулярность программа-задача.
б) Матричный (векторный) процессор (реализация на основе одинаковых процессорных элементов); гранулярность команда.
в) Процессор со многими АЛУ, суперскалярные ЭВМ; гранулярность на уровне АЛУ - операция.
г) Процессор с конвейеризацией операций и команд; гранулярность на уровне стадии конвейера - операция.
д) Комбинированное использование классов процессоров и систем.
2.5. Классификация вс с функциональной точки зрения
В основе классификации лежат понятия «потоки команд», «потоки данных».
Выделяют 4 класса:
Одиночный поток команд - одиночный поток данных (ОПК – ОПД, SISD, ОКОД).
Простейшая архитектура однопроцессорной ЭВМ.
ОПК
ОПД
Одиночный поток команд - множественный поток данных (ОПК-МПД, SIMD, ОКМД).
P
ower
PC;
Connection Machine (16тыс. элемен-
тарных процессоров);
ПС-2000, 3000; MMX; MX;
Сигнальный процессор ADSP2116X ПД1
(2 процессора SIMD);
ILLIAC – IV; ПДN
Матричные системы;
Цифровые интегрирующие структуры
Множественный поток команд - множественный поток данных (МПК – МПД, MIMD, МКМД).
М
ногопроцессорные
системы.
Эльбрус3 (16 процессоров.). Grey
многопроцессорные суперсерверы.
МВС на основе транспьютеров,
Pentium-ов;
Alpha (2 млрд. операций/сек);
ТМS 320С8x;
Процессоры с множественными АЛУ,
суперскалярные архитектуры.
Множественный поток команд - одиночный поток данных (МПК – ОПД, MISD, МКОД).
Конвейерные системы (многостадийные).
Конвейер используется в суперскалярных архитектурах, других современных системах.
2.6. Проблемы неймановской архитектуры
Особенности неймановской архитектуры – простейшей классической ЭВМ:
программа и данные хранятся в памяти;
память имеет линейный характер со сквозной нумерацией;
команды выполняются последовательно, возможны условные переходы;
возможности параллельно реализовывать только явно выраженные параллельные участки;
отсутствует различие между хранимыми в памяти данными и командами.
Проблемы такой архитектуры:
Обработка связана с постоянной перезаписью результатов вычислений в память (побочный эффект, главная проблема).
Параллельная обработка информации должна описываться на специальном языке; должны быть введены специальные средства обработки. Для параллельной обработки необходимо вводить специальные многомерные описания (в рамках векторного описания).
Проблема побочного эффекта усиливается при использовании косвенной адресации, т.к. увеличивается количество пересылок.
Узким местом оказывается канал обмена информацией между процессором и памятью? что в значительной мере определяет производительность ("узкое горло").
Пути решения проблемы:
Расширение каналов передачи данных между центральным процессором и памятью.
Введение Кэш-памяти, в частности, многоуровневой Кэш-памяти (до 3-х уровней).
Отказ от использования архитектур (неймановских), имеющих побочный эффект. Направление создания потоковых машин и редукционных машин.
Организация таких архитектур, в которых считанные из памяти данные проходят как можно больше этапов обработки, прежде чем снова попадут в память. Конвейерные принципы, однородные структуры, систолические структуры.