Параллельные вычислительные системы, закон Амдала

Добавил:

ysveta99 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет аэрокосмического приборостроения

Предмет:

Государственный экзамен

Файл:

вопросы госы 2021.docx

Скачиваний:

233

Добавлен:

01.06.2021

Размер:

10.49 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 4010 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Параллельные вычислительные системы, закон Амдала

Параллельные вычислительные системы

Параллелизация вычислений и ВС – главное направление для повышения вычислительной мощности.

Традиционные виды:

Параллельный ввод/вывод
Многоядерность
Параллелизация модулей оперативной памяти
Постоянная память (структура SSD)
Организация параллельных вычислений (на каждом из уровней ВС)

Параллелизация по уровням

1) Микроуровень (обработка команды из набора, преобразование в сигналы) – конвейерная обработка, каждый из сигналов может занимать несколько тактов, однако результаты выполнения будут следовать с одним интервалом.

Показатель CPI – clocks per instruction (такты за инструкцию) CPI = 1 – 1 такт, если последовательность команд идеально ложится на конвейер, конвейеризация). Идеальной конвейеризации мешают условные и безусловные переходы.

Для решения проблемы переходов следует предварительно анализировать исполняемый программный код и предсказывать переходы. Из-за этого задача носит вероятностный характер. В современных ЦП для этого предусмотрен специальный динамический планировщик.

Создание идеального динамического планировщика – трудная техническая задача, решение которой год от года совершенствуется.

Более известный показатель – производительность на ядро.

2) Уровень набора команд (ISO). Использование VLIW позволяет исполнять несколько команд за 1 такт. Перспективное направление получения PCI <<1.

Показатель IPC – instructions per clock

3) Уровень потоков и заданий. Параллелизацию обеспечивают архитектуры SIMD и её аналоги (массовый сегмент ВС). Для суперкомпьютеров используют архитектуры типа MIND. Много частных решений (Intel SMT).

Однако самое эффективное решение на данном уровне – увеличение вычислительных блоков и ядер.

Принципиальное ограничение – подходы программирования. Очевидно, что необходимо развитие параллельного программирования для использования потенциала параллелизации вычислительной техники. Сегодня эффективность алгоритмов должна рассматриваться с учётом параллельности вычислений.

Стремиться надо к векторно-матричным вычислениям (MatLab).

Эффективность параллельных вычислительных систем. Закон Амдава.

Насколько увеличивается скорость вычислений при использовании не 1 блока, а 10?

Рассматривается задача с 1 вычислительным блоком и n.

1 => T1, n => Tn

Sn – коэффициент ускорения вычислений.

Закон Амдава:

f – доля последовательной части программы, которая не может быть распараллелена.

При f = 1 пророста в скорости вычислений не будет.

При n => ∞ Sn = 1/f

Таким образом проблемой является наличие последовательной части в программном коде.

F = 0,5

N = 2

S2 = 1,33

F = 0,5

N = 4

S4 = 1,6

S4 приращение равно 27% относительно S2 меньше приращения S2 относительно S

Увеличение ядер без изменения размеров последовательной части постепенно

Обратный закон Густавсона. Рассматривается замедление выполнения программы при переходе от 1 к n вычислительным блокам.

Выполнение программы можно контролировать по загруженным ядрам в операционной системы.

В новых программах (не старше 10 лет) загрузка по ядрам происходит параллельно.

В старых программах загрузка может быть распределена на несколько ядер за счёт средств операционной системы.

ОС чаще всего организует параллельное выполнение, однако в ряде случаев это правило не действует.

Лучше использовать последние редакции ПО для задействования более полной параллелизации вычислений.

Сама ОС является многозадачной и на ряду с рабочим процессом пользователя существуют процессы ОС, которые идут постоянно и по расписанию.

(

Параллельные вычислительные системы — это физические компьютерные, а также программные системы, реализующие тем или иным способом параллельную обработку данных на многих вычислительных узлах.

Например, для быстрой сортировки массива на двухпроцессорной машине можно разделить массив пополам и сортировать каждую половину на отдельном процессоре. Сортировка каждой половины может занять разное время, поэтому необходима синхронизация.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 4010 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете Государственный экзамен

#
01.06.2021592.9 Кб81БД.pdf
#
01.06.202110.49 Mб233вопросы госы 2021.docx