
- •Основные архитектуры параллельных компьютеров
- •Классификация архитектур вычислительных систем. (Классификация Флинна)
- •Модели параллельного программирования. Основные свойства параллельных алгоритмов
- •Модель задача-канал. Основные свойства модели "задача/канал"
- •Модель передачи сообщений
- •Модель параллелизма данных
- •Модель разделяемой памяти
- •Понятие о детерминизме программы
- •Модульность. Виды композиции модулей и/или программ
- •10. Пример параллельного алгоритма: конечные разности.
- •11. Основные этапы разработки параллельной программы.
- •12. Декомпозиция. Цели. Виды декомпозиции. Итоги этапа декомпозиции.
- •Д екомпозиция по данным
- •Ф ункциональная декомпозиция
- •13. Коммуникация. Виды коммуникаций: локальные, глобальные,динамические, асинхронные. Распределенные коммуникации ивычисления. Итоги.
- •Локальные/глобальные.
- •Синхронные/асинхронные.
- •Статические/динамические.
- •С труктурные/неструктурные.
- •16. Анализ эффективности параллельных алгоритмов. Система показателей оценки характеристик параллельной программы. Асимптотический анализ. Эффективность параллельной программы
- •Система показателей оценки характеристик
- •Соглашения о терминах
- •Принятая в mpi нотация записи
- •23. Базовые функции mpi (минимальный набор)
- •24. Библиотека mpi. Организация приема/передачи данных между отдельными процессами
- •Функции приема/передачи сообщений с блокировкой
- •Основные функции приема/передачи сообщений без блокировки
- •Совмещенные прием/передача сообщений
- •25. Библиотека mpi. Коллективные функции
- •Функции коллективного обмена данными
- •26. Библиотека mpi. Глобальные вычислительные операции над распределенными данными
- •27. Библиотека mpi. Обеспечение модульности. Коммуникаторы, группы и области связи
- •Два взаимосвязанных механизма:
- •Основные понятия (группа):
- •Основные понятия (коммуникатор):
- •28. Библиотека mpi. Проблемы использования различных типов данных. Пользовательские типы данных
- •Пользовательские типы данных:
- •Характеристики типов:
- •29. Библиотека mpi. Производные типы данных и передача упакованных данных
- •Механизмы эффективной пересылки данные разных типов:
- •Производные типы данных:
- •Характеристики типов:
- •Передача упакованных данных:
- •Технология OpenMp. Стратегия подхода.
- •Директивы OpenMp. Формат записи директив.
- •Директивы OpenMp. Области видимости директив. Типы директив.
- •Директивы OpenMp. Определение параллельной области.
- •Директивы OpenMp. Распределение вычислений по потокам.
- •Директивы OpenMp. Синхронизация.
- •Директивы OpenMp. Управление областью видимости данных.
- •37. Библиотека функций OpenMp. Функции контроля параметров среды исполнения.
- •38. Библиотека функций OpenMp. Функции синхронизации.
- •39. Технология OpenMp. Переменные среды исполнения.
Директивы OpenMp. Распределение вычислений по потокам.
Существует 3 директивы для распределения вычислений в параллельной области:
DO/for – распараллеливание циклов
section – распараллеливание раздельных фрагментов кода (функциональное распараллеливание)
single – директива для указания последовательного выполнения кода
!Начало выполнения директив по умолчанию не синхронизируется, завершение директив по умолчанию является синхронным.
Директива DO/for распределение итераций цикла между потоками; параллельная область уже должна быть активна, иначе игнорируется.
#
pragma omp for [clause ...] newline
for_loop
clause
schedule (type[,chunk]) ordered
private (list)
firstprivate (list)
lastprivate (list)
shared (list)
reduction (operator: list)
nowait
Директива DO/for – распределение итераций регулируется параметром schedule.
static – итерации делятся на блоки по chunk итераций и статистически разделяются между потоками; если параметр chunk не определен, итерации делятся между потоками равномерно и непрерывно.
dynamic – распределение итерационных блоков осуществляется динамически (по умолчанию chunk=1)
guided – размер итерационного блока уменьшается экспоненциально при каждом распределении; chunk определяет минимальный размер блока (по умолчанию chunk=1)
runtime – правило распределения определяется переменной OMP_SCHEDULE (при использовании runtime параметр chunk задаваться не должен)
Директива section – распределение вычислений для раздельных фрагментов кода
фрагменты выделяются при помощи директивы section
каждый фрагмент выполняется однократно
разные фрагменты выполняются разными потоками
завершение директивы по умолчанию синхронизируется
директивы section должны использоваться только в статическом контексте
#
pragma omp section [clause ...] newline
{
# pragma omp section newline
structured_block
}
clause
firstprivate (list)
lastprivate (list)
reduction (operator: list)
nowait
Директива single – определение фрагмента кода, который должен быть выполнен только одним потоком; все остальные потоки ожидают завершения выполнения фрагмента (если не указан параметр nowait)
#
pragma omp single [clause ...] newline
structured_block
clause
private (list)
firstprivate (list)
nowait
Директивы OpenMp. Синхронизация.
master –определяет фрагмент кода , который должен быть выполнен только основным потоком; все остальные потоки пропускают данный фрагмент (завершение директивы по умолчанию не синхронизируется)
#pragma omp master newline
structured_block
critical – определяет фрагмент кода, который должен выполняться только одним потоком в каждый текущий момент времени (критическая секция) При попытке входа в критическую секцию, которая уже исполняется одним из потоков используется, все другие потоки приостанавливаются ( блокируются ). Как только критическая секция освобождается, один из приостановленных потоков (если они имеются) активизируется для выполнения критической секции.
#pragma omp critical [name] newline
structured_block
Как можно заметить, критические секции могут быть именованными - можно рекомендовать активное использование данной возможности для разделения критических секций, т.к. это позволит уменьшить число блокировок процессов.
barrier – определяет точку синхронизации, которую должны достигнуть все процессы для продолжения вычислений (директива должна быть вложена в блок)
#pragma omp barrier newline
atomic – определяет переменную, доступ к которой (чтение/запись) должен быть выполнен как неделимая операция
#pragma omp atomic
statement_exrpession
Возможный формат записи выражения: x binop = expr, x++,++x,x--,--x
x должна быть скалярной переменной
expr не должна ссылаться на x
binop должна быть перегруженной операцией вида +,-,*,/,&,^,|,>>,<<
flush – определяет точку синхронизации, в которой системой должно быть обеспечено единое для всех процессов состояние памяти (т.е. если потоком какое-либо значение извлекалось из памяти для модификации, измененное значение обязательно должно быть записано в общую память)
#pragma omp flush (list) newline
Если указан список list, то восстанавливаются только указанные переменные.
Директива flush неявным образом присутствует в директивах barrier, critical, ordered, parallel, for, section, single
ordered – указывает фрагмент кода параллельного цикла, который должен выполняться точно в таком же порядке, как и при последовательном выполнении.
#pragma omp ordered newline
structured_block
В каждый момент в блоке ordered может находиться только один поток.
На одной итерации цикла может быть только одна директива ordered и эта директива может выполниться только однократно.
Цикл, в котором есть директива ordered, должен иметь параметр ordered
threadprivate – используется для создания поточных копий для глобальных переменных программы; созданные копии не видимы между потоками, но существуют все время выполнения программы
#pragma omp threadprivate (list)