Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет информационных технологий, механики и оптики

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

LEC02

.pdf

Скачиваний:

Добавлен:

14.04.2015

Размер:

237.57 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 33

#pragma omp for: конфликты (2)

Если в теле цикла потоки меняют значение общей переменной, то возможно искажение данных в этой переменной при одновременной попытке записи.

Ответственность за обнаружение таких конфликтов лежит на программисте. OpenMP не обнаружит конфликт и скомпилирует следующую ошибочную программу:

s = 0;

#pragma omp parallel for num_threads(2) shared(a, s) private(i) for (i = 0; i < 20; i++) {

a[i] = i;

s = s + a[i] ;

}

Массив a заполнится корректно, однако его сумма s будет рассчитана ошибочно, если на какой-либо из итераций поток 0 и поток 1 попытаются модифицировать s одновременно.

Защита общих переменных

Если в теле цикла потоки меняют значение общей переменной, то операцию присвоения следует защитить от одновременного изменения.

s= 0;

#pragma omp parallel for num_threads(2) shared(a, s) private(i) for(i = 0; i < 20; i++) {

a[i] = i;

#pragma omp critical s = s + a[i] ;

}

В результате s будет подсчитано корректно, т.к. операция присвоения выполнится не параллельно всеми потоками, а последовательно. Это позволяет решить конфликт между потоками, но негативно повлияет на параллельное ускорение, т.к. соответствующая часть инструкций цикла принудительно помечена как нераспараллеливаемые.

#pragma omp atomic

Защита операции присвоения общих переменных возможна также с помощью более быстрой директивы atomic, которую можно использовать только для атомарных аппаратноускоряемых команд вида «load-modify-store», имеющих вид:

•x <операция>= <выражение>;

где <операция> может быть +, , −, /, &, ˆ, |, <<, >> ;

•x++;

•++x ;

•x−− ;

•−− x ;

Примеры:

#pragma omp atomic Counter += 10; #pragma omp atomic

Counter += a++; // ошибка: операция a++ не будет защищена 23

Параметр reduction

Если в теле цикла потоки меняют значение общей переменной, просто накапливая сумму, то возможно более эффективное устранение конфликта:

#pragma omp parallel for num_threads(2) shared(a, s) private(i) reduction(+:s) for(i = 0; i < 20; i++) {

a[i] = i;

s = s + a[i] ;

}

•В результате s будет подсчитано корректно, при этом операция модификации s будет выполняться потоками параллельно (одновременно), т.к. OpenMP создаст локальные копии s для каждого потока. По окончании цикла OpenMP сложит все локальные копии и поместит их в общую переменную s.

•Помимо операции +, параметр reduction умеет работать с другими операциями: -, *, /

•OpenMP самостоятельно инициализирует локальные переменные s значением 0 или 1 (в зависимости от операции), игнорируя начальное значение переменной s.

Проблема балансировки нагрузки

#pragma omp for schedule

•#pragma omp for schedule(static, chunk_size)

•#pragma omp for schedule(dynamic,chunk_size)

•#pragma omp for schedule(guided, chunk_size)

•#pragma omp for schedule(runtime)

(runtime подставляется из переменной среды окружения OMP_SCHEDULE)

#pragma omp parallel num_threads(8)

{

#pragma omp for schedule(dynamic,1) for (i = 0; i < 8; i++)

printf("[1] iter %d, tid %d\n", i, omp_get_thread_num()); #pragma omp for schedule(static,1)

for (i = 0; i < 8; i++)

printf("[2] iter %d, tid %d\n", i, omp_get_thread_num());

}	26

<<< < Предыдущая 1 23 / 33

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
14.04.2015371.17 Кб25LEC01. Позиционные системы счисления.pdf
#
21.03.2016936.38 Кб26LEC01. Системы счисления.pdf
#
14.04.2015871.61 Кб17LEC01.Введение.pdf
#
21.03.2016919.65 Кб29LEC01.Системы счисления.pdf
#
21.03.2016413.38 Кб43LEC02. Нетрадиционные системы счисления.pdf
#
14.04.2015237.57 Кб16LEC02.pdf
#
21.03.2016724.38 Кб16LEC02.pdf
#
14.04.20151.48 Mб29LEC02.Нетрадиционные системы счисления.pdf
#
21.03.2016229.8 Кб20LEC03.Представление отрицательных чисел.pdf
#
14.04.2015350.11 Кб34LEC03.Теория информации.pdf
#
21.03.2016233.46 Кб24LEC04. Теория информации.pdf