Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Нижегородский Государственный Университет им. Н.И. Лобачевского

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

intel-xeon-phi / 03_Lecture_Offload_Optimization.pptx

Скачиваний:

Добавлен:

11.03.2016

Размер:

746.85 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 63 4 5 6 > Следующая >>>

Явная схема работы с памятью: схема двойной буферизации…

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Явная схема работы с памятью: схема двойной буферизации

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Явная схема работы с памятью: работа со структурами…

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Явная схема работы с памятью: работа со структурами

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

2. Введение в Intel Cilk+

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Технология Intel® Cilk Plus

Intel® Cilk Plus – расширение языков C и C++, которое упрощает разработку приложений, параллельных по задачам и данным в системах с общей памятью.

Поддерживается компиляторами ICC (с версии 12.0) и GCC (с версии 4.7).

Разрабатывался с 1994г. в лаборатории Информатики MIT (http://supertech.csail.mit.edu/cilk). В 2009г. выкуплен компанией Intel.

Разработчики Cilk Plus предоставляют средства для организации циклического и рекурсивного («разделяй и властвуй») параллелизма.

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Основные компоненты Intel® Cilk Plus

Ключевые слова (cilk_for, cilk_spawn, cilk_sync). Инструмент для организации параллелизма по задачам.

Гипер-объекты или преобразователи (reducers). Устраняют конкуренцию за переменные, разделяемые между задачами, создавая представление этих переменных для каждой задачи и собирая их обратно в разделяемое значение по завершении всех задач.

Специальное представление массивов (C/C++ Extensions for Array Notation (CEAN)). Данный компонент обеспечивает параллелизм по данным (векторизацию).

Элементарные функции. Включают параллелизм по данным для всех функций и операций со специальными массивами или их частями.

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Ключевые слова: cilk_spawn

Конструкция, которая может быть использована

непосредственно перед вызовом функции, чтобы указать системе, что данная функция может выполняться параллельно с вызывающей.

–cilk_spawn func(args);

–var = cilk_spawn func(args);

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Ключевые слова: cilk_sync

Точка синхронизации обработчиков.

Используется, когда дальнейшие вычисления в родительской функции невозможны без результатов дочерней.

do_init_stuff(); // 1 cilk_spawn func3(); // 3 do_more_stuff(); // 2 (1) cilk_sync; do_final_stuff(); // 4

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

Ключевые слова: cilk_for

Конструкция, предназначенная для распараллеливания циклов с известным количеством повторений.

Требования к циклу:

–Независимость итераций по данным.

–Тело цикла не должно содержать операторов принудительного перехода (break, continue, return).

–Наличие только одной переменной-счетчика.

cilk_for (int i = 0; i < 1000; ++i)

{

//…

}

Нижний Новгород, 2015

Элементы оптимизации прикладных программ для Intel Xeon Phi. Intel Compiler

<<< < Предыдущая 1 23 / 63 4 5 6 > Следующая >>>

Соседние файлы в папке intel-xeon-phi

#
11.03.20161.38 Mб1801_Lecture_XeonPhiArchitecture.pptx
#
11.03.2016746.85 Кб1203_Lecture_Offload_Optimization.pptx
#
11.03.2016172.16 Кб1004_Offload_JacobiMethod.pptx
#
11.03.2016533.11 Кб1405_Lecture_VectorExtensions.pptx
#
11.03.2016128.88 Кб1006_Lab_Vectorization.pptx