Структура матрицы m и схема распределения.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Международный юридический институт

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Задание № 1.docx

Скачиваний:

Добавлен:

12.11.2019

Размер:

1.01 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1110 11 > Следующая >>>

Структура матрицы m и схема распределения.

Вычислительный эксперимент показал, что использование технологии OpenMP для распараллеливания вычислений на четырёх ядрах (P=4) приводит к существенному сокращению времени работы программы: коэффициент ускорения вычислений составил , эффективность использования процессоров .

В рамках MPI-подхода оказалось возможным исследовать зависимость времени выполнения программы , коэффициента ускорения вычислений и эффективности использования процессоров от числа P задействованных процессоров (табл.1).

Предложенный алгоритм вычислений оказывается весьма эффективным и позволяет сократить время вычислений более чем в 10 раз при полной загрузке 12 процессорных ядер. Уменьшение эффективности с ростом числа используемых процессоров объясняется, главным образом, неравномерной загрузкой используемых процессоров и затратами времени на коммуникационные операции между менеджером и исполнителями.

Показатели эффективности и работы

P	, сек.
2	2072	1,96	0,98
4	1079	3,77	0,94
6	705	5,77	0,96
8	584	6,97	0,87
10	485	8,40	0,84
12	406	10,11	0,84

Отметим, что время работы программы с четырьмя процессами отличается от времени выполнения параллельного алгоритма с OpenMP-директивами на четырёх ядрах не более чем на 4%. Поэтому при вычислениях в рамках одного многоядерного процессора (с учетом всех преимуществ в программной реализации) использование технологии OpenMP вполне обоснованно.

Исследование эффективности третьего метода вычислений, основанного на гибридном OpenMP+MPI алгоритме, показало, что при загрузке всех 12 ядер кластера время вычислений превышает на 9%. Причиной этого является различное время вычислений передаваемого на узел кластера блока из четырёх диагоналей и обязательная синхронизация работы нитей по окончании расчета блока, вследствие чего закончившие вычисления ядра процессора простаивают в ожидании завершения работы самой “медленной” нити. Таким образом, гибридный OpenMP+MPI алгоритм в рамках используемой модели, не требующей интенсивной передачи больших объемов данных между ядрами кластера, представляется наименее эффективным.

Используемые методы параллельных вычислений существенно упростили исследования спектров электрон-атомного рассеяния в присутствии интенсивного лазерного поля в широкой области изменения параметров поля и энергий и могут использоваться для численного анализа других процессов при взаимодействии лазерных полей с атомными системами.

Оглавление

А.И.Жуков

Материалы девятой международной научно-методической конференции

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1110 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
30.11.201874.75 Кб21Документ Microsoft Word (10).doc
#
21.09.2019108.12 Кб4Документ Word 2007.docx
#
16.08.201919.25 Mб50Жаворонкин_реферат.doc
#
04.05.2019105.47 Кб45Задание к ПЗ 2.doc
#
24.08.201978.34 Кб22Задание к ПЗ 3.doc
#
12.11.20191.01 Mб4Задание № 1.docx
#
01.08.2019839.68 Кб34Законченные ответы +изменения + вопросы не из п....doc
#
16.08.2019395.26 Кб10ЗАОЧНАЯ ФОРМА Методичка кафедры ОГЕНД 2010-201.doc
#
24.04.2019274.94 Кб13зарубежка. 19 век.doc
#
05.08.201963.46 Кб10зарубежные криминол. систмы.docx
#
15.11.201944.16 Кб6Защита практики.docx