2.Scatter b координати 3. Broadcast підматриць a

4. Broadcast 5. Обчислення підматриць b добутків (підматриць в c)

6. Збір результатів в c

Рис. 7.4 Стадії обчислення добутку матриць у 2D паралельному алгоритмі.

Алгоритм 3 - Перемноження матриці на просторовій сітці комп’ютерів

Для великих матриць, час обчислення добутків може бути зменшений шляхом застосуванням алгоритму, що здійснює обчислення на 3-мірній (просторовій) сітці комп'ютерів.

У приведеному нижче алгоритмі відображаються основні дані обсягом n₁ х n₂+ n₂х n₃+ n₁х n₃на об'ємну сітку комп'ютерів розміром p₁ х p₂ х p₃. Матриці розрізані, як показано на рис. 7.5: Матриця А розрізана на p₁ х p₂ субматриці, матриця B розрізана на p₂ х p₃ субматриці, і матриця C розрізана на p₁ х p₃ субматриці. Комп'ютер (i,j,k) обчислює добуток субматриці (i,j) матриці А і субматриці (j,k) матриці B. Субматриця (i,k) матриці C виходить підсумовуванням проміжних результатів, обчислених у комп'ютерах (i,j,k), j = 0,...,p2-1.

Послідовність стадій обчислення наведена на рис. 7.6.

1. Субматриці А розподіляються в (x,y,0) площині.

2. Субматриці B розподіляються в (0,y,z) площині.

3. Субматриці А поширюються у вимірі z.

4. Субматриці B поширюються у вимірі х.

5. Кожен процес обчислює одну субматрицю.

6. Проміжні результати редукується у вимірі y.

7. Матриця C збирається з (x,0,z) площини.

Алгоритм подібний до попереднього, але додатково розрізаються ще смуги матриць, і ці розрізані смуги розподіляються в третьому вимірі y. У даному випадку в кожному комп'ютері будуть перемножуватися тільки частини векторів рядків матриці А і частини стовпців матриці B. В результаті буде тільки часткова сума для кожного елемента результуючої матриці C. Операція підсумовування уздовж координати y цих отриманих часткових сум для результуючих елементів і завершує обчислення матриці C.

Загальний час обчислень у цьому алгоритмі дорівнює:

T = (U+S)/(p₁*p₂*p₃)

А відношення часу "обчислень без обмінів" до загального часу обчислень є величина:

K = (U+S)/(U+S)=1.

A B C

Рис. 7.5 Розрізування даних для паралельного алгоритму добутку двох матриць при обчисленні на просторовій сітці комп'ютерів.

2. Scatter b 3. Broadcast підматриць з а

4. Broadcast підматриць з у 5. Обчислення добутків підматриць у с)

6. Reduce (підсумовування)добутків 7. Gather c (збір результатів)

Рис. 7.6. Стадії обчислень у 3D паралельному алгоритмі добутку матриць.

Вправи і завдання до теми №7

Розробіть паралельний алгоритм обчислення величини , де А і В – одновимірні масиви.
Дані матриці А і В. Розробіть алгоритм обчислення матриці С = А*В – В*С.
Дана матриця А і вектори а і b. Розробіть алгоритм обчислення матриці С = а - А* b.
Чи можлива різна кількість смуг, на які діляться матриці А і В при обчисленні добутку двох матриць на кільцевій структурі?
Наведіть переваги і недоліки організації перемноження двох матриць на структурах, які описані в даній темі?
Наведіть переваги і недоліки організації початкового завантаження при перемноженні двох матриць на структурах, які описані в даній темі?

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 2122 / 3922 23 24 25 26 27 28 29 30 31 32 33 34 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.202545.25 Кб0prirodoznavstvo_lab1.docx
#
01.04.2025238.81 Кб0privatnomu_aktsionernomu_tovaristvi_telekanal.docx
#
01.04.2025436.22 Кб0privatnomu_pidpriyemstvi_z_virobnitstva_mebliv.doc
#
01.03.20255.43 Mб0Priznachennya_ta_oblast_zastosuvannya.doc
#
01.04.2025167.94 Кб0pro gadamera.doc
#
09.11.20184.38 Mб82PRO-lectons.doc
#
01.05.2025574.46 Кб0Prognoz Dupon.doc
#
16.11.2018303.62 Кб4prognozuvannya.doc
#
14.11.201979.87 Кб1Programa-praktyky2008.doc
#
27.08.201978.34 Кб1PROGRAMA_0306.doc
#
27.09.201961.44 Кб1PROGRAMA_0803.doc