Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Организация и исследование параллельно-последовательных вычислений на кластере МЭИ при решении класса матричных задач большой разм.docx
Скачиваний:
101
Добавлен:
28.06.2014
Размер:
1.26 Mб
Скачать

3.4. Исследование эффективности последовательно-параллельной реализации матричного умножения

Проанализируем зависимость временных характеристик параллельно-последовательного умножения матриц с помощью разработанной модификации от размерности блоков. Перемножим матрицы малой размерности

и средней размерности .

Вычислительный эксперимент проводился на персональном компьютере со следующими характеристиками: Intel Core2 T6600 (2.20 GHz), ОЗУ 4 ГБ. Результаты эксперимента умножения квадратных матриц размерности и представлены в таблице 3.1.

Таблица 3.1. Результаты вычислительного эксперимента умножения матриц

На рис. 3.3 представлены графики времени умножения матриц и в зависимости от размерности блоков, на которые проводилось их разбиение в процессе умножения.

Рис. 3.3. Зависимости времени решения параллельной реализации от размерности блоков при умножении матриц и

Полученные графики зависимостей показывают, что для малой размерности участвующих в умножении матриц не целесообразно применять аппарат параллельных вычислений в модели передачи сообщений, так как время решения подзадач, на которые разбивается матричное умножение, не так сильно превосходит время, необходимое для обменов между вычислительными узлами. Заметим, что при использовании массовых обменных взаимодействий эффект задержки наблюдается более остро. Отметим также, что время решения в точках, соответствующих размерностям блоков 20, 50 и 100 выделяются на фоне остальных. В них время решения меньше, чем в соседних с ними. Такое явление объяснимо: размерность матриц кратна этим размерностям блоков. В таких решениях не производилось дописывания нулевых элементов для приведения всех блоков к квадратному виду. Следовательно, не происходило искусственное увеличение размерностей.

Далее рассмотрим аналогичный график зависимости, изображенный на рис. 3.4, для случая умножения матриц и.

Рис. 3.4. Зависимости времени решения параллельной реализации от размерности блоков при умножении матриц и

По графику, изображенному на рис. 3.4, можно сделать вывод, что применение параллельных вычислений к умножению матриц указанных размерностей целесообразно. Снова в случае, когда размерность матриц кратна размерности блоков, решение получается быстрее. При этом чем больше размерность блока, тем быстрее решается задача. Это объясняется тем, что при малой размерности блока увеличивается число обменов между исполнителями. Обмены требуют временных затрат. Такое явление экспериментально подтверждает, что в модели передачи сообщений крупнозернистая декомпозиция является наиболее эффективной.

Что касается видов обменных взаимодействий, на приведенных матрицах различие не принципиально, хотя решения, полученные с помощью массовых обменов, потребовали меньших временных затрат. Малое различие во временах выполнения объясняется тем, что массовые обмены могут осуществляться лишь раз – при рассылке исполнителям второй матрицы-множителя. Существенно большее время требуется непосредственно для вычисления результата. Но главной причиной малого различия во времени выполнения между запусками с массовыми обменными взаимодействиями и без них является то, что все они проводились для одного или двух процессов. При увеличении количества потоков использование обменов типа «точка-точка» для рассылки каждому процессу второй матрицы будут требовать все большего времени, как это показано на рис. 3.5.

Рис. 3.5. Сравнение временных показателей решений на разном количестве процессов-исполнителей

Все описанные выше свойства временных характеристик могут быть представлены ярче при использовании для экспериментов высокопроизводительной вычислительной системы на большем числе исполнителей. На рис. 3.5 точки, соответствующие трем и четырем процессам, лишь показывают, что при назначении числа процессов большим, чем число устройств-исполнителей, происходит ухудшение временных характеристик.

Соседние файлы в предмете Государственный экзамен