Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Организация и исследование эффективных вычислений для решения задач аэроакустики на кластерных архитектурах (магистерская диссерта / Буренков С. Организация и исследование эффективных вычислений для решения задач аэроакустики на кластерных архитектурах.doc
Скачиваний:
86
Добавлен:
28.06.2014
Размер:
2.27 Mб
Скачать

1.4. Постановка задачи магистерской диссертации

Целью настоящей работы является разработка и исследование параллельной модификации метода обобщенных минимальных невязок для решения СЛАУ, возникающих в задачах авиационной акустики, на высокопроизводительных вычислительных системах с распределенной памятью. В ходе работы исследовать пути повышения эффективности выбранного метода средствами применения параллельных вычислений и учета внутренней специфики задач. Построить теоретическую оценку зависимости ускорения параллельного решения от вычислительных ресурсов и сравнить с экспериментально полученными показателями. Проанализировать зависимости временных характеристик решений от вычислительных ресурсов.

1.5. Выводы по главе 1

В настоящей главе представлены основные принципы построения проекционных методов решения СЛАУ, приведен их краткий обзор и сравнение. Выявлен наиболее подходящий метод применительно к задачам авиационной акустики – перезапускаемый метод обобщенных минимальных невязок. Этот метод подробно рассмотрен в следующих главах.

Глава 2. Перезапускаемый методGmres

Перезапускаемый GMRES– это проекционный метод, строящий решение в подпространстве Крылова, где, причем. Для построения ортонормированного базисаKиспользуется ортогонализация Арнольди. Вместо проектирования (1.7) рассматривается эквивалентная [5] задача минимизации функционала (1.16).

В используемых в главе 1 обозначениях справедливо равенство

. (2.1)

Поскольку матрица составлена из ортонормированных векторов-столбцов, справедливо равенство

(2.2)

Таким образом, для нахождения коэффициентов линейного комбинирования векторов вGMRESнеобходимо решить СЛАУ

, (2.3)

которая является переопределенной в силу того, что матрица имеет размерность. Стандартный способ решения системы (2.3) – метод наименьших квадратов. Однако в силу особенностей структуры матрицысистему (2.3) можно решить, используя меньшие вычислительные затраты, с помощью вращений Гивенса.

Алгоритм перезапускаемого метода обобщенных минимальных невязок представлен ниже

Выбрать и начальное приближение

Начало

Построение ортогонального базиса с помощью ортогонализации Арнольди

Для построенной в ходе ортогонализации матрицы Hвыполнитьmвращений Гивенса

Решить треугольную СЛАУ

Продолжать, пока

2.1. Ортогонализация Арнольди

Для построения базиса в подпространстве Крылова в методе GMRESприменяется ортогонализация Арнольди.

Сначала выбирается множество векторов

.

Тогда по определению подпространства Крылова . Переход от базисак базисуосуществляется при помощи процедуры ортогонализации

. (2.4)

Полученные векторы нормируются. Предположим, что предыдущие kвекторов построены, т.е.

(2.5)

Тогда формула (2.4) может быть записана в виде

(2.6)

Для выполнения условия ортогональности вектора ко всем предыдущим векторам, умножим равенство (2.6) скалярно наи приравняем результат к нулю:

(2.7)

Из (2.5) и (2.7) можно получить выражения для коэффициентов :

Метод ортогонализации Арнольди может быть оформлен в виде алгоритма, представленного ниже

Входные данные: A,m,

Выполнять для

Выполнять для

Увеличить i

Если , то базис построен. Конец.

Увеличить j

Для коэффициентов ортогонализации в алгоритме использовалась двойная индексация, чтобы их можно было объединить в виде матрицы Н, дополнив в ней недостающие позиции нулями. При этом для размерности подпространства, равнойm, генерируетсяm+1векторов. Последний векторв матричном представлении означает расширение базисаVодним дополнительным столбцом, т.е.

Соответствующий вектору коэффициентозначает расширение матрицыHодной дополнительной строкой. Обозначим расширенную матрицу. Тогда из приведенного алгоритма Арнольди следует, что является матрицей в верхней форме Хессенберга [6] и для нее справедливы соотношения

(2.8)

(2.9)