- •Аннотация
- •Abstract
- •Глава 1. Проекционные методы решения слау 8
- •Глава 2. Перезапускаемый метод gmres 20
- •Глава 3. Разработка параллельной модификации метода gmres 28
- •Глава 4. Исследование параллельной модификации перезапускаемого gmres 47
- •Введение
- •Глава 1. Проекционные методы решения слау
- •1.1. Принцип построения проекционных методов
- •1.2. Методы подпространства Крылова
- •1.2.1. Метод полной ортогонализации
- •1.2.2. Метод сопряженных градиентов
- •1.2.3. Метод минимальных невязок
- •1.2.3. Метод обобщенных минимальных невязок
- •1.3. Сравнение проекционных методов
- •1.4. Постановка задачи магистерской диссертации
- •1.5. Выводы по главе 1
- •Глава 2. Перезапускаемый методGmres
- •2.1. Ортогонализация Арнольди
- •2.2. Метод вращений Гивенса
- •2.3. Декомпозиция алгоритмаGmres
- •2.4. Предобуславливание в методеGmres
- •2.5. Выводы по главе 2
- •Глава 3. Разработка параллельной модификации методаGmres
- •3.1. Основные классы параллельных вычислительных систем
- •3.2. Классификация моделей параллельного программирования
- •3.3. Формат хранения разреженных матриц
- •3.4. Разделение данных
- •3.5. Исследование обменных взаимодействий в модели передачи сообщений
- •3.6. Особенности параллельной модификации методаGmres
- •3.6.1. Распределение данных по исполнителям
- •3.6.2. Выполнение параллельных операций
- •3.6.3. Объединение результатов расчетов
- •3.7. Теоретическая оценка трудоемкости
- •3.8. Выводы по главе 3
- •Глава 4. Исследование параллельной модификации перезапускаемогоGmres
- •4.1. Задача аэродинамического обтекания профиля
- •4.2. Исследование эффективности параллельной модификации перезапускаемогоGmres
- •4.3. Выводы по главе 4
- •Заключение
- •Список литературы
- •Приложение
1.4. Постановка задачи магистерской диссертации
Целью настоящей работы является разработка и исследование параллельной модификации метода обобщенных минимальных невязок для решения СЛАУ, возникающих в задачах авиационной акустики, на высокопроизводительных вычислительных системах с распределенной памятью. В ходе работы исследовать пути повышения эффективности выбранного метода средствами применения параллельных вычислений и учета внутренней специфики задач. Построить теоретическую оценку зависимости ускорения параллельного решения от вычислительных ресурсов и сравнить с экспериментально полученными показателями. Проанализировать зависимости временных характеристик решений от вычислительных ресурсов.
1.5. Выводы по главе 1
В настоящей главе представлены основные принципы построения проекционных методов решения СЛАУ, приведен их краткий обзор и сравнение. Выявлен наиболее подходящий метод применительно к задачам авиационной акустики – перезапускаемый метод обобщенных минимальных невязок. Этот метод подробно рассмотрен в следующих главах.
Глава 2. Перезапускаемый методGmres
Перезапускаемый GMRES– это проекционный метод, строящий решение в подпространстве Крылова, где, причем. Для построения ортонормированного базисаKиспользуется ортогонализация Арнольди. Вместо проектирования (1.7) рассматривается эквивалентная [5] задача минимизации функционала (1.16).
В используемых в главе 1 обозначениях справедливо равенство
. (2.1)
Поскольку матрица составлена из ортонормированных векторов-столбцов, справедливо равенство
(2.2)
Таким образом, для нахождения коэффициентов линейного комбинирования векторов вGMRESнеобходимо решить СЛАУ
, (2.3)
которая является переопределенной в силу того, что матрица имеет размерность. Стандартный способ решения системы (2.3) – метод наименьших квадратов. Однако в силу особенностей структуры матрицысистему (2.3) можно решить, используя меньшие вычислительные затраты, с помощью вращений Гивенса.
Алгоритм перезапускаемого метода обобщенных минимальных невязок представлен ниже
Выбрать и начальное приближение
Начало
Построение ортогонального базиса с помощью ортогонализации Арнольди
Для построенной в ходе ортогонализации матрицы Hвыполнитьmвращений Гивенса
Решить треугольную СЛАУ
Продолжать, пока
2.1. Ортогонализация Арнольди
Для построения базиса в подпространстве Крылова в методе GMRESприменяется ортогонализация Арнольди.
Сначала выбирается множество векторов
.
Тогда по определению подпространства Крылова . Переход от базисак базисуосуществляется при помощи процедуры ортогонализации
. (2.4)
Полученные векторы нормируются. Предположим, что предыдущие kвекторов построены, т.е.
(2.5)
Тогда формула (2.4) может быть записана в виде
(2.6)
Для выполнения условия ортогональности вектора ко всем предыдущим векторам, умножим равенство (2.6) скалярно наи приравняем результат к нулю:
(2.7)
Из (2.5) и (2.7) можно получить выражения для коэффициентов :
Метод ортогонализации Арнольди может быть оформлен в виде алгоритма, представленного ниже
Входные данные: A,m,
Выполнять для
Выполнять для
Увеличить i
Если , то базис построен. Конец.
Увеличить j
Для коэффициентов ортогонализации в алгоритме использовалась двойная индексация, чтобы их можно было объединить в виде матрицы Н, дополнив в ней недостающие позиции нулями. При этом для размерности подпространства, равнойm, генерируетсяm+1векторов. Последний векторв матричном представлении означает расширение базисаVодним дополнительным столбцом, т.е.
Соответствующий вектору коэффициентозначает расширение матрицыHодной дополнительной строкой. Обозначим расширенную матрицу. Тогда из приведенного алгоритма Арнольди следует, что является матрицей в верхней форме Хессенберга [6] и для нее справедливы соотношения
(2.8)
(2.9)