
- •Аннотация
- •Abstract
- •Глава 1. Проекционные методы решения слау 8
- •Глава 2. Перезапускаемый метод gmres 20
- •Глава 3. Разработка параллельной модификации метода gmres 28
- •Глава 4. Исследование параллельной модификации перезапускаемого gmres 47
- •Введение
- •Глава 1. Проекционные методы решения слау
- •1.1. Принцип построения проекционных методов
- •1.2. Методы подпространства Крылова
- •1.2.1. Метод полной ортогонализации
- •1.2.2. Метод сопряженных градиентов
- •1.2.3. Метод минимальных невязок
- •1.2.3. Метод обобщенных минимальных невязок
- •1.3. Сравнение проекционных методов
- •1.4. Постановка задачи магистерской диссертации
- •1.5. Выводы по главе 1
- •Глава 2. Перезапускаемый методGmres
- •2.1. Ортогонализация Арнольди
- •2.2. Метод вращений Гивенса
- •2.3. Декомпозиция алгоритмаGmres
- •2.4. Предобуславливание в методеGmres
- •2.5. Выводы по главе 2
- •Глава 3. Разработка параллельной модификации методаGmres
- •3.1. Основные классы параллельных вычислительных систем
- •3.2. Классификация моделей параллельного программирования
- •3.3. Формат хранения разреженных матриц
- •3.4. Разделение данных
- •3.5. Исследование обменных взаимодействий в модели передачи сообщений
- •3.6. Особенности параллельной модификации методаGmres
- •3.6.1. Распределение данных по исполнителям
- •3.6.2. Выполнение параллельных операций
- •3.6.3. Объединение результатов расчетов
- •3.7. Теоретическая оценка трудоемкости
- •3.8. Выводы по главе 3
- •Глава 4. Исследование параллельной модификации перезапускаемогоGmres
- •4.1. Задача аэродинамического обтекания профиля
- •4.2. Исследование эффективности параллельной модификации перезапускаемогоGmres
- •4.3. Выводы по главе 4
- •Заключение
- •Список литературы
- •Приложение
1.4. Постановка задачи магистерской диссертации
Целью настоящей работы является разработка и исследование параллельной модификации метода обобщенных минимальных невязок для решения СЛАУ, возникающих в задачах авиационной акустики, на высокопроизводительных вычислительных системах с распределенной памятью. В ходе работы исследовать пути повышения эффективности выбранного метода средствами применения параллельных вычислений и учета внутренней специфики задач. Построить теоретическую оценку зависимости ускорения параллельного решения от вычислительных ресурсов и сравнить с экспериментально полученными показателями. Проанализировать зависимости временных характеристик решений от вычислительных ресурсов.
1.5. Выводы по главе 1
В настоящей главе представлены основные принципы построения проекционных методов решения СЛАУ, приведен их краткий обзор и сравнение. Выявлен наиболее подходящий метод применительно к задачам авиационной акустики – перезапускаемый метод обобщенных минимальных невязок. Этот метод подробно рассмотрен в следующих главах.
Глава 2. Перезапускаемый методGmres
Перезапускаемый
GMRES– это проекционный
метод, строящий решение в подпространстве
Крылова,
где
,
причем
.
Для построения ортонормированного
базисаKиспользуется
ортогонализация Арнольди. Вместо
проектирования (1.7) рассматривается
эквивалентная [5] задача минимизации
функционала (1.16).
В используемых в главе 1 обозначениях справедливо равенство
. (2.1)
Поскольку
матрица
составлена из ортонормированных
векторов-столбцов, справедливо равенство
(2.2)
Таким
образом, для нахождения коэффициентов
линейного комбинирования векторов
вGMRESнеобходимо решить
СЛАУ
, (2.3)
которая
является переопределенной в силу того,
что матрица
имеет размерность
.
Стандартный способ решения системы
(2.3) – метод наименьших квадратов. Однако
в силу особенностей структуры матрицы
систему (2.3) можно решить, используя
меньшие вычислительные затраты, с
помощью вращений Гивенса.
Алгоритм перезапускаемого метода обобщенных минимальных невязок представлен ниже
Выбрать
и начальное приближение
Начало
Построение ортогонального базиса с помощью ортогонализации Арнольди
Для построенной в ходе ортогонализации матрицы Hвыполнитьmвращений Гивенса
Решить
треугольную СЛАУ
Продолжать,
пока
2.1. Ортогонализация Арнольди
Для построения базиса в подпространстве Крылова в методе GMRESприменяется ортогонализация Арнольди.
Сначала выбирается множество векторов
.
Тогда
по определению подпространства Крылова
.
Переход от базиса
к базису
осуществляется при помощи процедуры
ортогонализации
. (2.4)
Полученные векторы нормируются. Предположим, что предыдущие kвекторов построены, т.е.
(2.5)
Тогда формула (2.4) может быть записана в виде
(2.6)
Для
выполнения условия ортогональности
вектора
ко всем предыдущим векторам, умножим
равенство (2.6) скалярно на
и приравняем результат к нулю:
(2.7)
Из
(2.5) и (2.7) можно получить выражения для
коэффициентов
:
Метод ортогонализации Арнольди может быть оформлен в виде алгоритма, представленного ниже
Входные
данные: A,m,
Выполнять
для
Выполнять
для
Увеличить i
Если
,
то базис построен. Конец.
Увеличить j
Для
коэффициентов ортогонализации в
алгоритме использовалась двойная
индексация, чтобы их можно было объединить
в виде матрицы Н, дополнив в ней
недостающие позиции нулями. При этом
для размерности подпространства, равнойm, генерируетсяm+1векторов. Последний векторв матричном представлении означает
расширение базисаVодним дополнительным столбцом, т.е.
Соответствующий
вектору
коэффициент
означает расширение матрицыHодной дополнительной строкой. Обозначим
расширенную матрицу
.
Тогда из приведенного алгоритма Арнольди
следует, что
является матрицей в верхней форме
Хессенберга [6] и для нее справедливы
соотношения
(2.8)
(2.9)