
- •Аннотация
- •Abstract
- •Глава 1. Проекционные методы решения слау 8
- •Глава 2. Перезапускаемый метод gmres 20
- •Глава 3. Разработка параллельной модификации метода gmres 28
- •Глава 4. Исследование параллельной модификации перезапускаемого gmres 47
- •Введение
- •Глава 1. Проекционные методы решения слау
- •1.1. Принцип построения проекционных методов
- •1.2. Методы подпространства Крылова
- •1.2.1. Метод полной ортогонализации
- •1.2.2. Метод сопряженных градиентов
- •1.2.3. Метод минимальных невязок
- •1.2.3. Метод обобщенных минимальных невязок
- •1.3. Сравнение проекционных методов
- •1.4. Постановка задачи магистерской диссертации
- •1.5. Выводы по главе 1
- •Глава 2. Перезапускаемый методGmres
- •2.1. Ортогонализация Арнольди
- •2.2. Метод вращений Гивенса
- •2.3. Декомпозиция алгоритмаGmres
- •2.4. Предобуславливание в методеGmres
- •2.5. Выводы по главе 2
- •Глава 3. Разработка параллельной модификации методаGmres
- •3.1. Основные классы параллельных вычислительных систем
- •3.2. Классификация моделей параллельного программирования
- •3.3. Формат хранения разреженных матриц
- •3.4. Разделение данных
- •3.5. Исследование обменных взаимодействий в модели передачи сообщений
- •3.6. Особенности параллельной модификации методаGmres
- •3.6.1. Распределение данных по исполнителям
- •3.6.2. Выполнение параллельных операций
- •3.6.3. Объединение результатов расчетов
- •3.7. Теоретическая оценка трудоемкости
- •3.8. Выводы по главе 3
- •Глава 4. Исследование параллельной модификации перезапускаемогоGmres
- •4.1. Задача аэродинамического обтекания профиля
- •4.2. Исследование эффективности параллельной модификации перезапускаемогоGmres
- •4.3. Выводы по главе 4
- •Заключение
- •Список литературы
- •Приложение
3.7. Теоретическая оценка трудоемкости
В главе 2 был представлен ряд фрагментов алгоритма перезапускаемого метода GMRES, увеличение эффективности которых положительно скажется на эффективности алгоритма в целом. Указанные фрагменты отвечают выполнению отдельных алгебраических операций, для реализации которых в разработанной модификации применяются параллельные вычисления. Ниже приведена таблица, в которой представлена трудоемкость описанных фрагментов.
Таблица 3.1. Трудоемкость операций, выполняющихся в модификации GMRESпараллельно
Название алгебраической операции |
Трудоемкость |
Скалярное умножение двух векторов |
|
Взвешенная сумма векторов |
|
Умножение константы на вектор |
|
Умножение матрицы на вектор |
|
Нахождение невязки системы |
|
Вычисление нормы вектора |
|
В
выражениях трудоемкости использовались
следующие обозначения: n– размерность вектора или матрицы,p– количество используемых в ходе решения
процессоров,d– доля
ненулевых элементов в матрице
коэффициентов,– длительность аддитивной операции,
– длительность мультипликативной
операции. На основании выражений,
приведенных в таблице 3.1, была составлена
теоретическая оценка трудоемкости
(3.2) разработанной модификации
перезапускаемогоGMRES.
, (3.2)
где L– количество выполненных итераций.
С помощью оценки (3.2) и экспериментально полученных значений длительности выполнения аддитивной и мультипликативной операций получены оценки времени выполнения и ускорения разработанной параллельной модификации перезапускаемого метода обобщенных минимальных невязок.
3.8. Выводы по главе 3
В главе 3 приведены классификации современных параллельных вычислительных систем и моделей параллельного программирования. Осуществлен и обоснован выбор целевой модели вычислительной системы и модели программирования в рамках приведенных классификаций для создания модификации перезапускаемого метода GMRES. Применен эффективный формат хранения больших разреженных матриц. В главе описаны особенности разработанной параллельной модификации перезапускаемого методаGMRES, а также приведена теоретическая оценка ее трудоемкости.
Разработанная параллельная модификация перезапускаемого метода обобщенных минимальных невязок реализована средствами языка С++ с использованием интерфейса передачи сообщений MPI.
Глава 4. Исследование параллельной модификации перезапускаемогоGmres
Разработанная параллельная модификация перезапускаемого метода обобщенных минимальных невязок была применена при решении одной из задач прикладной авиационной акустики – задачи аэродинамического обтекания профиля. Подробнее эта задача рассмотрена в разделе 4.1.
4.1. Задача аэродинамического обтекания профиля
Моделирование обтекания аэродинамического профиля – важная задача, возникающая в процессе проектирования деталей и узлов авиационных двигателей. Ее решение может заключаться в определении основных газодинамических характеристик, в том числе акустических, обдувающего профиль потока: давления, числа Маха, скорости и пр. [18]
На практике решение задачи аэродинамического обтекания для определения аэродинамических характеристик обеспечивают с помощью высокопроизводительных вычислительных систем, так как указанная задача относится к классу вычислительно трудоемких – геометрия обтекаемых профилей и поверхностей, как правило, сложная, аппроксимируется плотной нерегулярной сеткой. Кроме того, сложность аэроаккустических исследований усугубляется сильным перепадом рассматриваемых масштабов, а также не до конца изученными механизмами генерации звука.
В качестве примера программного комплекса, позволяющего решить задачу аэродинамического обтекания профиля, можно привести разработанный в Центральном институте авиационного моторостроения им. П.И.Баранова программный комплекс Cobra[19]. При решении задачи аэродинамического обтекания с помощьюCobraможно выделить следующие этапы:
- разбиение расчетной области на совокупность четырехгранных (для двумерного случая) или шестигранных (для пространственного случая) ячеек;
- задание в каждой ячейке начальных значений параметров течения (давления, плотности, компонент скорости и параметров, описывающих турбулентность);
- задание граничных условий (правил и дополнительных параметров, позволяющих определять потоки массы, импульса, энергии и турбулентности на гранях ячеек, примыкающих к границам расчетной области);
- определение в соответствии с используемыми уравнениями, описывающими течение газа и связанных с ним изменения параметров турбулентности, а также с помощью процедур, определяющих способ вычисления параметров течения на гранях ячеек, суммарных потоков (дисбалансов) массы, импульса, энергии и параметров турбулентности в каждой ячейке;
- построение линеаризованной относительно текущего состояния системы уравнений, связывающей приращения параметров течения в ячейке с этим вычисленным дисбалансом потоков;
- итерационное решение полученной системы линейных уравнений поточечным методом Гаусса-Зейделя для получения приращений параметров течения в каждой ячейке;
- получение с использованием найденных приращений значений параметров на новом временном слое;
- оценка в соответствующих нормах величин дисбаланса потоков, приращений параметров течения в ячейках, самих параметров и связанных с ними интегральных характеристик решаемой задачи (расходов, сил, моментов и др.);
- повторение предшествующих 5-ти этапов, если на основе указанных оценок норм сходимость течения будет признана недостаточной [20].
В качестве объекта был выбран двумерный профиль RAE2822, изображенный на рис. 4.1.
Рис. 4.1. Двумерный профиль RAE2822
Рис. 4.2. Расчетная область для профиля RAE2822
Рис.
4.3. Расчетная сетка для профиля RAE2822
При моделировании процессов обтекания, как правило, производится разбиение расчетной области, изображенной на рис. 4.2 и задание граничных условий и начальных значений параметров течения – давления, плотности, компонент скорости и прочих параметров, описывающих турбулентность. Сам профиль расположен на пересечении линий в центре расчетной области. От разбиения расчетной области зависят точность вычисляемых параметров и объем необходимых вычислений для их определения. Поэтому в областях, где параметры потока не изменяются либо изменяются слабо, размер ячеек выбирается достаточно крупным. В тех же областях, где параметры потока изменяются существенно, размер ячеек уменьшается. Для рассматриваемого профиля разбиение производилось на совокупность четырехгранных ячеек, как показано на рис. 4.3.
После дискретизации расчетной области и задания начальных значений производится определение суммарных потоков массы, импульса, энергии и параметров турбулентности в каждой ячейке в соответствии с используемыми уравнениями, описывающими течение газа. Ключевой среди них является система уравнений Навье-Стокса:
,
где
– плотность газа,W–
вектор скорости газового потока,R– вектор напряжения объемной силы,p– давление,
– коэффициент динамической вязкости
[20].
Дальнейшее решение задачи сводится к построению и решению системы линейных алгебраических уравнений (СЛАУ) с разреженной матрицей коэффициентов. Каждая внутренняя ячейка расчетной сетки порождает 6 уравнений. Поэтому размерность системы, возникающей при решении задач обтекания аэродинамического профиля, как правило, велика, а ее матрица коэффициентов не регулярна и не обладает специальными свойствами, такими как симметричность или диагональное преобладание. Решение полученной системы производилось с помощью разработанной в рамках данной работы параллельной модификации перезапускаемого метода GMRES.
В качестве решения задачи аэродинамического обтекания профиля получают распределение основных аэродинамических характеристик в расчетной области. Графически решение представляется с помощью линий уровня указанных величин. В качестве примера на рис. 4.4 представлено распределение давление в обдувающем профиль потоке, а на рис. 4.5 – распределение скорости.
Рис. 4.5. Распределение давления в потоке при обтекании профиля RAE2822
Рис. 4.6. Распределение скорости в потоке при обтекании профиля RAE2822