Добавил:

Tushkan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МЭИ»

Предмет:

Файл:

Исследование параллелизма при решении двухточечной краевой задачи на графических ускорителях NVIDIA (магистерская диссертация).docx

Скачиваний:

Добавлен:

28.06.2014

Размер:

2 Мб

Скачать

☆

1 / 181 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ

УНИВЕРСИТЕТ

«МЭИ»

Институт Автоматики и вычислительной техники

Кафедра Прикладной математики

НаправлениеПрикладная математика и информатика

___________________________________

МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ

Программа: Математическое и программное обеспечение вычислительных машин и компьютерных сетей

Тема:Исследование параллелизма при решении двухточечной краевой задачи на графических ускорителях NVIDIA

___________________________________________________________________

Студент А-13-08 Логинов А. А.

группа подпись фамилия, и., о.,

Научный

руководитель доцент к.т.н. Шамаева О. Ю.

должность звание подпись фамилия, и., о.,

Консультант_____________________________________________________________

должность звание подпись фамилия, и., о.,

Консультант_____________________________________________________________

должность звание подпись фамилия, и., о.,

Магистерская диссертация допущена к защите

Зав.кафедрой_____________________________________________________________

звание подпись фамилия, и., о.,

Дата_________

МОСКВА 2014г.

Аннотация

Изучение архитектуры современных графических процессоров и средств для их программирования с целью эффективного решения сложных задач является актуальной темой для исследования на сегодняшний день. Целью данной работы было изучить возможности графических адаптеров и исследовать параллелизм при решении двухточечной краевой задачи методом параллельной блочной прогонки на графическом ускорителе NVIDIA. Разработанная параллельная программа позволяет принять решение об эффективности и целесообразности применения графического ускорителя для данной задачи. Программная реализация написана в двух вариантах с разными требованиями к ресурсам, что позволяет судить о возможностях подсистемы памяти ускорителя.

Research in the field of modern GPU architecture and programming tools aimed to develop effective solutions of complex task is a vital subject. The main goal of this work was to research the parallelism in solving the boundary value problem by the tridiagonal matrix algorithm using NVIDIA GPU. Developed program allows to make a decision about the usefulness of GPU for this task. There are two versions of software implementation, each with own approach to use accelerator resources that allows considering the possibilities of the accelerator memory subsystem.

Введение

Наиболее перспективным и динамичным направлением увеличения скорости решения прикладных задач является широкое внедрение идей параллелизма в работу вычислительных систем. К настоящему времени спроектированы и внедрены сотни различных вычислительных систем, использующих в своей архитектуре тот или иной вид параллельной обработки данных.

Важной тенденцией в развитии таких систем являются гибридные комплексы и гетерогенные системы, которые с каждым годом все больше вытесняют традиционные многопроцессорные системы из списка самых мощных вычислительных комплексов. Использование графических процессоров в качестве сопроцессоров, пожалуй, является основным трендом в этом направлении. По данным на ноябрь 2013 года, в списке самых мощных суперкомпьютеров 53 системы используют графические процессоры.

Современные графические процессоры – GPU(GraphicsProcessing Unit), в том числе и те, что лежат в основе видеокарт, значительно превосходят классические центральные процессоры (CPU) по производительности. На их основе строятся гибридные вычислительные системы, которые обладают уникальными эксплуатационными характеристиками. Это стало возможным благодаря технологииGPGPU(General-purposeGPU) – технике использования GPU, который обычно имеет дело с обработкой только компьютерной графики, для выполнения расчётов и вычислений общего назначения, которые обычно проводитCPU.

Графический процессор, в отличие от универсального, обладает меньшим набором исполняемых команд, но большей производительностью. Современный графический процессор состоит из тысяч более простых (по архитектуре) и энергоэффективных ядер, созданных для обработки несколько задач одновременно.

Основные производители видеочипов NVIDIA и AMD разработали соответствующие платформы под названием CUDA (Compute Unified Device Architecture) и CTM (Close To Metal или AMD Stream Computing). Обе платформы предоставляют программисту прямой доступ к аппаратным возможностям видеокарты, но требуют от него определенного уровня знаний особенностей технологии. Помимо данных платформ существуют библиотеки, предоставляющие более высокоуровневый доступ к параллельным вычислениям. Подобные библиотеки не требуют от разработчика затрат времени на глубокое изучение технологии.

Для программирования GPU возможно использование широкого круга технологий, в том числе наиболее распространённой технологии CUDA, открытого стандарта OpenCLи, стремительно набирающего популярность, стандартаOpenACC.

Применение GPUдля вычислений общего назначения используется во многих научных и прикладных областях для решения, как сложных исследовательских задач, так и повседневных. В их числе молекулярное моделирование, квантово-химические программы, задачи поиска нефтяных месторождений.

Благодаря соотношению производительности на ватт потребляемой энергии и широкому распространению на рынке, графические ускорители всё больше оказывают влияние на архитектуру высокопроизводительных вычислений, которая развивается в сторону гетерогенных вычислительных систем. Использование графических ускорителей наряду с классическими микропроцессорами [1] сегодня является распространенной практикой в сфере параллельных вычислений на гетерогенных платформах, сочетающих в себе вычислительные элементы различного типа.

Таким образом, исследования, направленные на изучение и эффективное применение GPU для решения различных классов сложных задач являются актуальными. Одной из таких задач является решение двухточечной краевой задачи для обыкновенного дифференциального уравнения второго порядка методом прогонки. Двухточечные граничные задачи встречаются во всех областях науки и техники. Например, при решении уравнения изменения объёма производства в замкнутой экономической системе, решении уравнения гармонического осциллятора, решении уравнения затухающих (ангармонических) колебаний.

В данной работе рассмотрены вопросы параллелизма, связанные с графическими ускорителями; проведено исследование архитектуры GPUи программных средств, используемых для написания приложений дляGPU, с целью эффективного решения краевой задачи методом блочной прогонки.

В разделе 1 вопрос использования графических ускорителей NVIDIAдля эффективного решения поставленной задачи рассматривается с двух сторон: изучение архитектурыGPUи исследование программной моделиCUDA.

В разделе 2 описаны цели данного исследования, даны постановка и математическое описание задачи, разработан параллельный алгоритм для решения поставленной задачи методом блочной прогонки.

В разделе 3 описаны структурное деление разработанной программы на модули, этапы выполнения параллельной программы, а также основные директивы, которые использовались при написании OpenACC‑реализации параллельного алгоритма; приведены результаты тестирования параллельной программы и их анализ.

1 / 181 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

Соседние файлы в предмете Государственный экзамен

#
28.06.20142 Мб73Исследование параллелизма при решении двухточечной краевой задачи на графических ускорителях NVIDIA (магистерская диссертация).docx
#
28.06.20142 Мб37Исследование средств автоматизации подготовки текстов к публикации в Интернете (магистерская диссертация).docx
#
28.06.201448 Кб5Календарный график.doc
#
28.06.2014121 Кб7Календарный график_2.doc
#
28.06.201461 Кб31Методические указания по оформлению магистерской диссертации.doc
#
28.06.20141 Мб115Организация и исследование параллельно-последовательных вычислений на кластере МЭИ при решении класса матричных задач большой разм.docx

Аннотация

Оглавление

Введение