
- •Аннотация
- •Оглавление
- •Введение
- •1. Графические ускорители – как эффективный путь повышения производительности вычислительных архитектур
- •1.1. Этапы развития графических ускорителей и их устройство
- •1.1.1. Основная терминология и устройство графического адаптера
- •1.1.2. Архитектура современныхGpu
- •1.2. Подход к использованию графических ускорителей для вычислений общего назначения
- •1.2.1.GpgpUподход
- •1.2.2. Гибридные вычислительные системы
- •1.2.3. Программная модельCuda
- •1.3.OpenAcc. Новейший стандарт разработкиGpgpu-приложений
- •1.3.1. Возможности стандарта
- •1.3.2. Модель выполнения
- •1.3.3. Модель памяти
- •1.4. Выводы по разделу 1
- •2. Постановка задачи магистерской диссертации
- •2.1. Цели и задачи исследования
- •2.2. Математическая постановка задачи решения трехдиагональной системы линейных уравнений методом блочной прогонки
- •2.3. Разработка параллельного алгоритма для решения трехдиагональной системы линейных уравнений
- •2.4. Выводы по разделу 2
- •3. Реализация и исследование разработанного алгоритма
- •3.1. Структура параллельной программы и особенности реализации
- •3.2. Результаты тестирования
- •3.3. Анализ результатов
- •3.4. Выводы по разделу 3
- •Заключение
- •Список использованных источников
- •Приложение 1. История развития графических ускорителей и их устройство
- •1.1. Устройство графического адаптера
- •1.2. Рынок графических адаптеров
- •1.3. АрхитектураGpugt200
- •1.4. Современное положение дел
- •Приложение 2. Основная часть программного кода разработанного приложения
Список использованных источников
Палташев Т., Перминов И. Гетерогенная архитектура для CPU,GPUиDSP. Москва, Открытые системы, №8, 2013. 7с.
Shane Cook. CUDA Programming: A Developer's Guide to Parallel Computing with GPUs. USA, Elsevier, 2013. 591с.
NVIDIA’s Next Generation CUDA Compute Architecture: Kepler GK110 Whitepaper, v1.0. NVIDIA, 2013. 24с.
www.top500.org– СписокTOP500
www.green500.org– Список Green500
Jason Sanders, Edward Kandrot. CUDA by example: an introduction to general-purpose GPU programming. USA, Addison-Wesley Professional, 2010. 312с.
S. Wienke, P. Springer, C. Terboven, D. an Mey. OpenACC — First Experiences with Real-World Applications. Euro-Par 2012. Springer-Verlag Berlin Heidelberg, 2012. 12с.
www.openacc-standard.org/node/361– Спецификация стандартаOpenACC2.0a
Ильин В.П., Кузнецов Ю.И. Трехдиагональные матрицы и их приложения. М.: Наука. Главная редакция физико-математической литературы, 1985. 208с.
Баркалов К.А. Методы параллельных вычислений. Методическое пособие. Нижний Новгород, 2011. 124с.
Боресков А.В., Харламов А.А. Основы работы с технологией CUDA. М.: ДМК-Пресс, 2010. 232с.
Кузьминский М. GPUдляHPC– время пришло. Москва, Открытые системы, №6, 2011. 8с.
docs.nvidia.com/cuda/– Документация к инструментам разработкиCUDA
Приложение 1. История развития графических ускорителей и их устройство
1.1. Устройство графического адаптера
Рассмотрим устройство графического адаптера. Ниже приведены его составные части:
Графический процессор (Graphicsprocessingunit,GPU) – основная часть графического адаптера. СовременныеGPUочень эффективны при обработке компьютерной графики, и их параллельная структура делает их более эффективными, чем центральный процессор для алгоритмов, где обработка больших блоков данных осуществляется параллельно.GPUиспользуется не только в персональных компьютерах, но и в рабочих станциях, игровых консолях, встраиваемых системах и мобильных устройствах.
Видеоконтроллер – специализированная микросхема, отвечающая за формирование изображения в видеопамяти, даёт команды RAMDACи осуществляет обработку запросов центрального процессора.
Система охлаждения – предназначена для сохранения температурного режима графического процессора и видеопамяти в допустимых пределах. Графические адаптеры, выпущенные в 80-х и ранних 90-х годах не нуждались в системе охлаждения.
ПЗУ (VideoROM). В ПЗУ графического адаптера записаны егоBIOSи другая информация.BIOSобеспечивает инициализацию и работу графического адаптера до загрузки ОС;BIOSсодержит такие низкоуровневые параметры, как рабочие частоты и напряжения графического процессора и видеопамяти.
ОЗУ (Видеопамять) – играет роль буфера, в котором хранится информация, генерируемая и постоянно изменяемая графическим процессором. Если графических адаптер выполняет свою привычную роль – обработку графики, то в качестве информации выступает изображение, выводимое на экран монитора. Так же в видеопамяти хранятся промежуточные невидимые на экране части изображения и другие данные. Начиная с 2003 года, видеопамять, обычно, основана на технологии DDR(DoubleDataRate) и её модификацииGDDR(GraphicsDDR), например,DDR2,GDDR3 иGDDR5.
RAMDAC–RandomAccessMemoryDigital-to-AnalogConverter(RAMDAC) – цифро-аналоговый преобразователь (ЦАП), служащий для преобразования изображения, формируемого видеоконтроллером, в уровни интенсивности цвета, подаваемые на аналоговый монитор.
Интерфейсы вывода
Разъёмы аналоговых сигналов
VideoGraphicsArray(VGA), так же известный, как D‑Sub; S‑Video
Разъёмы аналого-цифровых сигналов
Digital Visual Interface(DVI)
Разъёмы цифровых сигналов
High-Definition Multimedia Interface (HDMI); DisplayPort
Шина – система, передающая данные между графическим адаптером и хостом. Первой шиной, разработанной в 1974 году была S-100, затем в 1981 году компанияIBMразработала шинуISA. После этого появились шиныMCA(1987 год),EISA(1988 год). В 1992 году компанияIntelразработала шинуPCI, а в 1996 – шинуAPG. Обе эти шины в 2004 были вытеснены шинойPCIExpress.