Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Исследование параллелизма при решении двухточечной краевой задачи на графических ускорителях NVIDIA (магистерская диссертация).docx
Скачиваний:
72
Добавлен:
28.06.2014
Размер:
1.59 Mб
Скачать

Список использованных источников

  1. Палташев Т., Перминов И. Гетерогенная архитектура для CPU,GPUиDSP. Москва, Открытые системы, №8, 2013. 7с.

  2. Shane Cook. CUDA Programming: A Developer's Guide to Parallel Computing with GPUs. USA, Elsevier, 2013. 591с.

  3. NVIDIA’s Next Generation CUDA Compute Architecture: Kepler GK110 Whitepaper, v1.0. NVIDIA, 2013. 24с.

  4. www.top500.org– СписокTOP500

  5. www.green500.org– Список Green500

  6. Jason Sanders, Edward Kandrot. CUDA by example: an introduction to general-purpose GPU programming. USA, Addison-Wesley Professional, 2010. 312с.

  7. S. Wienke, P. Springer, C. Terboven, D. an Mey. OpenACC — First Experiences with Real-World Applications. Euro-Par 2012. Springer-Verlag Berlin Heidelberg, 2012. 12с.

  8. www.openacc-standard.org/node/361– Спецификация стандартаOpenACC2.0a

  9. Ильин В.П., Кузнецов Ю.И. Трехдиагональные матрицы и их приложения. М.: Наука. Главная редакция физико-математической литературы, 1985. 208с.

  10. Баркалов К.А. Методы параллельных вычислений. Методическое пособие. Нижний Новгород, 2011. 124с.

  11. Боресков А.В., Харламов А.А. Основы работы с технологией CUDA. М.: ДМК-Пресс, 2010. 232с.

  12. Кузьминский М. GPUдляHPC­– время пришло. Москва, Открытые системы, №6, 2011. 8с.

  13. docs.nvidia.com/cuda/– Документация к инструментам разработкиCUDA

Приложение 1. История развития графических ускорителей и их устройство

1.1. Устройство графического адаптера

Рассмотрим устройство графического адаптера. Ниже приведены его составные части:

  • Графический процессор (Graphicsprocessingunit,GPU) – основная часть графического адаптера. СовременныеGPUочень эффективны при обработке компьютерной графики, и их параллельная структура делает их более эффективными, чем центральный процессор для алгоритмов, где обработка больших блоков данных осуществляется параллельно.GPUиспользуется не только в персональных компьютерах, но и в рабочих станциях, игровых консолях, встраиваемых системах и мобильных устройствах.

  • Видеоконтроллер – специализированная микросхема, отвечающая за формирование изображения в видеопамяти, даёт команды RAMDACи осуществляет обработку запросов центрального процессора.

  • Система охлаждения – предназначена для сохранения температурного режима графического процессора и видеопамяти в допустимых пределах. Графические адаптеры, выпущенные в 80-х и ранних 90-х годах не нуждались в системе охлаждения.

  • ПЗУ (VideoROM). В ПЗУ графического адаптера записаны егоBIOSи другая информация.BIOSобеспечивает инициализацию и работу графического адаптера до загрузки ОС;BIOSсодержит такие низкоуровневые параметры, как рабочие частоты и напряжения графического процессора и видеопамяти.

  • ОЗУ (Видеопамять) – играет роль буфера, в котором хранится информация, генерируемая и постоянно изменяемая графическим процессором. Если графических адаптер выполняет свою привычную роль – обработку графики, то в качестве информации выступает изображение, выводимое на экран монитора. Так же в видеопамяти хранятся промежуточные невидимые на экране части изображения и другие данные. Начиная с 2003 года, видеопамять, обычно, основана на технологии DDR(DoubleDataRate) и её модификацииGDDR(GraphicsDDR), например,DDR2,GDDR3 иGDDR5.

  • RAMDAC–RandomAccessMemoryDigital-to-AnalogConverter(RAMDAC) – цифро-аналоговый преобразователь (ЦАП), служащий для преобразования изображения, формируемого видеоконтроллером, в уровни интенсивности цвета, подаваемые на аналоговый монитор.

  • Интерфейсы вывода

    • Разъёмы аналоговых сигналов

VideoGraphicsArray(VGA), так же известный, как D‑Sub; S‑Video

    • Разъёмы аналого-цифровых сигналов

Digital Visual Interface(DVI)

    • Разъёмы цифровых сигналов

High-Definition Multimedia Interface (HDMI); DisplayPort

  • Шина – система, передающая данные между графическим адаптером и хостом. Первой шиной, разработанной в 1974 году была S-100, затем в 1981 году компанияIBMразработала шинуISA. После этого появились шиныMCA(1987 год),EISA(1988 год). В 1992 году компанияIntelразработала шинуPCI, а в 1996 – шинуAPG. Обе эти шины в 2004 были вытеснены шинойPCIExpress.