9.Базовые особенности программирования графических процессоров шейдерной модели 4.0

9.1.Предпосылки появления новой шейдерной модели

Как мы показали в предыдущих разделах курса, шейдерная модель 3.0 (SM3) полностью реализует «чистую» поточно-параллельную обработку массивов данных по принципу SIMD (рис. 4.2, рис. 4.7-4.8). Параллельные процессоры (графические конвейеры) применяют ко всем векторам из входных массивов один и тот же алгоритм обработки, причём не имеют доступа к результатам работы других конвейеров. Для наглядности, этот принцип снова проиллюстрирован на рис. 9.1.

Рис. 9.1. Поточно-параллельный расчёт без связи между процедурами обработки отдельных элементов входных массивов. Здесь каждой тройке соответственных 4-векторов из входных массивов (таких массивов не обязательно именно три) ставится в соответствие одна ячейка массива результатов (рендер-цели). При этом, связи между графическими конвейерами, обрабатывающими различные тройки входных векторов, быть не может

Алгоритмы, обеспечивающие отсутствие связи между расчётами на параллельных графических конвейерах имеют то преимущество, что нет необходимости синхронизировать работу конвейеров, что могло бы существенно замедлить вычисления, а также осложнить работу программиста при необходимости программировать синхронизацию вручную.

С другой стороны, существует много алгоритмов, в которых обмен данными между параллельными ветвями расчёта необходим изредка (так что синхронизация не отнимает много времени), но обойтись без него совсем всё же нельзя. При расчётах на GPU шейдерной модели 3.0 такие алгоритмы можно было осуществлять только с использованием центрального процессора, что требовало приостановки параллельных вычислений.

В 2007 году появились графические процессоры, реализующие новую (и последнюю на сегодняшний день) шейдерную модель 4.0 (SM4). В GPU этой модели параллельные процессоры (теперь их уже не называют графическими конвейерами) получили возможность обмена данными между собой во время расчёта. Благодаря этому и другим архитектурным изменениям, графические процессоры шейдерной модели 4.0 фактически стали универсальными многопроцессорными системами (рис. 9.2).

Наши реализации молекулярной динамики на GPU с применением шейдерной модели 3.0 и библиотеки DirectX показали, что большая часть времени расчетов уходит на издержки, связанные с вызовами DirectX. Также наблюдалась сильная зависимость времени расчета от формата представления данных (размеров текстур), поскольку при неоптимальных размерах кэш использовался неэффективно.

Использование шейдерной модели 4.0 позволило нам значительно ускорить вычисления, поскольку эта модель даёт возможность на несколько порядков уменьшить издержки при доступе к GPU и позволяет программно управлять кэшем (см. описание технологии NVIDIA CUDA ниже).

9.2.Архитектура gpu шейдерной модели 4.0. Преимущества этой модели

На рис. 9.2 показана архитектура G80 – графического процессора шейдерной модели 4.0, выпускаемого компанией NVIDIA [67].

Ниже мы обсудим преимущества графических процессоров шейдерной модели 4.0 и особенности работы с ними. Но сразу отметим, что эти GPU обладают обратной совместимостью с шейдерной моделью 3.0, то есть они исполняют программы, написанные для GPU предыдущего поколения. При том же количестве «вычислителей» скорость исполнения программ для SM3 может даже увеличиться, поскольку в новых GPU значительно ускорены произвольные обращения к памяти.

Рис. 9.2. Архитектура графического процессора шейдерной модели 4.0 G80

<<< < Предыдущая 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3738 / 4638 39 40 41 42 43 44 45 46 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.03.20162.46 Mб81Уитроу Дж. Естественная философия времени. М., 2003. С. 9-13, 40-47, 64-68, 156-166, 227-236..pdf
#
22.02.201578.34 Кб9Указания и задание Правоведение практ. занятия.doc
#
10.09.2019291.33 Кб1Указания к л.р. ОТИ.doc
#
22.02.201555.3 Кб7Уксусная кислота+хлороводородная.doc
#
24.08.201945.06 Кб0Ульяна.docx
#
16.08.20193.92 Mб12УМК 2 Лекционный курс.doc
#
22.02.2015125.95 Кб7умк антропология.doc
#
16.11.2019469.5 Кб4УМК Валеология.doc
#
22.12.201896.26 Кб1УМК деловой этикет.doc
#
22.11.201988.58 Кб0УМК по курсовой.doc
#
10.11.2019604.16 Кб1УМК по МТД Пономарева О.Я. 2010.doc