9.2.2.Конвейерная обработка данных на gpu sm4

Как описано выше, физически графический процессор G80 состоит из 16 мультипроцессоров, в каждом из которых по 8 «вычислителей». Вместе с тем, эти «вычислители» имеют конвейерную архитектуру, то есть – могут одновременно исполнять несколько конкретных вычислительных процессов, находящихся на разных стадиях алгоритма (например, когда один процесс записывает данные в глобальную видеопамять, другой может вести вычисления). Эти вычислительные процессы принято называть потоками (англ. tread – обработка). Каждый мультипроцессор может одновременно исполнять до 768 параллельных потоков.

В программах должны быть логически разделены потоки, исполняемые на различных мультипроцессорах, поскольку только потоки, исполняемые на одном и том же мультипроцессоре, имеют общий доступ к разделяемой памяти. Поэтому, потоки объединяются в «связки» потоков (англ. blocks). Каждая «связка» исполняется на одном мультипроцессоре. В «связке» может быть до 512 потоков. На одном мультипроцессоре могут исполняться две «связки», при условии, что для этого достаточно его ресурсов (общее количество потоков – не более 768, требуемый объём разделяемой памяти не больше имеющегося).

9.2.3.Логическая структура вычислений на gpu sm4

Шейдерная модель 4.0 даёт программисту возможность управлять распределением обрабатываемых данных и задач по «связкам» и по конкретным потокам. Для этого существуют системные переменные, которые внутри каждого конкретного потока возвращают индексы именно этого потока, а также индексы той «связки», к которой он принадлежит. Методы использования этих индексов показаны в нижеследующих примерах.

Программист имеет и возможность задавать способ индексации связок и потоков. В общем случае индексы являются трёхмерными, что может быть удобно при обработке трёхмерных сеток. Допустимы также одно- и двухмерные индексы (см. примеры).

В системе программирования CUDA (см. ниже) переменные, возвращающие индексы «связок» и потоков, имеют следующие имена.

 dim3 – тип переменной, означающий 3-компонентный вектор;

 dim3 gridDim – размерности 3-мерной сетки «связок», задаваемые для исполнения алгоритма;

 dim3 blockDim - размерности 3-мерной сетки «вычислителей» внутри одной «связки», задаваемые для исполнения алгоритма;

 dim3 blockIdx – 3-мерные индексы (координаты) той «связки», к которой принадлежит исполняемый поток;

 dim3 threadIdx – 3-мерные индексы (координаты внутри «связки») исполняемого потока.

9.2.4.Преимущества gpu шейдерной модели 4.0

Архитектура GPU SM4 позволяет этим графическим процессорам исполнять все программы «чистого» поточно-параллельного моделирования, написанные для шейдерной модели 3.0, а кроме этого – предоставляет программисту дополнительные возможности, позволяющие использовать алгоритмы, которые раньше не были эффективны на GPU. Шейдерная модель 4.0 даёт следующие конкретные преимущества перед использованием стандартных графических библиотек DirectX и OpenGL:

 широко известный стандартный язык программирования Си с несколькими простыми расширениями;

 произвольная адресация при записи в память;

 программируемость кэша;

 значительно меньшие накладные расходы на взаимодействие CPU и GPU, некоторые операции выполняются асинхронно;

 побитные операции над целыми числами;

 двойная точность операций с плавающей запятой (аппаратная реализация, начиная с поколения чипов ATI Radeon 4xxx и NVIDIA GeForce GTX 2xx).

Приведённые возможности делают графические процессоры шейдерной модели 4.0 гораздо более универсальными вычислительными системами, чем предыдущие GPU.

<<< < Предыдущая 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 3940 / 4640 41 42 43 44 45 46 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025532.99 Кб0Уксап - программа диплом.doc
#
22.02.201555.3 Кб7Уксусная кислота+хлороводородная.doc
#
24.08.201945.06 Кб0Ульяна.docx
#
01.05.2025307.2 Кб0УМК Политология Корчемкин С.Е..doc
#
01.05.2025250.88 Кб1УМК Стресс-менеджмент Романова И.Е..doc
#
16.08.20193.92 Mб20УМК 2 Лекционный курс.doc
#
01.05.2025794.62 Кб0УМК Анализ хоз.деятельности Савина Н.В..doc
#
01.07.2025548.35 Кб0УМК Анатомия ЦНС.doc
#
22.02.2015125.95 Кб8умк антропология.doc
#
16.11.2019469.5 Кб5УМК Валеология.doc
#
01.05.2025239.1 Кб0УМК Введение в специальность Бусыгина И.С..doc