4.3.5.Возможности gpu в рамках шейдерной модели 3.0 и взаимодействие gpu с памятью

Ведущими разработчиками и производителями графических процессоров в настоящее время являются компании NVIDIA и ATI (c 2007 года – подразделение компании AMD). Лучшие из графические процессоров этих компаний, поддерживавших шейдерную модель 3.0, по достижимой производительности физического моделирования уже были сравнимы с кластерами из нескольких десятков процессоров. В качестве примера характеристики некоторых из этих процессоров [16] приведены в табл. 4.2.

Таблица 4.2.

Характеристики графических процессоров, поддерживающих шейдеры модели 3.0

GPU	пиксельные конвейеры	вершинные конвейеры
ATI Radeon X1900 XT	48	8
NVIDIA GeForce 7800 GTX	24	8
ATI Radeon X1650 XT	24	8

Графические процессоры с шейдерной моделью 3.0 поддерживают использование при программирование операций, приведённых ниже.

 Ряд математических операций с вещественными числами (см. Приложение 1). Целочисленные типы не поддерживаются.

 Последовательное и произвольное чтение данных из видеопамяти. Произвольной записи в видеопамять нет.

 Возможны циклы, длиной до 255 итераций.

 Возможны ветвления алгоритма в результате проверки условий, с использованием операторов условного перехода.

Взаимодействие GPU с памятью отчасти проиллюстрировано на рис. 4.5. В шейдерной модели 3.0 доступ GPU к памяти характеризуется следующими возможностями:

 Графическому процессору не доступны дисковая память и оперативная память компьютера. Поэтому перед началом вычислений исходные данные должны быть скопированы в видеопамять центральным процессором.

 Графическому процессору доступна видеопамять – специализированная память, обычно расположенная на видеокарте. У GPU нет доступа к оперативной и дисковой памяти.

 Поскольку оперативная память компьютера графическому процессору недоступна, перед началом вычислений исходные данные должны быть скопированы в видеопамять центральным процессором. Он же затем копирует массив результатов из видеопамяти обратно в оперативную память.

 Графическому процессору доступно как потоковое, так и произвольное чтение данных из видеопамяти.

 Единственный вариант записи в видеопамять - это автоматическое формирование массива результатов (рендер-цели). Произвольная запись в видеопамять невозможна.

 Графический процессор может использовать регистры - ячейки памяти, расположенные прямо на процессоре и характеризующиеся очень малой латентностью (быстрым доступом к данным):

 есть чтение из констант-регистров, которые могут хранить постоянные величины, не изменяющиеся в ходе обработки всех данных;

 есть чтение и запись во временные регистры, данные в которых не сохраняются при переходе к следующим элементам потока данных.

 Вершинные процессоры могут записывать до 12-и 4-векторов из 32-битных чисел.

 Пиксельные процессоры могут записывать до 4-х 4-векторов из 32-битных чисел.

 Нет работы с динамически размещаемыми структурами данных.

 Суммарное кол-во инструкций в программе - не более 65536 (у графических процессоров NVIDIA).

Таким образом, возможностей шейдерной модели 3.0 достаточно для эффективной реализации «чистой» поточно-параллельной обработки данных, но вот возможности произвольной работы с памятью, а также применения ветвлений и циклов ограничены.

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 2122 / 4622 23 24 25 26 27 28 29 30 31 32 33 34 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.03.20162.46 Mб81Уитроу Дж. Естественная философия времени. М., 2003. С. 9-13, 40-47, 64-68, 156-166, 227-236..pdf
#
22.02.201578.34 Кб9Указания и задание Правоведение практ. занятия.doc
#
10.09.2019291.33 Кб1Указания к л.р. ОТИ.doc
#
22.02.201555.3 Кб7Уксусная кислота+хлороводородная.doc
#
24.08.201945.06 Кб0Ульяна.docx
#
16.08.20193.92 Mб12УМК 2 Лекционный курс.doc
#
22.02.2015125.95 Кб7умк антропология.doc
#
16.11.2019469.5 Кб4УМК Валеология.doc
#
22.12.201896.26 Кб1УМК деловой этикет.doc
#
22.11.201988.58 Кб0УМК по курсовой.doc
#
10.11.2019604.16 Кб1УМК по МТД Пономарева О.Я. 2010.doc