4.3.6.Проблема одинарной точности

Как отмечено выше, шейдеры модели 3.0 могут работать только с вещественными числами одинарной (32-битной) точности, содержащими 7-8 значащих цифр. В некоторых задачах, включая молекулярную динамику, это приводит к недопустимому накоплению погрешности округления. Эта проблема решается, если удаётся выделить критичные участки алгоритма, на которых необходимы высокая производительность и распараллеливание вычислений, при сравнительно больших допустимых погрешностях округления.

Наши исследования показали, что в молекулярной динамике на GPU c одинарной точностью можно рассчитывать силы, действующие на каждую из частиц, тогда как интегрирование уравнений движения (которое на порядки менее ресурсоёмко, но более критично к накоплению погрешности округления) проводить на CPU с двойной точностью. При этом оказывается, что результаты вычислений мало отличаются от результатов, получающихся при проведении всех расчётов с двойной точностью (64-битные числа, 15-16 значащих цифр).

4.4.Средства программирования графических процессоров

4.4.1.Общая структура программы для физического моделирования на графическом процессоре

Для того чтобы графический процессор мог исполнить программу, она должна быть откомпилирована в машинные коды и записана в оперативную память компьютера, откуда драйвер графического процессора передаёт её на исполнение. Для шейдеров модели 3.0 существуют языки программирования высокого уровня (Cg, HLSL, GLSL), на этих языках программы можно писать в форме текстовых файлов, которые затем компилируются в машинные коды автоматически. Примеры шейдеров, приведённые ниже, будут написаны на языке HLSL.

Вместе с тем, шейдерная модель 3.0 не позволяет создавать для графических процессоров полнофункциональные программы, которые включали бы в себя загрузку данных из оперативной памяти компьютера или с дисковых накопителей, а также обеспечивали бы пользовательский интерфейс. Эти задачи, а также те компоненты вычислительного алгоритма, где нет поточно-параллельных расчётов, должен исполнять центральный процессор ПК, для чего необходима программа на «обычном» языке высокого уровня (C#, C++, Visual Basic и др.).

Для того чтобы из программы, написанной на «обычном» языке высокого уровня, было проще прямо обращаться к драйверу видеокарты (а через него – к графическому процессору) существуют стандартные библиотеки специальных процедур, наиболее распространённые из которых - API DirectX и OpenGL. Процедуры из этих библиотек обеспечивают такие операции, как

 Выделение памяти для массива вершин треугольников, образующих 3D-сцену (при программировании графики) либо задающих границы циклов (при математическом моделировании);

 Загрузка файла с текстом программы для GPU (на языке HLSL или подобном), компиляция этого файла и запись кода программы в память ПК;

 Выбор той «техники» (откомпилированная программа для GPU может содержать несколько «техник» - процедур, вызываемых внешними программами), которую должен будет выполнить графический процессор;

 Копирование исходных данных для графического процессора в видеопамять;

 Запуск выбранной «техники» на исполнение;

 Выделение памяти ПК для рендер-цели, в которую драйвер видеокарты будет записывать результаты расчётов. Получение этих результатов из рендер-цели.

Структуру программы, использующей графический процессор для физических расчётов, обобщает схема, приведённая на рис. 4.10.

Рис. 4.10. Структура программы физического моделирования, использующей графический процессор

К процедурам DirectX и OpenGL можно обращаться напрямую, но всё же они имеют сравнительно «низкий» уровень – требуют специальных знаний и много рутинного программирования. Существуют дополнительные библиотеки, являющиеся надстройками над DirectX и OpenGL, которые упрощают программирование. В дальнейших примерах мы будем использовать такую библиотеку, а именно Microsoft XNA Game Studio Express 2.0 (XNA2).

<<< < Предыдущая 11 12 13 14 15 16 17 18 19 20 21 2223 / 4623 24 25 26 27 28 29 30 31 32 33 34 35 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.03.20162.46 Mб81Уитроу Дж. Естественная философия времени. М., 2003. С. 9-13, 40-47, 64-68, 156-166, 227-236..pdf
#
22.02.201578.34 Кб9Указания и задание Правоведение практ. занятия.doc
#
10.09.2019291.33 Кб1Указания к л.р. ОТИ.doc
#
22.02.201555.3 Кб7Уксусная кислота+хлороводородная.doc
#
24.08.201945.06 Кб0Ульяна.docx
#
16.08.20193.92 Mб12УМК 2 Лекционный курс.doc
#
22.02.2015125.95 Кб7умк антропология.doc
#
16.11.2019469.5 Кб4УМК Валеология.doc
#
22.12.201896.26 Кб1УМК деловой этикет.doc
#
22.11.201988.58 Кб0УМК по курсовой.doc
#
10.11.2019604.16 Кб1УМК по МТД Пономарева О.Я. 2010.doc

4.3.6.Проблема одинарной точности

4.4.Средства программирования графических процессоров

4.4.1.Общая структура программы для физического модели­рования на графическом процессоре

4.4.1.Общая структура программы для физического моделирования на графическом процессоре