Расширения языка с. Спецификаторы функций, спецификаторы переменных, добавленные типы.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ивановский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Otvety_ekzamen_Chernysheva.docx

Скачиваний:

Добавлен:

01.05.2025

Размер:

648.58 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 1817 18 > Следующая >>>

Расширения языка с. Спецификаторы функций, спецификаторы переменных, добавленные типы.

Расширения

Перед функциями в .cu файле могут стоять следующие «модификаторы»:

__device__ — это означает, что функция выполняется только на видеокарте. Из программы выполняющейся на обычном процессоре(host) её вызвать нельзя.
__global__ — Эта функция — начало вашего вычислительного ядра. Выполняется на видеокарте, но запускается только с хоста.
__host__ — Выполняется и запускается только с хоста (т.е. обычная функция C++). Если вы перед функцией укажите например __host__ и __device__ — то будут скомпилированы 2 версии функции (не все комбинации допустимы).

Спецификаторы размещения переменных в памяти GPU:

__device__ - переменная помещается в глобальной памяти устройства, например: __device__ float a;

__constant__ - переменная располагается в константной памяти. Записывать значение можно только с CPU, с помощью функции cudaMemcpyToSymbol();
__shared__ - переменная помещается в разделяемую память. Нельзя при объявлении переменной инициализировать её.

Добавленные типы:

1,2,3,4-мерные векторы, построенные из базовых типов. Например: char1, char2, char3, char4, int#, uint#, float#

Для задания размерности используется тип dim3, построенный на основе uint3 с конструктором, инициализирующим незаданные поля единицами.

Добавленные переменные:

dim3 gridDim – размер грида

dim3 blockDim – размер блока
uint3 blockIdx – индекс текущего блока в гриде
uint3 threadIdx – индекс текущего потока в блоке
int warpSize – размер варпа.

Для получения технической информации об имеющихся в компьютере адаптерах предлагается использовать Си-функцию CUDA API cudaGetDeviceProperties:

maxGridSize – размерность сетки блоков. К примеру, на GeForce 9600M GS размерность сетки блоков: 65535*65535*1, то есть сетка блоков двумерная (полученные данные удовлетворяют Compute Capability v.1.1).
maxThreadsDim – размерность массива нитей в блоке.

Типичный, но не обязательный шаблон решения задач:

задача разбивается на подзадачи;
входные данные делятся на блоки, которые вмещаются в разделяемую память;
каждый блок обрабатывается блоком потоков;
подблок подгружается в разделяемую память из глобальной;
над данными в разделяемой памяти проводятся соответствующие вычисления;
результаты копируются из разделяемой памяти обратно в глобальную.

Функции cuda: функция вызова ядра, функции работы с памятью.

Каждая функция CUDA, кроме вызова ядра, возвращает переменную типа cudaError_t. В случае удачного завершения равна cudasuccess, иначе коду ошибки.

Функция вызова ядра:

__global__ void Kernel<<<dim3 grdim, dim3 bldim, size_t Ns, cudaStream_t S>>>(arg);

dim3 grdim - размер грида в блоках
dim3 bldim - размер блока в потоках
size_t Ns - размер дополнительно выделяемой shared памяти к уже имеющейся
cudaStream_t S - номер потока, в котором будет происходить вызов функции, по умолчанию номер потока равен 0.

Два последних параметра являются необязательными, их можно не указывать.

arg - аргументы функции, выполняемой на устройстве.

Функция Kernel вызывается на хосте.

Функция работы с памятью

Для выделения и освобождения памяти на GPU используются функции:

cudaMalloc() cudaFree()

Функция выделения памяти:

cudaError_t cudaMalloc((void**)&devPtr,int size);

где

(void**)&devPtr - адрес переменной или массива, для которой выделяется память на устройстве
int size - размер выделяемой памяти в байтах

Функция освобождения памяти на устройстве:

cudaError_t cudaFree(devPtr);

В параметрах указывается адрес переменной, для которой была выделена память на устройстве.

Функция синхронизации

cudaError_t __syncthreads();

При обращении к данной функции все нити будут ждать до тех пор, пока все нити блока необратятся к этой функции, после этого действие ее прекращается.

Функция копирования памяти

Функция malloc выделяет память на GPU, к которой CPU не имеет непосредственного отношения.

Функция cudaMemcpy позволяет копировать память с CPU на GPU и обратно и внутри GPU.

cudaError_t cudaMemcpy(void *dst, const void *src, size_t size, enum cudaMemcpyKind kind);

void *dst - адрес куда необходимо скопировать память
const void *src - адрес откуда необходимо скопировать память
size_t size - объем переписываемой памяти в байтах
enum cudaMemcpyKind kind - задает способ записи памяти, может принимать следующие значения:
- cudaMemcpyHostToHost
- cudaMemcpyHostToDevice
- cudaMemcpyDeviceToHost
- cudaMemcpyDeviceToDevice

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 1817 18 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
03.04.201510.81 Mб75otchet_2013.doc
#
09.11.201988.58 Кб22otchet_po_praktike.doc
#
01.07.202581.41 Кб0otchet_po_praktike_mityagina_a_n_bsn21.doc
#
01.05.2025681.19 Кб7Otredaktirovannye_voprosy_po_KS.docx
#
03.04.201528.12 Кб312otvety.docx
#
01.05.2025648.58 Кб7Otvety_ekzamen_Chernysheva.docx
#
03.04.2015138.48 Кб58otvety_k_ekzamenu_42-83.docx
#
03.04.20154.49 Mб391otvety_k_fiziologii.docx
#
16.09.2019139.78 Кб43Otvety_k_kontr2.doc
#
03.04.2015642.56 Кб65otvety_na_bilety_9_kl_obshestvo.doc
#
01.07.2025749.72 Кб2Otvety_na_ekz_vop_po_konst_pravu_255.docx

Расширения языка с. Спецификаторы функций, спецификаторы переменных, добавленные типы.

Функции cuda: функция вызова ядра, функции работы с памятью.