MMult

.pptx

Скачиваний:

Добавлен:

27.03.2015

Размер:

110.69 Кб

Скачать

☆

Нижегородский государственный университет им. Н.И. Лобачевского

Факультет Вычислительной математики и кибернетики

Реaлизация матричного произведения с использованием CUDA

Бастраков С.И. ВМК ННГУ sergey.bastrakov@gmail.com

Постановка задачи

Вычислить произведение матриц размера m x n и n x k.

Матрицы хранятся в одномерных массивах по строкам.

Необходимо создать 3 версии для GPU:

–mmult_gpu_1: считаем, что размеры матриц кратны BLOCK_SIZE, в теле ядра вычисляем один элемент, используем блоки размера BLOCK_SIZE x BLOCK_SIZE.

–mmult_gpu_2: размеры матриц не обязательно кратны BLOCK_SIZE, в теле ядра вычисляем один элемент, используем блоки размера BLOCK_SIZE x BLOCK_SIZE.

–mmult_gpu_3: размеры матриц не обязательно кратны BLOCK_SIZE, в теле ядра вычисляем несколько элементов, используем 2 x 2 блока потоков размера 16 x 8.

Н. Новгород, 2011 г.

Реaлизация и оптимизация матричного произведения с использованием CUDA

Соседние файлы в папке P03_MatrixMultiplication

#
27.03.2015243.55 Кб59MMult.pdf
#
27.03.2015110.69 Кб57MMult.pptx