文档章节

如何封装CUDA类库,编译成dll以供其他工程调用

周卓
 周卓
发布于 2014/06/05 16:34
字数 741
阅读 809
收藏 7

环境:win7_64 VS2010 CUDA6.0 VAX Quadro410

安装配置CUDA环境,这里就不详细介绍了。

一、手动建立CUDA工程

  1. 打开VS2010,新建空白项目,起名为 test2。 

  2. 在解决方案管理器中,右键点击工程test2,生成自定义,选择CUDA6.0

  3. 添加头文件 t.h,注意这里t.cuh,也是可以的,但是为了外观上等同于纯C\C++类库,写成.h

  4. 添加源文件 t.cu ,右键点击t.cu,属性,常规,项类型,选择CUDA C/C++。

    这样一个手动建立的CUDA工程就配置好了。

二、建立CUDA类库,并生成dll

  1. 在t.h中,写上函数声明,包含两类函数,一是KERNEL函数,使用GPU的并行计算;二是调用KERNEL函数的普通C函数。这两类函数必须放到cu文件中,由CUDA编译器编译,内容如下:

#ifndef _TEST2_H
#define _TEST2_H//防御重复编译
#ifdef _DLLEXPORTING//dll到处符号宏定义
#define TEST2_DLLDECL __declspec(dllexport)
#else
#define TEST2_DLLDECL __declspec(dllimport)
#endif
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
//这两个头文件是CUDA必备,但是你右键->打开文档“”的时候VS却不能找到。不需要你手动设置路径,只需要在 右键工程->生成自定义 中,选择CUDA,VS即可自动找到包含路径
#include <stdio.h>
__global__ void addKernel(int *c, const int *a, const int *b);//这个是KERNEL函数,不能作为类库外部接口
cudaError_t TEST2_DLLDECL  addWithCuda(int *c, const int *a, const int *b, unsigned int size);//这个C函数,内部调用了KERNEL函数,只能放在cu文件中,使用CUDA编译器编译。使用__declspec(dllimport)调用声明,作为dll的接口供外部调用。

    2.在t.cu中写入两个函数的实现,如下:

#include "t.h"
__global__ void addKernel(int *c, const int *a, const int *b)
{
    int i = threadIdx.x;
    c[i] = a[i] + b[i];
}
cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size)
{
 //其他代码省略
        addKernel<<<1, size>>>(dev_c, dev_a, dev_b);
        //其他代码省略
 return cudaStatus;
}

    3.工程属性,CUDA C\C++中,选择Host ,Proprocessor Definition 中,添加_DLLEXPORTING

    4.在工程属性中,设置生成目标为DLL,这样会生成,dll,lib,pdb,等几种文件

三、普通C++工程调用CUDA类库dll

  1. 在相同解决方案中新建工程,在工程属性中,链接器,常规,附加库目录,添加上一步生成的lib所在的目录;在链接器,输入,附加依赖项,添加test2.lib;保证你生成的exe和dll在同一目录下。

  2. 工程,右键,生成自定义,选择CUDA

  3. 虽然CUDA编译器参与了生成过程,但是这个工程就是普通的C、C++工程, 自身使用VC编译器,你只需要添加#include“..\\test2\\test2.h”就行了

© 著作权归作者所有

共有 人打赏支持
周卓
粉丝 5
博文 7
码字总数 3519
作品 0
沈阳
使用Visual Studio,几步实现Python C++扩展,以及DLL调用

decodeFile(PyObject self, PyObject args){ } static PyMethodDef methods[] = { }; import DynamsoftBarcodeReader formats = { } def initLicense(license): def decodeFile(fileName): i......

yushulx
2015/05/26
0
0
windows下编译mxnet并使用C++接口开发

大多数情况下,mxnet都使用python接口进行机器学习程序的编写,方便快捷,但是有的时候,需要把机器学习训练和识别的程序部署到生产版的程序中去,比如游戏或者云服务,此时采用C++等高级语言...

u012234115
05/29
0
0
[CLI/C++].NET托管代码和非托管代码的相互调用

场景三:现有C++原代码,包装后供C#调用。 C++的原代码,实际上可以直接编译成托管代码。MFC也好ATL也好……这样看起来在.NET中最强大的编程语言就是C++了:它不仅可以编写托管 程序,甚至可...

Yong_Luo
2010/10/01
0
0
Tensorflow的StreamExecutor编程

首先了解一下结构化编译器前端Clang。 背景与概览 Low Level Virtual Machine (LLVM) 是一个开源的编译器架构,它已经被成功应用到多个应用领域。Clang ( 发音为 /klæŋ/) 是 LLVM 的一个编...

langb2014
2017/05/16
0
0
Windows下编译Caffe并编译Matlab接口

介绍: Caffe是一个深度学习的框架,在windows下编译Caffe。 实际上Linux下会更舒服,由于我的Linux下安装不了CUDA,只能用CPU跑,很慢,于是决定在windows环境下配置caffe及其matlab接口 系统...

jungieve
2017/02/18
0
0

没有更多内容

加载失败,请刷新页面

加载更多

活动招募 HUAWEI HiAI公开课·北京站-如何在4小时把你的APP变身AI应用

人工智能和机器学习是全球关注的新趋势,也是当前最火爆、最流行的话题。当你拿手机用语音助手帮你点外卖,智能推荐帮你把周边美食一网打尽;当你拿起P20拍照时,它将自动识别场景进行最美优...

华为终端开放实验室
15分钟前
0
0
匹配两位小数,js正则

var regex = /^\d*(\.[1-9]|\.\d[1-9])*$/ console.log(1.2,regex.test(1.2)); console.log(0.3,regex.test(0.3)); console.log(1.03,regex.test(1.03)); ......

微信小程序-暗潮
20分钟前
0
0
905. Sort Array By Parity - LeetCode

Question 905. Sort Array By Parity Solution 题目大意:数组排序,偶数放前,奇数在后,偶数的数之间不用管顺序,奇数的数之间也不用管顺序 思路:建两个list,一个放偶数,一个放奇数,最...

yysue
25分钟前
0
0
h5 禁止手机自带键盘弹出

html: <div style="width: 350px;margin:50px auto;"><input type="text" id="datePicker" class="date_picker form-control" placeholder="点击选择入住日期" /></div> js: $("#date......

Delete90
41分钟前
1
0
color透明度对照表

透明度百分比 数值 100% 不透明 FF 95% F2 90% E6 85% D9 80% CC 75% BF 70% B3 65% A6 60% 99 55% 8C 50% 80 45% 73 40% 66 35% 59 30% 4D 25% 40 20% 33 15% 26 10% 1A 5% 0D 0% 完全透明 ......

_无问西东
43分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部