文档章节

如何封装CUDA类库,编译成dll以供其他工程调用

周卓
 周卓
发布于 2014/06/05 16:34
字数 741
阅读 684
收藏 7
点赞 1
评论 0

环境:win7_64 VS2010 CUDA6.0 VAX Quadro410

安装配置CUDA环境,这里就不详细介绍了。

一、手动建立CUDA工程

  1. 打开VS2010,新建空白项目,起名为 test2。 

  2. 在解决方案管理器中,右键点击工程test2,生成自定义,选择CUDA6.0

  3. 添加头文件 t.h,注意这里t.cuh,也是可以的,但是为了外观上等同于纯C\C++类库,写成.h

  4. 添加源文件 t.cu ,右键点击t.cu,属性,常规,项类型,选择CUDA C/C++。

    这样一个手动建立的CUDA工程就配置好了。

二、建立CUDA类库,并生成dll

  1. 在t.h中,写上函数声明,包含两类函数,一是KERNEL函数,使用GPU的并行计算;二是调用KERNEL函数的普通C函数。这两类函数必须放到cu文件中,由CUDA编译器编译,内容如下:

#ifndef _TEST2_H
#define _TEST2_H//防御重复编译
#ifdef _DLLEXPORTING//dll到处符号宏定义
#define TEST2_DLLDECL __declspec(dllexport)
#else
#define TEST2_DLLDECL __declspec(dllimport)
#endif
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
//这两个头文件是CUDA必备,但是你右键->打开文档“”的时候VS却不能找到。不需要你手动设置路径,只需要在 右键工程->生成自定义 中,选择CUDA,VS即可自动找到包含路径
#include <stdio.h>
__global__ void addKernel(int *c, const int *a, const int *b);//这个是KERNEL函数,不能作为类库外部接口
cudaError_t TEST2_DLLDECL  addWithCuda(int *c, const int *a, const int *b, unsigned int size);//这个C函数,内部调用了KERNEL函数,只能放在cu文件中,使用CUDA编译器编译。使用__declspec(dllimport)调用声明,作为dll的接口供外部调用。

    2.在t.cu中写入两个函数的实现,如下:

#include "t.h"
__global__ void addKernel(int *c, const int *a, const int *b)
{
    int i = threadIdx.x;
    c[i] = a[i] + b[i];
}
cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size)
{
 //其他代码省略
        addKernel<<<1, size>>>(dev_c, dev_a, dev_b);
        //其他代码省略
 return cudaStatus;
}

    3.工程属性,CUDA C\C++中,选择Host ,Proprocessor Definition 中,添加_DLLEXPORTING

    4.在工程属性中,设置生成目标为DLL,这样会生成,dll,lib,pdb,等几种文件

三、普通C++工程调用CUDA类库dll

  1. 在相同解决方案中新建工程,在工程属性中,链接器,常规,附加库目录,添加上一步生成的lib所在的目录;在链接器,输入,附加依赖项,添加test2.lib;保证你生成的exe和dll在同一目录下。

  2. 工程,右键,生成自定义,选择CUDA

  3. 虽然CUDA编译器参与了生成过程,但是这个工程就是普通的C、C++工程, 自身使用VC编译器,你只需要添加#include“..\\test2\\test2.h”就行了

© 著作权归作者所有

共有 人打赏支持
周卓
粉丝 5
博文 7
码字总数 3519
作品 0
沈阳
[CLI/C++].NET托管代码和非托管代码的相互调用

场景三:现有C++原代码,包装后供C#调用。 C++的原代码,实际上可以直接编译成托管代码。MFC也好ATL也好……这样看起来在.NET中最强大的编程语言就是C++了:它不仅可以编写托管 程序,甚至可...

Yong_Luo ⋅ 2010/10/01 ⋅ 0

使用Visual Studio,几步实现Python C++扩展,以及DLL调用

decodeFile(PyObject self, PyObject args){ } static PyMethodDef methods[] = { }; import DynamsoftBarcodeReader formats = { } def initLicense(license): def decodeFile(fileName): i......

yushulx ⋅ 2015/05/26 ⋅ 0

windows下编译mxnet并使用C++接口开发

大多数情况下,mxnet都使用python接口进行机器学习程序的编写,方便快捷,但是有的时候,需要把机器学习训练和识别的程序部署到生产版的程序中去,比如游戏或者云服务,此时采用C++等高级语言...

u012234115 ⋅ 05/29 ⋅ 0

Tensorflow的StreamExecutor编程

首先了解一下结构化编译器前端Clang。 背景与概览 Low Level Virtual Machine (LLVM) 是一个开源的编译器架构,它已经被成功应用到多个应用领域。Clang ( 发音为 /klæŋ/) 是 LLVM 的一个编...

langb2014 ⋅ 2017/05/16 ⋅ 0

lib 和 dll 文件的区别和联系

什么是lib文件,lib和dll的关系如何? (1) lib是编译时需要的,dll是运行时需要的。 如果要完成源代码的编译,有lib就够了。 如果也使动态连接的程序运行起来,有dll就够了。 在开发和调试阶段...

laymanxia ⋅ 2014/05/09 ⋅ 0

[Unity3d]调用自己封装的dll,假装让自己也牛B一把吧

之前总感觉会封装dll组件的都是大牛级别的程序员做的事情,然后供给菜鸟级别的调用。感觉为了保护自己的源码不会被他人知道,然后就封装一个dll供人家调用,那样就觉得很牛,今天我也尝试摸索...

丁小未 ⋅ 2013/12/04 ⋅ 0

Windows下编译Caffe并编译Matlab接口

介绍: Caffe是一个深度学习的框架,在windows下编译Caffe。 实际上Linux下会更舒服,由于我的Linux下安装不了CUDA,只能用CPU跑,很慢,于是决定在windows环境下配置caffe及其matlab接口 系统...

jungieve ⋅ 2017/02/18 ⋅ 0

c++调用matlab生成的Dll动态连接库

点击打开链接 http://download.csdn.net/detail/nuptboyzhb/4228429 c++调用matlab生成的Dll动态连接库 实验平台: matlab 7.0(R2009a) VC++6.0 思路: 1. 设置matlab的编译器,使用外部的V...

长平狐 ⋅ 2012/10/08 ⋅ 0

HoloLens开发——C++ DLL封装及在win32、Unity、AR眼镜中调用情况

一、C++ Dll基础了解 动态链接库(dll)比较好的介绍在孙鑫《VC++深入详解》第十九章动态链接库中有详细介绍。主要涉及以下问题: 1.静态链接库与动态链接库的区别 https://blog.csdn.net/za...

haitianyunlan ⋅ 05/09 ⋅ 0

CUDA学习(八十九)

驱动 API: 驱动程序API在安装设备驱动程序期间在系统上复制的cuda动态库(cuda.dll或cuda.so)中实现。 它的所有入口点都以cu为前缀。 它是一个基于句柄的命令API:大多数对象都被不透明的句...

night李 ⋅ 02/24 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

JavaScript零基础入门——(八)JavaScript的数组

JavaScript零基础入门——(八)JavaScript的数组 欢迎大家回到我们的JavaScript零基础入门,上一节课我们讲了有关JavaScript正则表达式的相关知识点,便于大家更好的对字符串进行处理。这一...

JandenMa ⋅ 58分钟前 ⋅ 0

sbt网络问题解决方案

转自:http://dblab.xmu.edu.cn/blog/maven-network-problem/ cd ~/.sbt/launchers/0.13.9unzip -q ./sbt-launch.jar 修改 vi sbt/sbt.boot.properties 增加一个oschina库地址: [reposit......

狐狸老侠 ⋅ 今天 ⋅ 0

大数据,必须掌握的10项顶级安全技术

我们看到越来越多的数据泄漏事故、勒索软件和其他类型的网络攻击,这使得安全成为一个热门话题。 去年,企业IT面临的威胁仍然处于非常高的水平,每天都会看到媒体报道大量数据泄漏事故和攻击...

p柯西 ⋅ 今天 ⋅ 0

Linux下安装配置Hadoop2.7.6

前提 安装jdk 下载 wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.7.6/hadoop-2.7.6.tar.gz 解压 配置 vim /etc/profile # 配置java环境变量 export JAVA_HOME=/opt/jdk1......

晨猫 ⋅ 今天 ⋅ 0

crontab工具介绍

crontab crontab 是一个用于设置周期性被执行的任务工具。 周期性执行的任务列表称为Cron Table crontab(选项)(参数) -e:编辑该用户的计时器设置; -l:列出该用户的计时器设置; -r:删除该...

Linux学习笔记 ⋅ 今天 ⋅ 0

深入Java多线程——Java内存模型深入(2)

5. final域的内存语义 5.1 final域的重排序规则 1.对于final域,编译器和处理器要遵守两个重排序规则: (1)在构造函数内对一个final域的写入,与随后把这个被构造对象的引用赋值给一个引用...

江左煤郎 ⋅ 今天 ⋅ 0

面试-正向代理和反向代理

面试-正向代理和反向代理 Nginx 是一个高性能的反向代理服务器,但同时也支持正向代理方式的配置。

秋日芒草 ⋅ 今天 ⋅ 0

Spring 依赖注入(DI)

1、Setter方法注入: 通过设置方法注入依赖。这种方法既简单又常用。 类中定义set()方法: public class HelloWorldOutput{ HelloWorld helloWorld; public void setHelloWorld...

霍淇滨 ⋅ 昨天 ⋅ 0

马氏距离与欧氏距离

马氏距离 马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为Σ的随机变量之间的差异程度。 如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也...

漫步当下 ⋅ 昨天 ⋅ 0

聊聊spring cloud的RequestRateLimiterGatewayFilter

序 本文主要研究一下spring cloud的RequestRateLimiterGatewayFilter GatewayAutoConfiguration @Configuration@ConditionalOnProperty(name = "spring.cloud.gateway.enabled", matchIfMi......

go4it ⋅ 昨天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部