文档章节

ubuntu 17.04 cuda

MtrS
 MtrS
发布于 2017/09/01 09:12
字数 342
阅读 31
收藏 0

Install NVIDIA CUDA on Ubuntu 17.04

The official download page only have package for 16.04 and 14.04, but actually Ubuntu 17.04 can install CUDA via apt directly. https://launchpad.net/ubuntu/zesty/+source/nvidia-cuda-toolkit Install

Assume you already have NVIDIA graphic driver installed and just need CUDA. Only the following command is needed.

sudo apt-get install nvidia-cuda-dev nvidia-cuda-toolkit nvidia-nsight

NOTE: Ubuntu 17.04 use GCC6, which is not supported by nvcc , the package will install clang-3.8 (the default clang version for 17.04 is clang 4.0, they can co-exist). Compile

Compile cuda code using nvcc -ccbin clang-3.8 hello-world.cu , remember to use cu as suffix instead of c other wise you will have error like the following

nvcc warning : The ‘compute_20’, ‘sm_20’, and ‘sm_21’ architectures are deprecated, and may be removed in a future release (Use -Wno-deprecated-gpu-targets to suppress warning).
square.c:6:1: error: unknown type name ‘__global__’
__global__ void cube(float * d_out, float * d_in){

You can use the following code to test if you have correct installation


/*
* Example from Udacity Intro to Parallel Programming https://www.udacity.com/course/intro-to-parallel-programming--cs344
* nvcc -ccbin clang-3.8 cube.cu
*/
#include <stdio.h>

__global__ void cube(float * d_out, float * d_in){
	int idx = threadIdx.x;
	float f = d_in[idx];
	d_out[idx] = f * f * f;
}

int main(int argc, char ** argv) {
	const int ARRAY_SIZE = 64;
	const int ARRAY_BYTES = ARRAY_SIZE * sizeof(float);

	// generate the input array on the host
	float h_in[ARRAY_SIZE];
	for (int i = 0; i < ARRAY_SIZE; i++) {
		h_in[i] = float(i);
	}
	float h_out[ARRAY_SIZE];

	// declare GPU memory pointers
	float * d_in;
	float * d_out;

	// allocate GPU memory
	cudaMalloc((void**) &d_in, ARRAY_BYTES);
	cudaMalloc((void**) &d_out, ARRAY_BYTES);

	// transfer the array to the GPU
	cudaMemcpy(d_in, h_in, ARRAY_BYTES, cudaMemcpyHostToDevice);

	// launch the kernel
	cube<<<1, ARRAY_SIZE>>>(d_out, d_in);

	// copy back the result array to the CPU
	cudaMemcpy(h_out, d_out, ARRAY_BYTES, cudaMemcpyDeviceToHost);

	// print out the resulting array
	for (int i =0; i < ARRAY_SIZE; i++) {
		printf("%f", h_out[i]);
		printf(((i % 4) != 3) ? "\t" : "\n");
	}

	cudaFree(d_in);
	cudaFree(d_out);

	return 0;
}

Reference

https://www.udacity.com/course/intro-to-parallel-programming--cs344

https://medium.com/@at15/install-nvidia-cuda-on-ubuntu-17-04-823300ab7bcc

© 著作权归作者所有

共有 人打赏支持
MtrS
粉丝 30
博文 549
码字总数 352132
作品 0
榆林
Ubuntu 17.04 Alpha 2 发布,现可下载

Ubuntu 17.04 Alpha 2 发布了。 Ubuntu GNOME 17.04 Alpha 2 Ubuntu GNOME 17.04 Alpha 2 附带了 GNOME 3.22,虽然几个应用程序(特别是 Nautilus 和 GNOME 终端)仍停留在 3.20 版本。 除了...

局长
2017/01/29
4K
5
Ubuntu 17.04 Beta 2 发布,现可下载

Ubuntu 17.04 Beta 2 发布了,该版本是 Ubuntu 17.04 桌面、服务器和云产品的最终 Beta 版。Ubuntu 17.04 稳定版将于 2017 年 4 月 13 日发布。 这次发布的 Beta 版不仅包括 Ubuntu 桌面、服...

局长
2017/03/24
3.1K
9
Ubuntu 17.04 官方吉祥物公布 - 折纸北美跳鼠

距离 Ubuntu 17.04 稳定版本发布还有不到一个月的时间,Canonical 为 Ubuntu 17.04 “Zesty Zapus” 公布了官方的吉祥物图稿。为了与以前的 Ubuntu 吉祥物保持一致,新的 Zesty Zapus 图形类...

王练
2017/03/17
2.7K
10
Ubuntu 17.04 公布,代号为“Zesty Zapus”

就在几分钟前,Canonical和Ubuntu创始人Mark Shuttleworth非常高兴地宣布了流行的Ubuntu Linux操作系统下一个主要版本的代号。这个版本是Ubuntu 17.04,其代号将是“Zesty Zapus”。虽然它们...

达尔文
2016/10/18
10.9K
33
Ubuntu 17.04 Beta 1 发布,现可下载

Ubuntu 17.04 Beta 1 发布了。 Ubuntu Budgie,Ubuntu GNOME 和 Xubuntu 是参与这次测试的社区风格之一。 Ubuntu 的常规版本,即大家希望看到的版本将会参加第二个 beta 版。 要详细了解测试...

局长
2017/02/24
4K
16

没有更多内容

加载失败,请刷新页面

加载更多

C++ std::thread

C++11提供了std::thread类来表示一个多线程对象。 1,首先介绍一下std::this_thread命名空间: (1)std::this_thread::get_id():返回当前线程id (2)std::this_thread::yield():用户接口...

yepanl
53分钟前
2
0
Nignx缓存文件与动态文件自动均衡的配置

下面这段nginx的配置脚本的作用是,自动判断是否存在缓存文件,如果有优先输出缓存文件,不经过php,如果没有,则回到php去处理,同时生成缓存文件。 PHP框架是ThinkPHP,最后一个rewrite有关...

swingcoder
57分钟前
1
0
20180920 usermod命令与用户密码管理

命令 usermod usermod 命令的选项和 useradd 差不多。 一个用户可以属于多个组,但是gid只有一个;除了gid,其他的组(groups)叫做扩展组。 usermod -u 1010 username # 更改用户idusermod ...

野雪球
59分钟前
1
0
Java网络编程基础

1. 简单了解网络通信协议TCP/IP网络模型相关名词 应用层(HTTP,FTP,DNS等) 传输层(TCP,UDP) 网络层(IP,ICMP等) 链路层(驱动程序,接口等) 链路层:用于定义物理传输通道,通常是对...

江左煤郎
今天
1
0
使用xtrabackup完成远程备份

转载收藏,以防丢失 需求 Can I backup remote databases from my local server02-27-2013, 06:17 AMHi, I am using mysqldump so far for taking daily backups of my Production datab......

阿dai
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部