文档章节

英伟达人工智能计算平台调研

o
 osc_g8254g7s
发布于 2019/08/19 22:35
字数 1407
阅读 8
收藏 0

「深度学习福利」大神带你进阶工程师,立即查看>>>

GPU

英伟达发布人工智能芯片,旨在打造机器人大脑 http://www.qianjia.com/html/2018-06/05_294558.html

英特尔/英伟达/AMD/IBM人工智能芯片盘点,谁更有优势?-控制器/处理器-与非网 https://www.eefocus.com/mcu-dsp/413144

 

英伟达发布人工智能计算机很惊艳它推出自动驾驶测试平台更革命性_车家号_发现车生活_汽车之家 https://chejiahao.autohome.com.cn/info/3479921/

购买最新的 Jetson 产品 | NVIDIA 开发者 https://www.nvidia.cn/autonomous-machines/jetson-store/

NVIDIA Distributor | Authorized Partner | Arrow.com https://www.arrow.com/en/manufacturers/nvidia

TX1:

 英伟达推Jetson TX1 GPU模块 力推人工智能_互联网资讯_中国IDC圈 http://cio.idcquan.com/80043.shtml

 NVIDIA Jetson TX1介绍(一) - u010586630的专栏 - CSDN博客 https://blog.csdn.net/u010586630/article/details/89844228

NVIDIA 的 Tegra X1 是第一颗达到 Teraflop 级运算能力的移动芯片_硬件_Linux公社-Linux系统门户网站 https://www.linuxidc.com/Linux/2015-01/111314.htm

 

TX2:

Jetson TX2 - eLinux.org https://elinux.org/Jetson_TX2

NVIDIA Jetson TX2 简单介绍 - long19960208的博客 - CSDN博客 https://blog.csdn.net/long19960208/article/details/81538480

【深度学习利器之NVIDIA Jetson TX2】Jetson-TX2入门——参数性能介绍 - https://blog.csdn.net/Gerwels_JI/article/details/84576935

Hardware For Every Situation | NVIDIA Developer https://developer.nvidia.com/embedded/develop/hardware

 Jetson TX2介绍 - shinedaisiki - 博客园 https://www.cnblogs.com/shinedaisiki/p/10075190.html

英伟达发布全新人工智能终端计算平台TX2—http://www.dsti.net/Information/News/103537

英伟达公布Jetson TX2 细节,堪称人工智能神器 - weixin_33725807的博客 - CSDN博客 https://blog.csdn.net/weixin_33725807/article/details/89593951

 

NVIDIA Data Center Accelerators https://www.nvidia.com/en-us/data-center/

NVIDIA DGX Station | NVIDIA https://www.nvidia.com/en-us/data-center/dgx-station/

英伟达GPU显卡计算能力评估(深度学习) - haoji007的博客 - CSDN博客 https://blog.csdn.net/haoji007/article/details/79189190/

 

 

 

几款科学计算显卡对比(GTX Titan X、GTX 980、Tesla K40 K80 及quadro K4200) - Li_JC - 博客园 https://www.cnblogs.com/lijingcong/p/4958617.html

 

Jetson 人工智能化领域的嵌入式平台 | 高性能运算 深度学习GPU - Leadtek https://www.leadtek.com/chs/products/AI_HPC(37)/Jetson_%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E5%8C%96%E9%A2%86%E5%9F%9F%E7%9A%84%E5%B5%8C%E5%85%A5%E5%BC%8F%E5%B9%B3%E5%8F%B0(140)

 

玩转NVIDIA Jetson AGX Xavier(1)--- jetson是什么 - 木子山石的学习笔记 - CSDN博客 https://blog.csdn.net/huiyuanliyan/article/details/87874024

玩转NVIDIA Jetson AGX Xavier(2)--- Jetson系列产品简介 - 木子山石的学习笔记 - CSDN博客 https://blog.csdn.net/huiyuanliyan/article/details/88831771

 

英伟达(NVIDIA)GPU编码能力列表(2018.12.23) - Zymill's Blog - CSDN博客 https://blog.csdn.net/zymill/article/details/85222296

 

计算平台:

EGX

https://www.nvidia.com/en-us/data-center/products/egx-edge-computing/

英伟达推出边缘计算平台,能搭载Jetson Nano、T4等加速卡-钛媒体官方网站 https://www.tmtpost.com/nictation/3971996.html

2019.05.28英伟达今日宣布推出EGX加速计算平台,旨在满足对即时、高吞吐量的边缘人工智能,即数据产生之处不断增长的需求,在确保反馈时间的同时能够减少需要发送至云端的数据量。英伟达方面称,EGX加速计算平台能够帮助企业在边缘实现低延迟的人工智能,即基于5G基站、仓库、零售商店、工厂及其他地点之间的连续的数据流实现实时感知、理解和执行。
新的NVIDIA EGX平台可以基于Jetson NANO处理器,组装的轻型计算平台可实现每秒5亿次并把功耗维持在几瓦特;搭载NVIDIA T4的EGX边缘服务器可以达到10万亿每秒的运算。芯片的低功耗对人工智能运算很重要,目前传统CPU在这类运算中能耗巨大,EGX目前是少数能够实现的计算平台。

HGX-2 平台

2018.06月,英伟达推出了 HGX-2 平台,以及以 HGX-2 为架构的 DGX-2 服务器。

https://www.nvidia.com/en-us/data-center/hgx/

深度 | 从GPU制造者到服务器提供商:英伟达的计算平台转型 http://www.sohu.com/a/236388385_129720

DGX-2 架构的核心是 NVSwitch 内存结构,该结构已被嵌入系统中的 GPU 计算节点中,允许多达 16 个最新的「Volta」Tesla V1000 加速器以点对点的方式彼此耦合。在 GPU 复合体中,每块 GPU 与另一块 GPU 之间的带宽为 300 GB/秒。本质上,NVSwitch 结构为 GPU 节点创建了一个 512 GB 的巨大的共享内存空间,以 10 千瓦的功耗,在 Tensor Core 上达到近 2 Petaflops 的算力。

使用 NVSwitch 连接器和 HGX-2 架构,你仍然可以通过这种方式进行机器学习,也可以将神经网络不同的层放置在同一系统下不同的 GPU 上,但是你需要 GPU 之间更高的带宽连接——同时所有 GPU 之间需要点对点连接——使其良好运行。这被称为模型并行化,并且 HGX-2 平台支持这种方法,通过主机来大幅度减少问题的训练时间。

HGX-2 平台拥有 16 个彼此连接的 Volta V100,每个都有高达 32 GB 的帧缓存器,总共有 512 GB 的 GPU 共享内存,同时 Tensor Core 的半精度单元拥有高达 2 Petaflops 的性能。这就意味着 4 倍内存和 2 倍的 FLOPs。每个 GPU 通过 6 个 50 GB / 秒 且聚合在一起的 NVLink 2.0 端口连接到 NVSwitch 复合体中,通常来说,NVSwitch 具有 300 GB / 秒的带宽。重要的是,所有 16 块 GPU 加速器彼此直接相连,并且对分带宽增加了 8 倍,达到 2.4 TB / 秒。这就是为什么在运行一系列 HPC 和 AI 工作负载时,相比于一对 HGX-1 平台,HGX-2 平台有高出 2 至 2.7 倍的性能。

 

o
粉丝 0
博文 499
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
日志分析平台 - Kibana

Kibana 是一个为 Logstash 和 ElasticSearch 提供的日志分析的 Web 接口。可使用它对日志进行高效的搜索、可视化、分析等各种操作。 环境要求: ruby >= 1.8.7 (probably?) bundler logstash...

匿名
2013/02/13
11.6W
1
C++科学计算库--O2scl

一个面向对象的 C++科学计算库,可用于解方程,最小化,微分,积分,插值,优化,逼近,分析,拟合等。许多类可操作于通用的函数和向量类型。可用于O2scl在Linux,Mac和Windows(Cygwin的)平...

匿名
2012/10/29
4.7K
0
高性能异步网络服务框架--libgod

libGod是一个全异步+协程机制实现的网络库,适用于windows、linux、bsd等多种平台。内部使用IOCP、epoll、kqueue等系统调用管理事件机制,同时巧妙的利用协程,将复杂的异步逻辑转换为同步,...

libGod
2012/11/09
6.7K
6
最短路径计算--A-STAR

A-STAR 寻找一种静态路网(本算法中为二维数组)中求解最短路径的解决办法 我们可以通过: var element = new Element(); 来创建二维数组的一个节点。 element自身包含了一些方法: element....

前叔
2012/12/14
1.8K
0
计算资源管理平台--Apache VCL

Apache VCL 是一个自服务的系统,为最终用户提供专用计算环境的远程访问环境。典型的使用场景是数据中心,也可以是物理刀片服务器、传统机架服务器或者虚拟机。VCL 也可以提供独立机器的代理...

匿名
2013/01/04
2.6K
0

没有更多内容

加载失败,请刷新页面

加载更多

PPDet:减少Anchor-free目标检测中的标签噪声,小目标检测提升明显

本文转载自AI算法修炼营。 这篇文章收录于BMVC2020,主要的思想是减少anchor-free目标检测中的label噪声,在COCO小目标检测上表现SOTA!性能优于FreeAnchor、CenterNet和FCOS等网络。整体思路...

我爱计算机视觉
昨天
0
0
BIO、NIO、AIO 区别和应用场景

点击上方“ java1234 ”,选择“标星公众号” 优质文章,第一时间送达 66套java从入门到精通实战课程分享...

小锋2
今天
0
0
ContentProvider(查询 插入 修改 删除 )

注意 本篇实在sqlite的基础上编写的所以建议首先了解sqlite 首先建立两个模块 ContentProvider ContentResolver ContentProvider 里面需要建立表和建立连接 所以在这里需要建立DBHelp类 DBHe...

osc_6ttvlt1w
37分钟前
30
0
用这个网站一查,才知道自己被卖了

还记得上个月好多大佬的Twitter账号被盗用于网络诈骗的事件吗。 7月15日,美国前总统奥巴马、“股神”巴菲特、特斯拉CEO马斯克、微软创始人比尔·盖茨等人的账户连续“被登录”,用来向大众诈...

猿大白
今天
11
0
牛客多校第9场E Groundhog Chasing Death

开始以为是什么高深的数论题,后来 重新 推了一下,得到了个这么个式子。 ∏ i = a b ∏ j = c d ( p 1 m i n ( a 1 [ 1 ] i , a 2 [ 1 ] j ) p 2 m i n ( a 1 [ 2 ] i , a 2 [ 2 ] j ) . . ...

osc_wdq5dwoy
38分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部