近日,天数智芯的天垓100产品卡与潞晨科技的AI大模型开发系统 Colossal-AI 完成并通过相互兼容性测试认证,双方进行严格测试后,结果显示:相互兼容,功能正常,运行稳定,显著优于现有其他解决方案。双方将为自动驾驶、智慧城市、智慧金融、智慧医疗、智能制造等典型AI应用场景,提供兼具高性能、通用性和灵活性的AI大模型计算加速解决方案。

天数智芯天垓100芯片
Colossal-AI开源地址:https://github.com/hpcaitech/ColossalAI
天数智芯的天垓100产品卡是天数智芯首款全自研云端训练通用GPU产品,支持多精度数据类型标准和混合训练,提供片间互联扩展。当前,天垓100已支撑近百个客户在人工智能领域进行超过两百个不同种类模型的训练, ResNet50、SSD 、BERT 等骨干网络模型的性能比肩国际市场主流产品。此外,天垓100还广泛支持传统机器学习、数学运算、加解密及数字信号处理等领域,已适配 X86 、Arm 等各种类型 CPU 架构。

Colossal-AI开源地址:https://github.com/hpcaitech/ColossalAI
潞晨科技的Colossal-AI可帮助用户显著提高大规模AI模型训练和部署效率,实现最佳性能和最低成本。例如,训练大模型如GPT-3 通常需要上百块顶配GPU并行,而使用Colossal-AI仅需一半的计算资源即可启动。即使对于低端硬件, Colossal-AI也可利用低成本的CPU内存和硬盘空间,相比原生PyTorch可提升硬件模型容量上百倍。相关解决方案已成功在自动驾驶、云计算、零售、医药、芯片等行业知名厂商落地应用,广受好评。自开源以来,Colossal-AI已经多次在GitHub热榜位列世界第一,并Colossal-AI成功入选为SC、AAAI、PPoPP等国际AI与HPC顶级会议的官方教程。
通过此次产品兼容性认证,依托天数智芯长期在通用 GPU 领域的深耕探索,以及潞晨科技在AI大模型并行加速方面的技术沉淀,双方将携手推进AI大模型解决方案生态建设,加速AI大模型在各行业的落地。
关于天数智芯
上海天数智芯半导体有限公司(简称“天数智芯”)于2018年正式启动通用GPU芯片设计,是中国第一家通用GPU高端芯片及超级算力系统提供商。公司以“成为智能社会的赋能者”为使命,立足客户、市场的需求,致力于开发自主可控、国际领先的高性能通用GPU产品,加速AI计算与图形渲染融合,探索通用GPU赶超发展道路,加快建设自主产业生态,打造世界一流的算力引擎,以更可信、更高效、更绿色的算力赋能各行各业智能化转型,促进我国数字经济高质量发展,开启中国引领世界走向元宇宙、数字孪生的崭新一页。
关于潞晨科技
潞晨科技是一家全球性的高性能计算和人工智能公司,致力于“解放AI生产力”。技术团队核心成员来自美国加州伯克利、斯坦福、新加坡国立、南洋理工、清华、北大等国内外知名高校。在高性能计算、人工智能、分布式系统等方面已有十余年的技术积累,并在国际顶级学术刊物或会议发表论文近百篇。公司核心产品面向大模型时代的通用深度学习系统 Colossal-AI,可实现高效快速部署AI大模型训练和推理,降低AI大模型应用成本,开源后多次在GitHub热榜位列世界第一,已获得GitHub Star 超6千颗。公司在种子轮、天使轮融资已获得“清科中国早期投资机构30强”前三甲创新工场、真格基金、蓝驰创投的600万美元投资。