立即报名|AI模型训练加速行业分享沙龙

04/19 20:09
阅读数 87


活动背景

速度往往决定着商业的成败。

模型训练的加速意味着企业能够更快地开发出新的AI产品或服务,从而更快地推向市场,满足客户需求。这种快速响应能力有助于企业在竞争中抢占先机,获得市场优势。不仅如此,加速还意味着企业能减少训练所需时间,从而降低硬件资源的占用和能源消耗,带来更高的ROI。


Alluxio作为全球领先的AI高性能数据访问平台,一直被广泛的应用于AI模型训练与推理的核心阶段。此次,我们联合中关村知名孵化器品牌泰利驿站与数据智能开发者垂直社区DataFun,邀请了来自互联网、汽车、大模型行业的AI Infra专家,将为行业伙伴们带来一场以AI模型训练加速为主题的精彩线下沙龙。


诚挚邀请AI Infra 相关的IT/技术负责人、架构师、开发及研究人员、生态合作伙伴报名参与。


识别二维码

立刻报名参与



活动信息

活动时间:2024年4月26日(周五)14:00-17:10

联合组办:Alluxio x Inno.EcoS Lab x DataFun

活动地点:北京市海淀区中关村东路8号东升大厦A座4层401



主题一:Alluxio在自动驾驶模型训练中的应用与部署


演讲摘要

辉羲智能在2023年将自动驾驶算法训练的文件缓存从NAS切换成Alluxio。基于Alluxio的缓存系统解决了困扰研发多时的并发数据访问卡顿严重、重复数据下载、数据重复浪费空间、手动管理存储容量导致的效率低下和操作风险高等问题,使得数据系统的可用性提升 10 倍,成本减半,易用性大大提升,从而帮助团队极大提升了算法研发的效率。

辉羲为何选择Alluxio?

在自动驾驶跨集群中如何使用?

怎样充分测试和验证其功能和性能?

怎样提升Alluxio的运维能力?



主题二:混合云下,Alluxio如何为AI存储加速


演讲摘要

2023年,知乎首次在模型分发的场景中采用了 Alluxio,不仅解决了跨云专线带宽的问题,还带来了 2-3 倍的读取性能提升。


随着大语言模型训练在知乎内部的开展,算法团队对存储也提出了更高的要求,Alluxio 提供的 Fuse 接口很好地满足了业务方的需求,在知乎内部站稳了脚跟,迅速发展,从最开始的一个集群,发展成了多个集群。


知乎是混合云的架构,为了减少模型训练中数据访问的延迟,在每一个公有云都部署了一套 Alluxio 集群,利用 Alluxio的透明缓存能力,将离线HDFS集群上的训练数据快速分发到每一台GPU机器上,并且无需任何数据迁移和拷贝,极大提高了训练任务的GPU利用率。



主题三:Alluxio AI-新一代AI/ML训练中台的数据I/O解决方案


演讲摘要

在以数据驱动的AI时代,高效访问存储中的大量数据对于模型训练和服务至关重要。然而,I/O 挑战往往会阻碍性能并限制 GPU 的利用率。


本次分享,我们将介绍基于 Alluxio 构建的高性能数据访问层,如何克服 I/O 挑战并显著提高 GPU 利用率。通过丰富的用户案例和实验数据,您将了解在Alluxio中缓存数据集和模型的方法以及在性能方面的提升。



主题四:魔搭社区在大模型训练推理方向的技术沉淀和优势


演讲摘要

通义实验室下属魔搭社区在LLM/MLLM/SD方向的训练进行了很多探索,为方便社区开发者对LLM进行训练和应用,并真正做到普惠AI,魔搭社区开发了开源的训练推理框架SWIFT,该框架具备200+ LLM和100+开源数据集训练能力,并可方便扩展到新模型上。在SD AIGC方向上,魔搭社区联合通义实验室基础视觉团队开发了训练框架Scepter,该框架使用LoRA和自研的SCEdit技术做到了对文生图模型的便捷微调和推理,并可以支持可控生成。


......
还有更多精彩内容,等你现场发掘

......



活动议程

14:00-14:05  主持人开场

14:05-14:45  Alluxio AI新一代AI/ML训练中台的数据I/O解决方案

14:45-15:25  混合云下,Alluxio如何为 AI 存储加速

15:25-15:40  茶歇

15:40-16:20  Alluxio在自动驾驶模型训练中的应用与部署

16:20-17:00  魔搭社区在大模型训练推理方向的技术沉淀和优势

17:00-17:10  技术交流&结束



识别二维码

立刻报名参与


互动礼品

参与本次活动

凡到场的小伙伴,即可获得伴手礼一份

同时现场设置了填问卷抽好礼活动,精美礼品等着你


联系方式

如有疑问请扫描文末小助手二维码,联系我们~




Alluxio

Alluxio是全球领先的针对分析和AI的高性能数据平台提供商,可加速企业AI产品价值变现,并最大化基础设施的投资回报率。Alluxio数据平台位于计算与存储系统之间,能够在数据工作流的各个阶段为数据平台上的工作负载提供统一视图。无论数据位于何处,该平台均可提供高性能的数据访问,简化数据工程,提高GPU利用率,并降低云计算和存储成本。企业无需使用专用存储,即可大幅加速模型训练和模型服务,并在现有数据湖上构建AI基础设施。

Alluxio在头部投资者的支持下,为全球科技、互联网、金融和电信企业提供服务,目前全球排名前 10 的互联网公司中有 9 家在使用Alluxio。更多信息,请访问 www.alluxio.com.cn。


Inno.EcoS Lab

Inno.EcoS Lab泰利驿站为中关村东升科技园的孵化器品牌,是以Inno.EcoS高新企业成长生态圈为核心,建立的产业创新孵化加速网络和创新平台。泰利驿站专注生命科学、数字经济、新能源/新材料三大产业领域,深耕产业服务10余年,从全球范围内汇聚创新、创业资源,为预孵、加速、成长期的高新企业提供多选择、多类型、多点位的办公空间及配套创新企业科技服务。


DataFun

DataFun成立于2017年底,是专注于服务数据智能开发者的垂直社区。在“成就百万数据智能开发者,助力万家企业数智化”的使命驱动下,通过近6年的持续运营,邀请了超过4000位领域专家分享、以视频和图文的形式沉淀了超过2000个应用案例、并在全网影响了50w精准开发者。在DataFun,你可以链接到数据智能领域权威专家、前沿技术、最佳实践和优秀的开发者群体。希望DataFun可以陪伴开发者、企业和行业一起奔赴数据智能的大时代。


【添加小助手,了解更多活动详情】


【近期热门】


【宝典集市】

本文分享自微信公众号 - Alluxio(Alluxio_China)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部