连击 天
fork: star:
项目背景 2023年上半年,蚂蚁AI Infra团队开源了DLRover项目,致力于通过提升深度学习训练过程的智能性,来解决整个系统的提效问题,目前DLRover支持了蚂蚁深度学习系统中的自动资源动态优化...
文|王勤龙 (花名:长凡) 蚂蚁集团 AI 系统工程师 ChaosBlade 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,可以用于验证云原生系统的稳定性。DLRover 作为云原生的...
文|王勤龙 (花名:长凡) 蚂蚁集团 AI 系统工程师 文|张吉 (花名:理之) 蚂蚁集团 AI 系统工程师 文|兰霆峰 四川大学 20 级计算机系 背景 如今大语言模型 (LLM) 的分布式训练节点规模...
文|梁仕威(花名:栖川) 蚂蚁集团算法专家 方略平台技术负责人,专注于分布式计算领域,主要负责蚂蚁基础算法的分布式设计与开发。 本文 3419 字 阅读 9 分钟 在类似安全风控这种对抗性的场...
文|王勤龙(花名:长凡) 蚂蚁集团技术专家 文|韩旭东(花名:玄钛) 蚂蚁集团高级开发工程师 专注于分布式深度学习领域,主要负责蚂蚁大规模分布式训练引擎的设计和开发。 本文 3988 字 ...
没有更多内容
加载失败,请刷新页面
没有更多内容
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复