连击 天
fork: star:
项目背景 2023年上半年,蚂蚁AI Infra团队开源了DLRover项目,致力于通过提升深度学习训练过程的智能性,来解决整个系统的提效问题,目前DLRover支持了蚂蚁深度学习系统中的自动资源动态优化...
文|王勤龙 (花名:长凡) 蚂蚁集团 AI 系统工程师 ChaosBlade 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,可以用于验证云原生系统的稳定性。DLRover 作为云原生的...
蚂蚁 AI Infra 团队在深度学习最核心之一的优化器方向持续投入与创新,实现了 AI 训练节约资源、加速收敛、提升泛化等目标。我们将推出“优化器三部曲”系列,这是本系列的第一篇。 本文 68...
文|王勤龙 (花名:长凡) 蚂蚁集团 AI 系统工程师 文|张吉 (花名:理之) 蚂蚁集团 AI 系统工程师 文|兰霆峰 四川大学 20 级计算机系 背景 如今大语言模型 (LLM) 的分布式训练节点规模...
导读 稀疏 CTR 模型是用于预测点击率的一类深度学习模型的统称。通过处理高维稀疏特征数据实现高效的广告点击率预测,准确的 CTR 预测可以更好地进行广告投放决策,提升广告投放效果。在稀疏...
文|梁仕威(花名:栖川) 蚂蚁集团算法专家 方略平台技术负责人,专注于分布式计算领域,主要负责蚂蚁基础算法的分布式设计与开发。 本文 3419 字 阅读 9 分钟 在类似安全风控这种对抗性的场...
开源之夏是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展,培养和发掘更多优秀的开发者。 ...
文|王勤龙(花名:长凡) 蚂蚁集团技术专家 文|韩旭东(花名:玄钛) 蚂蚁集团高级开发工程师 专注于分布式深度学习领域,主要负责蚂蚁大规模分布式训练引擎的设计和开发。 本文 3988 字 ...
没有更多内容
加载失败,请刷新页面
没有更多内容
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复