连击 天
fork: star:
最近大家都在聊 MCP,发现有个最重要的点被忽略了 『通过标准化协议,将工具提供方与应用研发者解耦』 ,这一点带来的将是 AI Agent 应用研发范式的转移(类似 Web 应用研发的前后端分离)。...
背景 在云原生调度中,一次调度往往无法解决所有问题,需要配合重调度来优化资源分配和任务摆放。传统的重调度框架主要集中在识别异常节点或任务,并通过迁移或删除来解决。然而,这些框架往...
在大模型时代到来之前,开源合规一直是开源领域备受关注的重要话题。如今,随着大模型的蓬勃发展,开源合规的重要性愈发凸显,成为不容忽视的关键问题。例如,不同大模型采用了多种不同的开源...
过去数年来,大规模集群联邦因其资源无限扩展能力、高可用架构设计及混合云协同优势,成为企业应对业务全球化、场景多元化的关键技术选择。 然而,当企业业务规模突破百万节点大关,大规模集...
虚拟索引技术(virtual index,也称为 hypothetical index)在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。简单来说,虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建...
Midscene.js 是由字节跳动 Web Infra 团队全新开源的 UI 自动化工具。通过引入多模态 AI 推理能力,Midscene.js 将帮助开发者打破传统 UI 自动化难于编写和维护的困境。本文由字节跳动 Web ...
原文链接:https://aibrix.github.io/posts/2025-03-10-deepseek-r1/ 本文详细介绍了如何通过 AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。DeepSeek-R1 通过渐进式训练框架展...
FlowGram 是一套基于节点编辑的流程搭建引擎,帮助开发者快速创建固定布局或自由连线布局的流程,并提供一套交互的最佳实践, 很适合有明确输入和输出的可视化工作流。Github: https://githu...
简介 vArmor 是字节跳动开源的云原生容器沙箱系统,它借助 Linux 的 AppArmor LSM,BPF LSM 和 Seccomp 技术进行容器加固。用户可以通过 vArmor 的 CRD API 在 Kubernetes 集群中管理安全策略...
本文档为新项目 AIBrix 国内宣传稿,目前该项目已在海外官宣开源,详见: 🔗 vLLM 博客: vLLM Blog 🔗 代码仓库: GitHub Repo 🔗 技术详解博客: Technical Blog 前言 随着 LLaMA、D...
2025年2月21日,vLLM通过官方博客宣布了由字节跳动开发的AIBrix大模型推理系统开源,为vLLM推理引擎提供可扩展且高性价比的控制面。开源72 小时内,AIBrix 收获的GitHub Star 数已超 1000, ...
2025 年开年,DeepSeek 开源模型以“低成本、高性能”成功掀起 AI 平价化浪潮,并以惊人的速度渗透至各个领域。在 AI 平价化浪潮的推动下,微服务架构正迎来前所未有的变革机遇。微服务架构通...
多集群部署微服务带来了可扩展性和容灾性等优势,但也引入了全局层面的脆弱性——中心控制平面的任何问题都会级联影响所有被管理集群,造成灾难性后果。其中最严重的场景之一是由于Pod删除导...
文章来源|CloudWeGo 开源团队 Eino 项目组 今天,经过字节跳动内部半年多的使用和迭代,基于 Golang 的大模型应用综合开发框架 —— Eino,已在 CloudWeGo 正式开源啦! Eino 基于明确的“组...
文章来源|CloudWeGo 开源社区 本文根据字节跳动服务框架团队研发工程师在 CloudWeGo 技术沙龙暨三周年庆典中演讲内容《ROG——高性能 Go 实现》整理。 ROG 之缘起 ROG 的诞生是因为我们一部...
文章来源|豆包大模型团队 强化学习(RL)对大模型复杂推理能力提升有关键作用,然而,RL 复杂的计算流程以及现有系统局限性,也给训练和部署带来了挑战。传统的 RL/RLHF 系统在灵活性和效率...
基于优异的调度性能,Gödel Scheduler 拥有在超大集群规模 (20k+ Nodes, 1000k+ Pods)、超高业务负载 (1k+ Incoming Pods/s)、超多复杂场景 (ML/批流/潮汐混部等) 下长期稳定运行的能力。 ...
基于优异的调度性能,Gödel Scheduler 拥有在超大集群规模 (20k+ Nodes, 1000k+ Pods)、超高业务负载 (1k+ Incoming Pods/s)、超多复杂场景 (ML/批流/潮汐混部等) 下长期稳定运行的能力。 ...
2023 年 5 月 ByConity GA 0.1.0 版本正式发布,至今已满一年。今年 8 月,ByConity 1.0 版本也将正式发布。随着项目被更多地测试及使用,社区也有了更多的外部贡献者。ByConity 开源一周年活...
KubeAdmiral v1.0.0 的发布源于社区和开发人员在过去一年中取得的成就,感谢所有参与此版本的贡献者。 来源 | KubeWharf 社区项目 | https://github.com/kubewharf/kubeadmiral KubeAdmiral...
没有更多内容
加载失败,请刷新页面
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复