RAG 五周年,向量检索发展状况如何?

原创
05/21 23:47
阅读数 2.2W

AI 一天,人间一年。ChatGPT发布不过才两年多时间,业内就已经从卷大模型训练,上升到了卷AI 应用。到了应用这一层,大模型固有的幻觉问题、知识时效性不足以及垂直领域知识匮乏等缺陷逐渐暴露。大家发现,原来大模型并不是万能的。

在追求更可靠 AI 落地的过程中,RAG(检索增强生成)技术及其核心的向量检索技术,正成为解决这些难题的重要突破口。

基于这一背景,在 RAG 发布五周年之际,开源中国 OSChina《数智漫谈》直播栏目,特别策划"向量检索技术深度解析"专场,邀请到 Shopee 资深算法专家,高性能检索算法 NSG、SSG 发明者傅聪以及 DolphinDB 研发副总监胡津铭于 5 月 28 日(周)19:00,共同解构向量检索的技术本质,探讨其在 AI 时代破局大模型应用困境的核心价值。

本次直播的主讲人傅聪,于浙江大学计算机博士毕业,美国南加州大学访问研究,其主导发明的 NSG、SSG、PSP、MAG 等高性能检索算法,已落地为千亿级向量检索系统,成为工业界大规模检索的标杆方案。

其中,基于图的高维向量检索算法 NSG,是当前最为先进的图算法之一,与另一算法 HNSW 齐名NSG 被 Meta 的 FAISS 框架深度集成,实现在密度连接的节点网络中进行高效的邻近搜索,既提升了搜索速度,又避免了多层结构带来的复杂性;同时该算法也被阿里中台应用于淘宝推荐、图像搜索等核心场景,通过高效处理单机十亿级高维向量数据,显著降低了计算复杂度与响应延迟。

在学术领域,傅聪持续保持高产输出。在 TPAMI、KDD、VLDB、SIGIR、IJCAI、EMNLP、CIKM 等顶级会议或期刊发表论文二十余篇。同时,长期担任 Tpami、TKDE、ICLR、KDD、SIGIR、AAAI、IJCAI、EMNLP 等国际会议审稿人。

此外,他还出版了专著《业务驱动的推荐系统:方法与实践》。该书从业务视角出发,描绘了当下主流推荐系统的设计思想和架构全貌,重点突出系统每个模块所需要解决的问题,进而介绍一到两种实践检验普遍有效、在学术界具备里程碑性质的算法。

目前傅聪在 Shopee(新加坡) 担任资深算法专家,仍然专注于AI大规模应用落地方面的研究,仅今年上半年,就有 4 篇学术论文通过同行评议,被计算机领域顶级国际会议接收。

本次直播主持人胡津铭,与傅聪师出同门,2020 年毕业于浙江大学计算机学院,曾在 Google、Optiver 等知名企业工作,现为 DolphinDB 智臾科技研发副总监。以 ID “胡津铭” 活跃于知乎,粉丝数量超过 5 万。

我们期待,在胡津铭与傅聪的这场关于“向量检索技术本质与产业实践"的深度对话下,能够让大家对向量检索这一技术有所了解,打开通向下一代 AI 系统的大门。

微信扫码,预约直播,立即获取:

  • 大模型幻觉与 RAG、向量检索技术
  • 向量检索算法类别、历史沿革、适用场景
  • LLM/RAG/Agentic System新宠:图算法
  • 向量检索未来十年发展以及工业落地建议
  • 开箱即用的向量数据库/向量检索库推荐
另外,我们还建了一个技术交流群,欢迎进来唠唠嗑~~~



【数智漫谈】

OSCHINA 视频号直播畅聊栏目【数智漫谈】,每期一个技术话题,三五位专家围坐,各抒己见,畅聊开源。给大家带来最新的行业前沿、最热门的技术话题、最有趣的开源项目、最犀利的思想交锋。如果你手上也有新点子、好项目,想要跟同行交流分享,欢迎联系我们,讲坛随时开放~

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
1 收藏
1
分享
返回顶部
顶部