8 月 26 日,源创会北京站在北京中关村创业大街圆满举办。本期源创会以“AI 大模型与底层技术探索”为主题,邀请到学界、业界多位讲师分享其在 AI 方面的研究成果和经验。
座无虚席的现场
感谢图灵教育、机械工业出版社、阿里云存储共送出 18 本书做奖品🧧
感谢各位合作伙伴的大力支持
源创会传统“披萨”(吃到披萨的小伙伴快来留个言证明下)
演讲回顾
演讲回放:
https://weixin.qq.com/sph/AXtGMa 上集(需在手机微信中打开此链接)
https://weixin.qq.com/sph/AqQKDE 下集(需在手机微信中打开此链接)
BentoML 软件工程师赵申阳发表《OpenLLM:开源大语言模型落地实践》主题演讲。赵申阳介绍,许多企业想要把模型部署在自己的应用中,但各种版本的大模型层出不穷,所以企业一直希望使用最新的大模型,那就需要不断更新代码,需要要投入大量的资源与精力。此外,大模型的使用也会带来 LLM 幻觉,安全性、隐私问题等等,许多企业更希望定制自己的大模型。BentoML 所做的事情便是一键/一行(代码)切换大模型。赵申阳详细介绍了可用于构建 AI 应用程序的开源框架 OpenLLM,OpenLLM 支持对主流 ML 框架/库的开箱即用、灵活且可定制、内置支持分布式部署以实现可伸缩性、支持 BentoCloud 无服务器部署。
如何让高效地利用已有文件,挖掘文件数据中的价值?这个问题在大模型时代,已经有了最新解。随着大语言模型的飞速发展,各类大语言模型展现出了出色的对话能力与任务求解能力,为各类智能应用提供了丰富的想象空间。阿里云智能高级技术专家马俊凯发表了《智能存储基于大模型的产品能力提升》主题演讲,详解了大语言模型对于智能存储的影响。以阿里云智能存储体系为例,其结合自身业务,引入“通义千问”大模型、多模态模型等推出了智能文档助手、语义搜索、内容生成等功能,提供了诸如文档润色、文档续写、文档摘要、语气改写、文档翻译等智能文档能力;文档、图片的跨模态搜索能力。同时结合 x-oss-process 为用户提供了更加便捷的图片处理、文档编辑方式。
通用大模型可以取代为特定任务定制训练的专属模型吗?在可能不远的未来,人机如何合作?如果会取代,那么基于大模型的以人为本的人机合作场景可能是什么样子的?
这是在 ChatGPT 公测之后,韩文娟提出的三点思考,彼时韩文娟已经加入了北京交通大学交通大数据与人工智能教育部重点实验室。在这次的源创会上,北京交通大学计算机与信息技术学院副教授韩文娟发表《利用大模型推动交通领域的智能应用》主题演讲,详解其研究成果。针对上述三个问题,韩文娟和其团队分别做了基于 ChatGPT 的信息抽取工具、人机合作的标注平台以及交通领域基于大型预训练模型的司法判决系统,证明了交通大模型和知识图谱技术结合,可以构造出一个可解释、可追溯、可控的系统。最终在今年 7 月,在交通行业大模型方面,韩文娟所带领的团队发布了国内外首款综合交通大模型 TransGPT,可以实现交通安全教育、智能出行助手、智能交通管理、智能交通规划、交通事故报告和分析、交通政策研究等。
天工大模型商业化产品总监袁梓焜发表《基于数据边界洞察 AI 应用落地与演进趋势》主题演讲。袁梓焜指出,AIGC≈泛 UGC,它不局限于视觉和语言内容,还应该包括肢体、神态、意识与逻辑。而泛 UGC 的三种形式智能涌现、逻辑推理、条件反射分别对应人的三种反应:创意脑暴、分析思考、不假思索。这三种反应也可以称为三种数据类型,对应到不同用户行为之上,则会体现不同的价值。因此,搞清楚数据边界对于大模型的落地应用有非常大的影响。而在 AI 技术可行性边界中,数据压缩度与人类对齐是目前主要卡点。袁梓焜介绍,天工大模型已经能够实现智能涌现,能够实现 20 轮次以上用户交互,最高支持 1 万字以上文本对话。7月14日,公司与国内领先的互动娱乐服务提供商“映宇宙”就AI技术服务事项达成合作协议,此次合作标志着“天工”大模型在互联网社交行业应用的正式落地。
虽然大模型市场非常火热,但普通的创业者和工程师很难有机会直接训练大模型,那么普通人机会在哪里?LLM agent 被认为是一个优势途径。WasmEdge 社区经理夏歌发表《如何用 Serverless 的方式构建 LLM Agent》主题演讲,介绍了几种常见的 LLM agent,第一种是 AI agent,如 MetaGPT、Auto-GPT。第二种是 Co-pilot agent。夏歌也分享了一个 AI agent 框架 flows.network,可以用Serverless 的方式部署 co-pilot Agent,从而用户无需运行自己的服务器来侦听触发器和事件,并对操作进行身份验证(例如,将结果发送到团队的私有 Slack Channel)。工程师只需要关注业务逻辑即可。在 AI 代理中,Flow 函数可以轻松访问所有领先的商业和开源 LLM(例如 GPT4、Claude2、PaLM2、llama2)和生成图像模型。你可以轻松创建利用模型的能力与世界交互的 AI Agent。
当下,大模型与向量检索技术,也已经渗入数据库运维中,提供了一种新的运维方式。爱可生向量数据库研发经理苏鹏发表《智能运维交互的创新实践》主题演讲。苏鹏介绍,基于大模型+向量数据库的智能运维解决方案,可以提高运维效率,通过智能化的方法,可以自动化处理常见的运维问题,大幅提高运维效率;降低运维成本,通过自动化运维,减少对人工的依赖,从而降低企业的人力成本;强化故障预防,通过大模型的预测能力,可以预测潜在的故障和问题,从而实现从被动应对向主动预防的转变。爱可生也提出了基于大模型+向量数据库的 SQL 开发管控解决方案,可实现数据清洗、向量转换与检索、模型微调等技术。
各位演讲嘉宾的分享也赢得了现场观众的喝彩,分享结束后,多位观众积极向讲师提问,深度交流。
线下参会当然要多多交流啦🎉
下期预告
9 月 23 日,源创会将在成都举办,以“数据与前沿技术”为主题,欢迎加入!
讲师报名通道:https://www.wjx.cn/vm/mBUPEVh.aspx#
观众意见反馈:https://www.wjx.cn/vm/QgId9lj.aspx#
详情咨询:Tel/WeChat-18655807197