AI大模型如何影响基础软件行业中的开发工具与环境?

原创
02/08 18:32
阅读数 857

最近,开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发者报告》。报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。查看完整报告2024 中国开源开发者报告.pdf

第二章《TOP 101-2024 大模型观点》IDEA基础软件研究中心讲席科学家、Moonbit平台负责人张宏波提到,AI 大模型提升程序员最终使用体验有几个方向,快速的更新迭代适合生成代码的垂类AI大模型只是一方面,更重要的是从编程语言入手,打造一个完整和AI高度集成的IDE生态。全文如下。

2024年AI大模型如何影响基础软件行业中的「开发工具与环境」

文/张宏波

前言

AI大模型是指在机器学习和深度学习领域,采用大规模参数(至少在一亿个以上)的神经网络模型。这些模型在训练过程中需要消耗大量算力和高质量数据资源。AI大模型主要分为自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型等,其中NLP大模型和多模态大模型在市场中占据主导地位。

目前AI大模型行业应用的实现路径主要有两种:一是持续加大对通用大模型的研发投入,提升AI Agent能力,直接服务各行业;二是融合行业专业知识,基于通用大模型打造垂类行业模型。垂类行业大模型已通用大模型的基础,通过二次训练和优化,实现更精准的行业应用。

60%的企业通过垂类行业大模型实现AI大模型在行业的应用布局。金融、政务、影视游戏和教育领域是大模型渗透率最高的四大行业,渗透率均超过50%。电信、电子商务和建筑领域的应用成熟度较高。

一、AI大模型正在颠覆基础软件行业

基础软件是指构成计算机系统和信息技术基础设施核心的软件,它们为应用程序的运行、数据处理和系统管理提供基本功能和支持。操作系统、数据库、中间件和网络软件、安全软件、系统管理软件、虚拟化软件、云平台等都属于基础软件。

作为构建软件世界的重要工具,随着AI大模型能力的不断释放,基础软件行业正在快速变革,传统的软件公司受到巨大冲击。

来自美国老牌VC Menlo Ventures的报告显示:以ChatGPT为例,在它的影响下Stack Overflow的网络流量减少了一半。IT外包公司和传统的自动化公司必须为即将到来的AI自动化挑战做准备。随着时间的推移,即使是Salesforce和Autodesk等软件巨头也将面临被AI公司颠覆的危险。

面临的挑战

当然机遇之中也蕴含着挑战。

值得注意的是尽管AI大模型在软件开发中的潜力巨大,但也面临数据隐私与安全性、模型可解释性、资源成本高以及法律与伦理风险等挑战。为了应对这些挑战,需要制定相应的数据保护政策、提高模型透明度、优化资源分配,并在法律层面清晰界定AI应用的责任归属。

大模型最常用的调用方式是通过模型厂商或者云服务提供商的API进行调用。在一些关注数据隐私和安全的商业公司里面,这通常意味着需要从模型厂商或者云服务提供商处购买昂贵的私有化部署的实例。

大模型在大量的数据上进行了训练,获得了很强的泛化能力,但是在一些少见、结构化的数据上仍然没有办法表现的足够优秀。现有的解决方案,例如推理时进行约束解码、微调,通常会导致模型能力的退化。如何让模型能够在推理的时候“主动”地生成符合期望约束的输出,仍然是一个没有解决的问题。

二、AI编程成为热门赛道

AI编程在过去一年的硅谷是非常热门的话题,包括GitHub Copilot等AI产品成功破圈用户达数百万。根据Gartner预测,到2028年,智能编码助手在企业软件工程师群体中的采用率将从2024年初的不到14%提升至90%。IDC估计,到2029年,AI编码工具市场规模达40亿美元。最近谷歌CEO Sundar Pichai也表示,谷歌超25%新代码均由AI完成。

很重要的一个原因是编程像数学一样结果非常容易评估,但是当下的AI编程有两个很大的瓶颈,第一个是缺乏对领域知识的理解,比如GitHub Copilot对所有的编程语言用的都是一样的模型,它甚至无法保证生成的这个编程语言的语法一定是正确的。

第二个是它缺乏原生的IDE支持,这也是因为时间关系,以前的IDE都没有预想到未来代码将由AI生成,所以现在的IDE无法与AI大模型进行一个高效的互操作,例如要修复Copilot的一个问题,我们需要一个接一个的串形进行修复,但大模型对算力的要求很高,会产生较大的延迟。

最近硅谷还有一个非常火的公司叫做Cursor,它的官网上专门有一篇文章描述:「怎么用已有编译器传统智能帮助大模型生成一个更高效可靠的代码」,证明Cursor也预见到了AI代码生成需要更为宏观的看到工具链上的每一环,工具链包括:编程语言、集成开发环境(IDE)、调试器、编译器和构建工具等。

但因为Cursor是一个做IDE的公司,它本身不拥有编程语言的服务,如果能从编程语言开始自底向上的适配大模型,编程体验将会产生质的飞跃。

三、AI编程主要的机遇在于自底向上重构工具链

目前绝大多数编程语言诞生在AI大模型时代之前,也就是说此前很少有人认真设想过未来代码将由AI生产。

几乎没有人从底层考虑如何适配AI编程,建立一整套开发者工具包括编程语言、编译器、调试工具、构建系统、静态分析安全检测工具等。

特别是编程语言不仅要设计易于人类学习的编程语言,还要设计易于AI学习和生成代码。以Python举例,它的优势是对于人类易读易学,动态类型系统减少了代码量,允许快速原型开发,增强了开发效率。但性能问题、内存消耗和多线程和并发处理确是它的劣势。

在AI大模型时代Python的优势不再明显,机器永不疲惫,不会因为代码枯燥而降低生成速度,劣势却愈发变成挑战。优秀的智能编程助手不能仅关注行业大模型,AI大模型对于「编程」只是冰山上的技术,未来将是「开发工具和环境」与AI大模型高度整合平台的天下。

一家科技媒体近期的一篇文章中提到:“现阶段在海外能解决这种IDE生态问题的中国团队尚且看不到。”IDE指的是集成开发环境,指用于提供程序开发环境的应用程序,包括代码编辑器、编译器、调试器和图形用户界面等工具,如微软VS系列问题。他认为,目前中国公司们哪怕想在海外实现Cursor这样的“插件逻辑”,也是遥遥无期。

当然,国内并非真的无人有能力整合平台生态,MoonBit(月兔)是从编程语言到集成开发环境(IDE)、调试器、编译器和构建工具等全部自研的中国团队,目前正在致力于打造下一代AI云原生开发平台。

MoonBit诞生于ChatGPT横空出世之后,有更好的机会去重新构想整个程序语言工具链该如何与AI友好的协作,不用承担太多的历史包袱。一开始就从顶层设计考虑如何让语言和工具(IDE,调试器,静态分析,包管理等)一体化发展。这两点使得MoonBit在非常早期就构建了专属MoonBit的云端IDE和AI代码助手,并创新性的从底层构建之初就与AI大模型进行适配。

一个更加完善的AI编程场景出现:

  • 通过思考语言设计和工具链适配,IDE和工具链能够非常灵活地在当前的仓库检查、运行并更新AI大模型生成的代码块。
  • IDE内置的测试功能除了为程序员提供一种方便测试的机制以外,能够很好地在代码上下文中作为相关代码的示例,从而大大提高代码生成及相关下游任务的正确性。
  • 除了在IDE中向用户提供常规的AI生成测试、撰写文档、修复错误等功能外,还能够提供完全后台运行的自动化智能体,通过读取编译器的各项反馈来完成各种相对复杂、长时间的下游任务,例如提升测试覆盖率、从自然语言提示生成完整代码组件或者项目等。

四、总结

未来程序员的工作场景,会更多的使用到AI大模型代码生成助手。值得注意的是,提升程序员最终使用体验有几个方向,快速的更新迭代适合生成代码的垂类AI大模型只是一方面,更重要的是从编程语言入手,打造一个完整和AI高度集成的IDE生态。

作者简介:

张宏波

现任基础软件中心首席科学家、 Moonbit平台负责人,是通用程序语言ReScript的作者,程序语言OCaml前核心开发人员。本科毕业于清华大学电子系,在美国宾夕法尼亚大学读博期间受Bloomberg邀请,从事函数式语言编译器的开发工作。

《2024 中国开源开发者报告》由开源中国 OSCHINA、Gitee 与 Gitee AI 联合出品,聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。

报告整体分为三章:

  1. 中国开源开发者生态数据
  2. TOP 101-2024 大模型观点
  3. 国产 GenAI 生态高亮瞬间

查看完整报告,请点击 2024 中国开源开发者报告.pd

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
3 收藏
0
分享
返回顶部
顶部