Llama2大模型开源,和开源的原教旨主义者们的又一次分道扬镳!

2023/07/28 21:00
阅读数 166
AI总结




开源推动创新,因为它使更多的开发者能够利用新技术进行构建。同时,这也提高了安全性和保障,因为当软件是开放的时候,更多人可以审查并修复潜在问题。


                                                                      ——扎克伯格



上周技术圈最爆款的新闻估计就是扎克伯格的Meta公司宣布免费、开源、商用Llama 2的大语言模型了。


在一日千里的AIGC赛道上,Meta和OpenAI、谷歌、苹果还有马斯克们展开的真是一场刺刀见红的白热化竞争。这个新闻的前几天,马斯克官宣成立xAI公司,而近期苹果宣称建立了自己的框架“Ajax”来创建大型语言模型,准备提供基于“Apple GPT”聊天机器人服务。


毫无疑问,Meta借助于开源、免费、可商用这几个关键词,着实高调吸引了一波眼球。可以说,Meta算是正在巧妙地利用开源,来试图对AIGC市场竞争格局进行一次战略重置。但这一招能否见效,尚需时间来验证。不过,可以确定的是,在这波这浪下,面对OpenAI 的先发优势,这将不失是一个明智的策略。值得让所有从事开源的人们对企业的开源策略产生更深刻的认识。 




我们知道Meta的大语言模型由之前的LLaMA(Large Language Model Meta AI)变成了Llama 2。本次开源的产品其实有两个:

  • 一个是经过预训练的基座模型:Llama 2;
  • 一个是针对会话任务微调过的Fine-Tuned模型:Llama 2-Chat。


按照Meta提供的报告数据显示,基座模型Llama 2似乎强大到已经超越GPT3,而经过微调的聊天模型也可以与 ChatGPT3.5媲美了。这可以算是开源模型中的一次巨大飞跃,也对那些闭源模型服务商的一次沉重打击。


开源的Llama 2模型就完全可以为大多数计划搭开源便车的公司用更低的成本,更高的效率来提供更多的可定制性应用。这绝对是很多中小型技术服务公司的开源福利。


既然Meta公司打着开源的口号,自然能会引起开源界的好奇,他们的Llama 2又到底用了一个什么样的开源许可协议呢?


于是有人去探究了一下他们的许可证,没想到Llama2和最初开源的Llama 1竟然完全不同。如果说Llama1用的GPLv3开源许可协议算是严格意义上的开源,那么这次Llama2的开源许可证就被悄悄替换成了一个自定义的商业开源许可证。


Llama 2虽然在宣传上是开源,但Meta在提供代码开源的同时,另外附加了好多限制条件。比较关键的是以下两条:


1) Llama2开源模型不得用于月活MAU大于7亿的产品或服务平台,除非获得Meta公司的批准和授权;

2) Llama2开源模型不得以任何违反适用法律或法规(包括贸易合规法)的方式使用。同时不适用于除英语以外的语言中使用。


这第一条限制就是有目标的限制了像Twitter这样的竞争对手,不过自信如马斯克应该也不屑于去使用。第二条限制就是要求新模型只在英语环境下用。这项限制的目的其实就不言自明了。

所以,Meta高调官宣的开源其实并非是一次严格意义上的开源。也和开源软件促进联盟(OSI)的开源十条标准是违背的。用多年开源经验的开源老兵林旅强(Richard)在他上周一个朋友圈的话来说,“一个开源,各自表述。



无论从哪个角度,Meta用自己的方式来完全定制的自己的许可证条款完全无可厚非,毕竟这是他们自己的代码,他们有自己的自由和选择。但对于那些原本坚持开源协议就应当遵循OSI开源标准开源卫道者们来说,就不啻于是一次打击。因为这无异于是商业公司的开源策略和OSI开源标准的又一次分道扬镳。

如今Meta一方面希望借助开源赶超对手,另一方面为了保护自己的商业利益,和当年MongoDB、ElasticSearch为了应付来自公有云厂商的市场竞争而将原先各自的开源协议改成了自定义的SSPL许可协议所采取的策略如出一辙,Llama 2就自定义了一个自己的许可协议。

黑格尔说,凡是存在的都必有其合理性,凡是合理的就必将存在。与其说,这是和OSI所倡导的开源精神背道而驰,不如说是这是在现实市场环境下的开源进化。而且,在未来开源大模型推陈出新的世界中,「开源」的事实定义也大概率会被慢慢改写。


对于开源可以给Meta带来的价值,扎克伯格在Facebook上发表了一篇文章写道:“开源推动创新,因为它可以使更多开发者能够利用新技术进行构建。同时,这也提高了安全性和保障,因为当软件是开放的时候,更多人可以审查并修复潜在问题。”

简单概括一下扎克伯格上面的讲述,就是两点:
1)开源有利于企业创新;
2)开源有利于提高代码质量。

早在二十多年前,埃里克·雷蒙德在《魔法锅》一中就具有远见性地指出了:开放源码实际可以作为企业竞争战略的武器。实际上,开源可以企业带来的优势绝对也不止于扎克伯格提到的这两点。还可以有如下更多方面:

1. 降本:通过开源社区吸引更多开发者协同开发,降低企业研发成本;
2. 获客:通过社区的宣传和免费使用,吸引或获得更多用户;
3. 招募:在开源社区内人才的聚集后更容易招募到企业所需的研发人才;
4. 竞争:重置市场竞争,打破领先者优势;
5. 标准:通过核心代码贡献,获取社区话语权,成为某一技术标准的主导者;
6. 品宣:同说过社区,扩大技术影响力,进行企业品牌形象宣传;
7.价值战略:通过开源,把组织战略建成真正以开放为核心价值观的企业战略;

虽然扎克伯格说自己对Llama的开源是为了提高创新和改善代码质量,但从开源对企业的价值分析来看,Meta在Llama上的开源显然隐藏了另一个更重要的目标:就是利用开源来和其他更强大对手进行竞争。在AIGC赛道上,OpenAI无可争议地获得了先发优势而且获得了领先地位,其他各科技大厂无一不想在这个巨大的潜力市场上赶超。与其他公司发布严格保密的专有模型不同,Meta公司大胆地公开了LlamA 2背后的代码和数据,使全球的研究人员能够构建和改进这项技术,其实就是希望借助开源的力量和文化来创造奇迹。

那么,开源又何德何能,能让Meta这样的公司也愿意用开源策略来和竞争对手们在AIGC赛道上放手一搏?我们实在是很有必要来看看开源在企业价值体系中的底层逻辑的真相。


虽然每个开源项目的创建有着不同的背景情况,传统上,无论是开源项目的创始团队、风险投资者,行业观察者,资本市场等各方,大多会习惯于沿用一般技术型企业的价值衡量指标和估值方式去看待这个项目或其所在商业企业的潜力和估值。即使他们考虑了开源的所带来的积极影响,但最多也就是将这些因素再映射到对于商业产品或服务业务的指标上。最后各方看到的是这个项目所在企业的商业估值作为项目和企业的市场价值。


但以笔者对开源的观察和研究来看,实际上这样的方式是片面和局部的,也是不科学的。一个传统的创业项目往往只对应一项商业产品。但对于开源,如果仔细想一下,我们实际上可以看到:在一个开源项目的生命周期中,一个开源项目对应的将不只是一项在开源上衍生的商业产品或服务,而是在三个不同维度下且不同性质和类别的产物

如下所示:
1)一项或几项基于开源项目衍生的企业产品或者服务;
2)一个开源代码库,我们也如今可以称数字公共品;
3)一个基于开源项目和开源社区的社会网络关系。
这三个产物,虽然皆因开源代码而产生和相互关联,也存在一定的依赖关系,但三者是相互独立的。一个开源项目,一旦创建,开源项目中的代码,社区和企业实际有着自己的形态和生命周期,各自承载着完全不同的使命和目标。

如果我们将一个开源项目的整个生态价值最后仅是简单粗暴的统一在企业产品或服务价值上,这是有失偏颇的。一个优秀的开源代码库未必能孵化出成功的企业产品。一个优秀的企业也未必能产生一个成功的开源社区。所以,当我们在评估一个开源项目或者开源企业的价值时,我们不能忽略开源社区作为社会网络关系的独立价值;我们更不能忽略开源代码作为数字公共品的独立价值。


事实上,开源社区为企业所构建的社会网络关系可以成为企业的一项新型社会资本,进而提升企业的商业价值。而开源作为数字公共品帮助企业产生的社会责任和可持续发展价值(在这里我们简称“ESG价值”)更是成为了当今资本市场对企业商业价值判定的一个热点。

基于此,对于一个开源企业的商业价值判定,我们不应当再囿于以往资本市场估值模式-简单的依靠产品的技术和市场潜力,而应当加入开源项目可以给企业所扩展出来的社会资本价值以及ESG价值。即一个开源企业的新价值可以用如下公式来表达:

开源企业价值 = 传统商业估值 + 社会资本价值 + 数字公共品ESG价值

一个企业的价值原来普遍意义上讨论的是人才,技术,资金,市场。而开源实际上为企业价值的创造开拓了新的领域和维度:开源代码所进入的数字公共品领域,开源社区创造的社会网络所产生的社会资本价值。



关于开源给企业所带来的企业社会资本,需要注意的第一个点是,我们这里所指出的社会资本并不是指马克思所认为的那些和私人资本相对应的集团资本,包括股份资本和国家资本。而是指个体或团体之间的关联——社会网络、互惠性规范和由此产生的信任,是人们在社会结构中所处的位置给他们带来的资源,它是一种社会网络关系。


社会资本的知名研究者Coleman认为社会资本存在于网络中的节点之间的连线间。如果人力资本的连接在节点,那么社会资本则属于节点之间的线段一个企业传统意义上的社会资本是来自于家族网络,政府网络,商圈网络,科研网络,和校友网络等,企业可以通过这样些外部的关系网络可以用较低的成本获取一些自身缺乏的重要资源能力。如今开源,则给开源的企业创造了一种新型的社会网络关系-开源社区网络。这是属于开源的企业所独有的一个崭新和独特的网络,相比其他闭源的企业,提供开源项目的企业则就因此具备了更多的社会资本价值,进而构建出更大的竞争优势。


一般来说。有价值的社会资本可以提供政策支持,金融支持,管理支持,人才支持,技术支持和其他特殊的资源。所以,我们在前面提到的开源对企业的价值中很大一部分时来自于开源社区为企业创造出的社会资本所带来的。如降本,增效,人才招募,技术创新等都实际上开源社区网络关系的所带来的社会资本在企业促进成长的路径和手段。这些本质上都是社会资本的产物,而非其他。


ESG是对公司的可持续性和社会影响的量化衡量,是在联合国倡导的可持续发展和社会责任的理念下发展出来的一项指标。2004年,联合国环境规划署首次提出这个概念,ESG分别代表Environmental (环境)、Social (社会)和 Governance(治理),其核心就是关注环境、社会、治理问题。随着ESG被社会各界的重视,近年来ESG更成为了金融市场的重要投资理念和企业行动指南,已经被用作评判一个企业投资潜力的重要量化指标。联合国作为人类可持续发展的推动者,也在不断把开源代码和开源软件逐步纳入到可持续发展目标中。


恰好,今天是阿里集团的年度财报日,阿里同时随之公布了2023年的ESG报告。在关于2023财年的ESG核心议题和亮点上,他们把“让技术更可得”作为了阿里集团的一项目标和成果。在报告中,阿里是这样阐述的:


”我们是开源技术和技术开放生态坚定的信仰者和推动者,并且是中国最大开源技术社区的建设者和支持者。“


可以看到,阿里集团把开源贡献被纳入到集团的发展ESG战略中,实际上是除了满足企业自身的技术研发需要之外,也是把开源看作为帮助企业满足ESG指标的需要并以此来强化企业的社会责任和对可持续发展目标的追求。


所以,通过开源的数字公共品输出能力。开源也成为了企业资本市场价值的提升手段。


综上,经过我们对开源的一番底层逻辑分析过后,就可以看到Meta对于Llama大语言模型的开源,无论其是在Llama 1上用GPLv3进行严格意义的开源,还是在Llama 2上用自定义的商业开源许可证的泛开源,实际上都是在使用开源带来的ESG价值和社会资本价值来构建自己和其他对手的竞争战略。


在一个开源项目下,如果缺失了对于数字公共品和社会网络关系的价值衡量,私以为,对开源企业价值及企业的市场影响力评估是不恰当的。而在未来,无论是对开源的创业者,还是开源的投资者来说,把开源置于社会资本价值和ESG价值体系框架下的价值再认识和估值重构,则无疑是一个值得思考和研究的方向。


作者丨狄安

编辑丨罗蕊艳


相关阅读 | Related Reading


来了!7月30日KCC杭州站成立仪式暨首场线下读书会活动诚邀您的参加!

KCC@Singapore 助力 AI & GPT 应用创新 Hackathon,最后4天,赢$26000奖金!


开源社简介

开源社成立于 2014 年,是由志愿贡献于开源事业的个人成员,依 “贡献、共识、共治” 原则所组成,始终维持厂商中立、公益、非营利的特点,是最早以 “开源治理、国际接轨、社区发展、项目孵化” 为使命的开源社区联合体。开源社积极与支持开源的社区、企业以及政府相关单位紧密合作,以 “立足中国、贡献全球” 为愿景,旨在共创健康可持续发展的开源生态,推动中国开源社区成为全球开源体系的积极参与及贡献者。


2017 年,开源社转型为完全由个人成员组成,参照 ASF 等国际顶级开源基金会的治理模式运作。近九年来,链接了数万名开源人,集聚了上千名社区成员及志愿者、海内外数百位讲师,合作了数百家赞助、媒体、社区伙伴。





本文分享自微信公众号 - 开源社KAIYUANSHE(kaiyuanshe)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
0
分享
AI总结
返回顶部
顶部