国产大模型新标杆!比肩GPT4,DeepSeek V2重磅升级

07/02 18:10
阅读数 546

近日,深度求索团队更新了DeepSeek-V2模型,新版本DeepSeek-V2-Chat模型推理能力有了极大提升。尤其在数学解题、逻辑推理、编程、指令跟随、Json格式输出不同维度上,最高有16%的性能提升。
在Arena-Hard测评中,DeepSeek-V2-Chat与GPT-4-0314的对战胜率从41.6%提升到了68.3%。DeepSeek-V2-Chat模型的角色扮演能力显著增强,可以在对话中按要求扮演不同角色。
此外,深度求索团队对DeepSeek-V2-Chat的“system”区域指令跟随能力进行了优化,显著增强了沉浸式翻译、RAG 等任务的用户体验。
短短半年,深度求索团队的进步堪称神速。
今年1月,他们开源了国内首个MoE模型,随后在5月初发布了最强开源MoE模型DeepSeek-V2,6月中旬,他们发布了代码生成能力超越GPT4-Turbo的DeepSeek Coder V2。
这一次,DeepSeek-V2-Chat在各方面或比肩GPT4,至少是国产大模型的新标杆。
据官方此前介绍,DeepSeek-V2系列模型采用了全新的模型结构。DeepSeek V2没有沿用主流的“类LLaMA的Dense结构”和“类Mistral的Sparse结构”,而是对模型框架进行了全方位的创新,提出了媲美MHA的MLA(Multi-head Latent Attention)架构,大幅减少计算量和推理显存;自研Sparse结构DeepSeekMoE进一步将计算量降低到极致,两者结合最终实现模型性能跨级别的提升。

(DeepSeek-V2与其他大模型的效果对比)
一如既往,大模型API平台SiliconCloud第一时间上线了推理加速版DeepSeek-V2-Chat。

新用户送2000万Token,快试试吧:
https://cloud.siliconflow.cn/models/text/chat/17885302520
在SiliconCloud上,DeepSeek-V2-Chat的输出在50tokens/s左右,速度飞快。
写一道简单的代码题,感受一下DeepSeek-V2-Chat的输出:
再问一道数学题:
除了DeepSeek-V2-Chat,SiliconCloud已上架包括DeepSeek-Coder-V2Stable Diffusion 3 MediumQwen2GLM-4-9B-Chat、SDXL、InstantID在内的多种开源大语言模型、图片生成模型与代码生成模型。
其中,Qwen(7B)、GLM4(9B)等多个大模型API免费使用,让开发者与产品经理无需担心研发阶段和大规模推广所带来的算力成本,实现“Token 自由”。
作为集合顶尖大模型的一站式云服务平台,SiliconCloud为开发者提供更快、更便宜、更全面、体验更丝滑的模型API。
SiliconCloud支持用户自由切换符合不同应用场景的模型,同时提供开箱即用的大模型推理加速服务,为生成式AI应用带来更高效的用户体验。
欢迎来玩儿:

cloud.siliconflow.cn/s/deepseek_v2_new

其他人都在看


开发AI超级应用,减少响应时间,就用SiliconCloud

更快、更便宜、更全面、体验更丝滑的大模型API

扫码加入用户交流群

本文分享自微信公众号 - OneFlow(OneFlowTechnology)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部