连击 天
fork: star:
DeepSeek模型火爆全球,但无数国内开发者却在下载模型时苦不堪言,吐槽下载就像“用2G网下高清电影”。某大厂工程师反馈,从外网下载DeepSeek-R1模型,速度仅为2MB/s,断线重连的操作更是让人...
兴冲冲准备好了部署DeepSeek 开始下模型权重了,结果...What! 下载速度慢到崩溃 有的才1-2MB/s,还多次中断!!! 下载稍大一点的模型怎么办? 别担心,魔乐社区来帮你! 带你体验超100MB/s的下...
在人工智能蓬勃发展的时代,国产模型不断涌现且能力越来越强。前有DeepSeek-V3,凭借卓越性能和高性价比迅速火遍全球。紧随其后,2025年1月15日,上海人工智能实验室对书生大模型进行了重要版...
1 简介 DeepSeek是由 深度求索 团队开发的大语言模型,本实验将基于deepseek-llm-7b-chat模型,在EmoLLM数据集进行微调,实现大模型能够以心理医生的口吻来回答我们的问题。 本实验基于trans...
1 简介 在大模型的微调过程中,**LoRA(低秩适配)**参数设置是提升训练效率和性能的关键。通过减少需更新的参数量,LoRA能够在维持模型性能的同时显著降低计算成本。 然而,LoRA并非唯一影响...
近日,业界知名IT垂直门户媒体IT168及旗下技术社区ITPUB联合发布2024年度“技术卓越奖”榜单。经过层层评选,魔乐社区荣获云计算类“年度开源卓越贡献奖”奖项。该奖项的获得,再一次证明了魔...
12月16日,无问芯穹宣布正式开源无问芯穹端侧解决方案中的全模态理解小模型Megrez-3B-Omni和它的纯语言模型版本Megrez-3B-Instruct。目前模型已在魔乐社区同步首发,欢迎大家来魔乐社区体验!...
要说最近一两周AIGC领域最被关注的内容,非Suno AI莫属。 作为“音乐界的ChatGPT”,Suno AI最新推出的V3模型以其生成广播质量级别音乐的非凡能力火速引爆了音乐圈,网友们也纷开始放飞自我,...
没有更多内容
加载失败,请刷新页面
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复