加载中
为什么 AI 模型离科学革命还差得很远?

作者:Thomas Wolf, Hugging Face 联合创始人和首席科学家 发布日期:2025 年 2 月 26 日 原文链接:🔭 The Einstein AI modelhttps://thomwolf.io/blog/scientific-ai.htm 几天前,我在一...

常见的 AI 模型格式

来源:https://blog.ngxson.com/common-ai-model-formats 过去两年,开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在Hugging Face上发布,并被用于实际应用中。然而,...

SmolVLM2: 让视频理解能力触手可及

一句话总结: SmolVLM 现已具备更强的视觉理解能力📺 SmolVLM2 标志着视频理解技术的根本性转变——从依赖海量计算资源的巨型模型,转向可在任何设备运行的轻量级模型。我们的目标很简单: 让...

社区供稿 | 阶跃星辰 Step-Video-TI2V 图生视频模型开源,运动可控,动漫效果尤佳!

在今年 2 月,阶跃星辰开源了两款 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型,为开源社区贡献了自己的多模态力量。 今天,我们再接再厉,继续开源图生视...

在 Hugging Face Spaces 上使用 Gradio 免费运行 ComfyUI 工作流

简介 在本教程中,我将逐步指导如何将一个复杂的 ComfyUI 工作流转换为一个简单的 Gradio 应用程序,并讲解如何将其部署在 Hugging Face Spaces 的 ZeroGPU 无服务器架构上,这样可以让它以无...

在 Hugging Face 上部署语音转语音模型

介绍 S2S (语音到语音)是 Hugging Face 社区内存在的一个令人兴奋的新项目,它结合了多种先进的模型,创造出几乎天衣无缝的体验: 你输入语音,系统会用合成的声音进行回复。https://github....

LayerSkip: 使用自推测解码加速大模型推理

自推测解码是一种新颖的文本生成方法,它结合了推测解码 (Speculative Decoding) 的优势和大语言模型 (LLM) 的提前退出 (Early Exit) 机制。该方法出自论文LayerSkip: Enabling Early-Exit ...

社区供稿 | Hugging Face 又出新教程啦!手把手教你构建 DeepSeek-R1 推理模型

Hugging Face 又出新教程啦!手把手教你构建 DeepSeek-R1 推理模型,笔者第一时间进行了学习,下面是整理的课程内容 课程链接:https://hf.co/learn/nlp-course/en/chapter12/1?fw=pt 推理大...

从文件到块: 提高 Hugging Face 存储效率

Hugging Face 在Git LFS 仓库中存储了超过30 PB 的模型、数据集和 Spaces。由于 Git 在文件级别进行存储和版本控制,任何文件的修改都需要重新上传整个文件。这在 Hub 上会产生高昂的成本,因...

让 LLM 来评判 | 设计你自己的评估 prompt

这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 通用 prompt 设计建议 我总结...

社区供稿 | 阿里国际 Ovis2 系列模型开源: 多模态大语言模型的新突破

背景 Ovis是阿里巴巴国际化团队提出的新型多模态大模型架构,通过巧妙地将视觉和文本嵌入进行结构化对齐,为解决模态间嵌入策略差异这一局限性提供了方案。Ovis2作为Ovis系列模型的最新版本,...

AI 艺术工具通讯

创刊号 🎉 AI 领域的发展速度令人惊叹,回想一年前我们还在为生成正确手指数量的人像而苦苦挣扎的场景,恍如隔世 😂。 过去两年对开源模型和艺术创作工具而言具有里程碑意义。创意表达的...

社区供稿 | 阶跃星辰开源系列 SOTA 多模态模型,技术详解

一直以来,阶跃星辰围绕实现 AGI 的终极目标,坚定投入,持续打造更全面、更强大的通用基座模型。我们深知 AGI 的实现离不开全球开发者的共同努力。因此开源的初心,是希望跟大家分享最新的技...

让 LLM 来评判 | 奖励模型相关内容

这是 让 LLM 来评判 系列文章的第五篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么是奖励模型? 奖励模型通...

上海站 | 2025 Seeed x LeRobot 具身智能黑客松报名开启!

欢迎来到 Physical AI 的最前沿!Seeed x LeRobot 具身智能黑客松现邀请所有对在机器人领域训练模仿学习策略,并实时进行推理部署感兴趣的人,共同创造具有影响力的创新解决方案。在这里,你...

让 LLM 来评判 | 评估你的评估结果

这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 在生产中或大规模使用 LLM ...

🐍 灵蛇献智,“蛇”我其谁 🤖

🐍 灵蛇献智,“蛇”我其谁 🤖 , , ,

社区供稿 | “迷你版”书生·万象大模型开源,5% 参数实现九成性能,“小而美”易迁移

书生·万象 (InternVL) 多模态大模型迎来“迷你版”。 近日,上海人工智能实验室 (上海 AI 实验室) 与清华大学等联合团队推出 Mini-InternVL 多模态大模型,包括 1B、2B 和 4B 三个参数版本,...

社区供稿 | MME-Finance: 专家级理解和推理的多模态金融基准

MME-Finance: 专家级理解和推理的多模态金融基准 1 研究背景 金融领域首个多模态基准正式发布!近年来,多模态基准在通用领域的迅速发展为多模态模型的进步提供了强大助力。然而,金融领域具...

社区供稿 | ReaderLM v2: HTML 转 Markdown 和 JSON 的前沿小型语言模型

2024 年 4 月,我们发布了 Jina Reader (https://jina.ai/reader),这是一个非常实用的 API,用户只需在 URL 前添加 r.jina.ai 前缀,就能将任何网页转换为大模型友好的 Markdown。紧接着,在...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部