加载中
2022 全球 AI 模型周报

本周介绍了 5 个计算机视觉领域的深度学习模型: 动作识别框架新范式 STRM, 智能计数重复动作新基准 TransRAC,高效且可拓展的注意力机制 MaxViT,新型图像检索网络 CVNet,文本与视觉专家联...

08/12 16:00
8
邀请函|2022 智能云边开源峰会

2022年8月19日至20日,VMware 将联合多位 ACE 智能云边共创生态(ACE Co-innovation Ecosystem)合作伙伴共同在线上举办 2022 智能云边开源峰会(2022 Open Source AceCon)。 议题亮点: 来...

08/10 19:00
0
谁说 Python 搞不定 AI 模型微服务?!Towhee 来了!

作者 | 郭人通 “从用 Python 定义流水线,到生成 Docker 镜像,再到启动服务并调用执行,一共不到 30 行代码!?” 想要模型落地,有一连串大坑躲都躲不开: 模型转不了 ONNX,TensorRT。 ...

08/10 19:00
0
2022 全球 AI 模型周报

本周介绍 5 个计算机视觉领域的深度学习模型:多尺度视觉模型 MViT, 能够处理更大图像的 Swin Transformer V2, 全能型多模态模型 CoCa, 端到端的视频语言学习 Violet, 实现视频理解大一统的 ...

08/06 12:30
15
2022 第四周全球 AI 模型周报

本周继续介绍 5 个计算机视觉领域的深度学习模型: 多尺度视觉模型 MViT, 能够处理更大图像的 Swin Transformer V2, 全能型多模态模型 CoCa, 端到端的视频语言学习 Violet, 实现视频理解大一...

08/05 16:30
5
Zilliz 2023 秋季校园招聘正式启动!

Zilliz 是向量数据库系统领域的开拓者和全球领先者,研发面向 AI 生产系统的向量数据库系统。Zilliz 以发掘非结构化数据价值为使命,致力于打造面向 AI 应用的新一代数据库技术,帮助企业便捷...

08/02 19:10
13
Towhee 每周模型

本周将继续推荐5个视频领域的SoTA模型: MPViT 通过多嵌入和多路径探索多种视觉任务、 BridgeFormer 利用别样的选择题训练方式加速视频文本检索、 SVT 用自蒸馏让视觉 Transformer 训练摆脱对...

07/29 19:21
7
Towhee 每周模型

本周将继续推荐5个视频领域的 SoTA 模型: MPViT 通过多嵌入和多路径探索多种视觉任务、 BridgeFormer 利用别样的选择题训练方式加速视频文本检索、 SVT 用自蒸馏让视觉 Transformer 训练摆脱...

07/29 19:05
0
【直播预约】数据架构演进下的新挑战——上海站

2022/7/30 Data Everywhere 系列活动-上海站 数据架构演进下的新挑战 云时代的大数据,正在以超乎我们想象的速度发展着。从过去的 Hive, Spark, 到现在的 Flink, ClickHouse, Iceberg 等,不...

07/27 19:00
7
搭建自己的以图搜图系统 (一):10 行代码搞定以图搜图

目前市面上有很多以图搜图的服务,如 Google 识图,百度图片搜索,淘宝拍立淘等。本文将介绍如何快速搭建自己的图片搜索引擎,只要 10 行 Python 代码就能轻松搞定! import towhee towhee.r...

07/27 19:00
1.8K
砺夏行动|源启数字化:既有模式,还是开源创新?

百年变局与世纪疫情交织叠加,不确定性增加。“产生混乱时最大的危险不是混乱本身,而是人们按照过去的逻辑行事”(德鲁克,1992)。有人会责怪命运不济,而智慧的人则认为这会是个千载难逢的...

07/22 19:00
6
Towhee 每周模型

周报出品人:Towhee 技术团队 本周我们分享 5 个视频相关的 AI 模型: 轻便好用的视频动作识别模型系列 MoViNets、实现文本与视频跨模态搜索的 CLIP4Clip、比 CLIP4Clip 更好的视频检索模型 ...

07/22 11:51
38
多模态模型 CLIP4Clip 带你实现文本与视频互搜

出品人:Towhee 技术团队 CLIP4Clip 以跨模态图文模型 CLIP 为基础,成功地实现了文字/视频检索任务。无论是由文字寻找相关内容视频,还是自动为视频匹配最合适的描述,CLIP4Clip 都能帮你做...

07/19 17:02
57
MoViNets系列模型,手机端实时分类视频的好帮手

出品人: Towhee 技术团队 需要视频理解,但是嫌模型太重、耗时太久?轻量动作识别模型再次升级, 由谷歌研究院在2021年提出的 MoViNets 系列能够更加高效地在现推理流媒体视频,并支持实施分...

Towhee 每日模型周报

本周一共介绍了 5 个视频相关的模型:“杂食者” Omnivore、“性价比之王” TSM、“进击的纯血” TimeSformer、“回归的高手” Video Swin Tranformer、“国产之光” UniFormer。 无论是崛起...

07/15 19:00
36
国产之光!高分时空表征学习模型 UniFormer

出品人:Towhee 技术团队 由中科院、国科大、上海人工智能实验室、商汤、香港中文大学几大高手联合出品,SoTA 模型 UniFormer (UNIFIED TRANSFORMER) 在主流数据集上都取得了优秀的成绩:在 ...

07/15 11:07
21
ICCV 2021 的最佳论文模型 Swin Transformer 终于对视频下手了!

出品人:Towhee 技术团队 在去年 Swin Transformer 获得 ICCV 2021 最佳论文后,微软亚洲研究院又在今年推出了视频领域的佳作 Video Swin Transformer 。**Video Swin Transformer 模型在 CV...

07/14 17:10
23
TimeSformer: 只靠 Transformer 就能理解视频?注意力机制的又一次进击!

出品人:Towhee 技术团队 Facebook AI 提出了一种 TimeSformer(Time-Space transformer)的视频理解新架构,完全基于Transformer,能够彻底摆脱 CNN!仅用三分之一的时间训练,TimeSformer...

07/14 10:41
31
高性价比模型 TSM,用 2D 的成本达到 3D 的效果

出品人:Towhee 技术团队 MIT 和 IBM Watson AI Lab 联合提出一种高效的视频理解模型 TSM(Temporal Shift Module),在保留 2D 效率的同时,通过时间位移模拟 3D 建模提高模型性能。以往的模...

07/14 10:38
28
图像、视频、3D 数据一把抓,不挑食的 AI 模型 Omnivore !

出品人:Towhee 技术团队 厌烦了不同数据要用不同的模型?是否想过用一个模型就能处理不同模态的数据?终于,在 2022 年初 Meta AI 推出了 “杂食者” Omnivore,一个模型搞定不同视觉模态数...

07/14 10:33
17

没有更多内容

加载失败,请刷新页面

返回顶部
顶部