加载中
SynGrasp-1B:全球首个十亿帧机器人抓取数据集,助力零样本泛化和少样本适应.

2025-05-06, 由Galbot、北京大学、香港大学和北京人工智能研究院联合创建的SynGrasp-1B数据集,是全球首个十亿帧的机器人抓取数据集,其意义在于为机器人抓取任务提供了一个大规模的合成动作...

AMO数据集:解决运动模仿偏差的超灵巧人形机器人全身控制混合数据集。

2025-05-07,由加州大学圣地亚哥分校创建了 Adaptive Motion Optimization (AMO) 数据集,该数据集通过结合运动捕捉数据和概率采样的躯干姿态,生成全身参考动作,以解决运动模仿强化学习中的...

FoMo 数据集是一个专注于机器人在季节性积雪变化环境中的导航数据集,记录了不同季节(无雪、浅雪、深雪)下的传感器数据和轨迹信息。

2025-05-02,由加拿大拉瓦尔大学北方机器人实验室和多伦多大学机器人研究所联合创建的 FoMo 数据集,目的是研究机器人在季节性积雪变化环境中的导航能力。该数据集的意义在于填补了机器人在极...

WORFBENCH:一个创新的评估基准,目的是全面测试大型语言模型在生成复杂工作流 方面的性能。

2024-10-10,由浙江大学和阿里巴巴集团联合创建的WORFBENCH,一个用于评估大型语言模型(LLMs)生成工作流能力的基准测试。它包含了一系列的测试和评估协议,用于量化和分析LLMs在处理复杂任务...

MT-Pref数据集:包含18种语言的18k实例,涵盖多个领域。实验表明它能有效提升Tower模型在WMT23和FLORES基准测试中的翻译质量。

2024-10-10,由电信研究所、里斯本大学等联合创建MT-Pref数据集,它包含18种语言方向的18k实例,覆盖了2022年后的多个领域文本。通过在WMT23和FLORES基准测试上的实验,我们展示了使用MT-Pr...

Multi-class Surgical Anatomy :一个通过解剖学感知的扩散模型合成的多类别手术数据集,包含了详细的解剖标注,用于提高手术场景的理解能力。

2024-10-10,由德国NCT/UCC Dresden、DKFZ Heidelberg等机构联合创建Multi-class Surgical Anatomy Dataset,通过使用解剖学感知的扩散模型,有效地解决了在生成过程中保持器官结构和纹理的挑...

最经典 无人机 数据集

在现代科技的浪潮中,无人机技术就像一颗闪亮的星星,吸引了全球的目光。它们不仅在物流、农业、环境监测和灾害救援等领域大显身手,还为商业世界带来了无限可能。然而,随着无人机的数量不断...

Alberta Wells数据集:首个包含超过213,000个油气井的大规模高质量基准数据集,它们是温室气体和其他污染物的重要来源,助力环境监测与气候变化。

2024-10-11,由Mila – Quebec AI Institute和McGill University等机构创建了首个大规模油井检测数据集,这个数据集的意义在于提供了一个工具,能够通过卫星图像识别和定位全球数以百万计的废...

2024最新 无人机 数据集(12-06已更新)

一、无人机的研究背景 无人机技术的发展经历了从最初的遥控靶机到现代多功能无人机的转变。随着电子技术、通信技术、导航技术以及人工智能技术的进步,无人机的性能得到了显著提升,应用领域...

HazyDet数据集:包含 383,000 雾霾场景中基于无人机的目标检测设计的大规模数据集

2024-09-30,由中国人民解放军陆军工程大学、南开大学、南京邮电大学和南京理工大学的研究人员联合创建了HazyDet数据集,目的解决无人机在恶劣天气条件下的环境感知问题。这个数据集的推出,...

PDT 数据集:首个基于无人机的高精密度树木病虫害目标检测数据集

2024-09-24,由中国山东计算机科学中心、北京大学等机构联合创建了Pests and Diseases Tree(PDT)数据集,目的解决农业领域中病虫害检测模型开发中专业数据集缺失的问题。通过集成公共数据和...

最全肺癌数据集 (2025-03-25)

恶性肿瘤其实就是癌症的一种,它是由一些不正常的细胞组成的,这些细胞会不停地生长和繁殖,而且它们还会侵犯周围的正常组织,甚至通过血液和淋巴系统跑到身体其他部位去。 恶性肿瘤有以下几...

KinDEL数据集:包含8100万个小分子的库,为激酶抑制剂的发现提供了一个丰富且功能强大的资源。

2024-10-12,在药物发现领域,Insitro公司创建了KinDEL,一个针对两个激酶靶点(MAPK14和DDR1)的大规模、公开可用的DNA编码库数据集。这个数据集不仅推动了计算技术的发展,还通过不同的机器...

最全 中文对话 数据集(不定期更新)

随着人工智能技术的发展,自然语言处理(NLP)领域中的对话系统逐渐成为研究的热点。为了提升对话系统的性能,需要大量的高质量对话数据来训练和优化模型。然而,中文对话数据相对于英文来说...

AgentHarm:一个包含110个明确恶意任务(增强后共440个)的基准测试,覆盖11个伤害类别,目的评估LLM代理在遭受攻击后是否仍能完成多步骤任务,同时衡量其对有害请求的拒绝能力。

2024-10-12,由Gray Swan AI和UK AI Safety Institute共同创建了AgentHarm,这是一个开创性的基准测试,目的衡量大型语言模型(LLM)代理执行有害任务的倾向和能力。这个数据集不仅覆盖了广泛...

最全乳腺癌数据集 (11-24已更新)

恶性肿瘤其实就是癌症的一种,它是由一些不正常的细胞组成的,这些细胞会不停地生长和繁殖,而且它们还会侵犯周围的正常组织,甚至通过血液和淋巴系统跑到身体其他部位去。 恶性肿瘤有以下几...

TemporalBench:一个专注于细粒度时间理解的多模态视频理解的新基准。

2024-10-15,由威斯康星大学麦迪逊分校、微软研究院雷德蒙德等机构联合创建了TemporalBench,它通过大约10K个视频问答对,提供了一个独特的测试平台,用以评估各种时间理解和推理能力,如动作...

PreCT-160K数据集:包含160K个CT体积的大规模医学图像预训练数据集,覆盖了100多种解剖结构。迄今为止最大规模的医学图像预训练数据集

2024-10-08,由香港科技大学的计算机科学与工程系创建了PreCT-160K,这是迄今为止最大规模的医学图像预训练数据集。该数据集包含了160K个CT体积,覆盖了100多种解剖结构,对于推动医学图像分...

LongMemEval:一个包含500个精心设计问题的综合基准测试,用于评估聊天助手在信息提取、跨会话推理、时间推理、知识更新和适当放弃回答方面的长期记忆能力。

2024-10-15,由加州大学洛杉矶分校(UCLA)和腾讯AI实验室西雅图团队联合创建了LongMemEval,一个全面评估聊天助手在长期交互中的记忆力基准测试。 一、研究背景: 近年来,大型语言模型驱动...

结直肠癌数据集(不定期更新)

恶性肿瘤其实就是癌症的一种,它是由一些不正常的细胞组成的,这些细胞会不停地生长和繁殖,而且它们还会侵犯周围的正常组织,甚至通过血液和淋巴系统跑到身体其他部位去。 恶性肿瘤有以下几...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部