文档章节

推荐丨10个高质量计算机视觉项目数据集

Gaikikii
 Gaikikii
发布于 01/08 15:05
字数 1358
阅读 72
收藏 0

计算机视觉正在加速行业中几乎每个领域的发展。 在计算机视觉技术的帮助下,组织正在彻底改变机器以前的工作方式。 现在,全球各地的大型技术都在利用计算机视觉技术领域,例如医疗保健和自动驾驶等。 为了建立强大的计算机视觉深度学习模型,必须在训练阶段应用高质量的数据集。

在本文中,我们将列出10个可用于Computer Vision项目的高质量数据集。

1 | CIFAR-10

CIFAR-10是Alex Krizhevsky,Vinod Nair和Geoffrey Hinton收集的一种流行的计算机视觉数据集。 该数据集用于对象识别,由10类60,000张32×32彩色图像组成,每类6,000张图像。 它分为五个训练批次和一个测试批次,每个批次具有10,000张图像,这意味着有50,000个训练图像和10,000个测试图像。

2 | Cityscapes

Cityscapes是Computer Vision项目的开源大规模数据集,其中包含来自50个不同城市的街道场景中记录的各种立体视频序列。它包括5,000个帧的高质量像素级注释,以及20,000个弱注释帧的较大集合。 该数据集主要用于训练深度神经网络和评估视觉算法对语义城市场景理解的主要任务的性能。

3 | Fashion MNIST

Fashion-MNIST是用于Computer Vision的图像数据集,包含60,000个示例的训练集和10,000个示例的测试集。 在此数据集中,每个示例都是一个28×28灰度图像,与来自10个类别的标签关联。 有一个基于Scikit-learn的自动基准测试系统,该系统涵盖129个具有不同参数的分类器。

4 | ImageNet

ImageNet是计算机视觉项目最受欢迎的数据集之一,它提供了一个可访问的图像数据库,该数据库根据WordNet层次结构进行组织。WordNet中有超过100,000个同义词集,其中ImageNet提供平均1,000个图像来说明WordNet中的每个同义词集。 它为WordNet层次结构中的大多数概念提供了数千万个干净排序的图像。

5| IMDB-Wiki Dataset

IMDB-Wiki数据集是使用性别和年龄标签进行训练的最大的开放式人脸图像数据集之一。此数据集中总共有523,051张面部图像,其中从IMDB的20,284名名人和维基百科的62,328名名人获得了460,723张面部图像。

6 | Kinetics-700

Kinetics-700是YouTube视频URL的大规模高质量数据集,其中包括各种以人为中心的动作。 数据集包括大约650,000个视频剪辑,涵盖700个人类动作类,每个动作类至少包含600个视频剪辑。 在这里,每个剪辑持续约10秒钟,并标有一个类别。

7 | MS Coco

COntext中的COCO或Common Objects是大规模的对象检测,分割和字幕数据集。 数据集包含91个对象类型的照片,这些照片易于识别,并且在328k图像中总共有250万个带标签的实例。

8| MPII Human Pose Dataset

MPII Human Pose数据集用于评估关节式人体姿势估计。 该数据集包含约25K图像,其中包含超过4万名带注释的人体关节的人。 在这里,每张图片都是从YouTube视频中提取的,并带有未标注帧之前的an和an。 总体而言,数据集涵盖410种人类活动,并且每个图像都带有活动标签。

9| Open Images

此Open Images数据集是现有的最大的带有对象位置注释的数据集之一。 它由大约900万幅图像组成,这些图像带有图像级标签,对象边界框,对象分割蒙版和视觉关系。 数据集包含190万幅图像上600个对象类别的1600万个边界框。

10| The 20BN-something-something Dataset V2

20BN-Something-Something数据集是大量带有密集标签的视频剪辑的集合,这些视频剪辑向人们展示了人类对日常对象执行的预定义基本动作。 它是由大量的人群工作人员创建的,它允许ML模型对物理世界中发生的基本动作有更细致的了解。 视频总数包括220,847,其中168,913是训练集,24,777是验证集,27,157是测试集。

Model Play是面向全球开发者的AI模型资源平台,内置多样化AI模型,与钛灵AIX(一款集计算机视觉与智能语音交互两大核心功能为一体的人工智能硬件)结合,基于Google开源神经网络架构及算法,构建自主迁移学习功能,无需写代码,通过选择图片、定义模型和类别名称即可完成AI模型训练。

© 著作权归作者所有

Gaikikii
粉丝 0
博文 70
码字总数 125474
作品 0
海淀
私信 提问
加载中

评论(0)

腾讯又添 AI 开源项目!腾讯 AI Lab 开源业内最大规模多标签图像数据集

2018年9月10日,腾讯AI Lab宣布将于9月底开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。 该项...

腾讯开源
2018/09/10
73
0
谷歌又来造福AI学者了:数据增强也能自动化!

  深度神经网络是非常强大的机器学习系统,近年来在计算机视觉领域更是取得了极大的成功。不过,它的威力得以发挥,很大程度上要归功于庞大的有标注的训练数据集。一般来说,只要增加数据集...

DeepTech深科技
2018/06/09
0
0
免费送|19万高质量图片集开源,快来领!

  战赛历史作了总结。去年我们2016上海BOT大数据应用大赛计算机视觉赛也是精彩纷呈,围绕12种动物识别、零售渠道货架照片智能盘点、行车记录仪车外场景智能辨识等精心设计赛题,给参赛者提...

数愿大数据人工智能竞赛平台
2017/07/31
0
0
谷歌放大招!数据增强实现自动化

     来源:Google Research   作者:Ekin Dogus Cubuk & Barret Zoph   编辑:闻菲、克雷格   【新智元导读】谷歌研究人员最新提出了一种自动数据增强方法,受AutoML的启发,他们...

深度学习
2018/06/05
0
0
机器学习数据集的获取和测试集的构建方法

机器学习入门系列(2)--如何构建一个完整的机器学习项目的第二篇文章 上一篇机器学习入门系列(2)--如何构建一个完整的机器学习项目(一)介绍了开始一个机器学习项目需要明确的问题,比如当前...

材才才
2019/02/04
0
0

没有更多内容

加载失败,请刷新页面

加载更多

随机梯度下降

本文首发自公众号:RAIS,点击直接关注。 前言 本系列文章为 《Deep Learning》 读书笔记,可以参看原书一起阅读,效果更佳。 梯度下降算法 在机器学习或深度学习中,模型的训练在一般都会被...

我是任玉琢
4分钟前
7
0
Navicat for MySQL下载安装和破解教程

1.进https://navicatformysql.en.softonic.com/官网 2.第二步 3.第三步等待下载完成 4.第四步双击 二,破解 1.链接:https://pan.baidu.com/s/1CjV7JVzi7pVqlxKMQ3S8wg 密码:hk59 下载后解压...

osc_zgt6zhsy
4分钟前
5
0
Modbus协议和应用开发介绍

因业务需要了解Modbus协议的使用,因此对Modbus的协议,以及相应的C#处理应用进行了解,针对协议的几种方式(RTU、ASCII、TCPIP)进行了封装,以及对Modbus的各种功能码的特点进行了详细的了...

osc_9yulefcq
6分钟前
9
0
golang设置代理

golang.org打不开,设置一下代理. 打开 MODULE: set GO111MODULE=on //windowsexport GO111MODULE=on //linux 设置代理: // set GOPROXY=https://proxy.golang.orgset GOPROXY=https://mi......

漫步海边小路
6分钟前
5
0
01.ElasticSearch (RestFul Api 基本操作)

创建操作 创建索引(库) #number_of_shards 设置分片#number_of_replicas 设置备份PUT 索引{ "settings": { "number_of_shards": 1, "number_of_replicas": 0 }} 创建映射类......

Pole丶逐
7分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部