文档章节

一图胜千言,阿里云视觉大数据智能计算实践

_夜枫
 _夜枫
发布于 2017/03/23 17:50
字数 2724
阅读 11
收藏 1

引言
在大数据世界里面,视觉大数据应该是量级最大的。之前讲的天文的数据量非常大的,但其实天文的数据也是天眼的数据,说到底还是视觉的数据。

视觉智能计算并不是只做简单地进行一些图像视频的处理,而是要通过人工智能和机器学习的方法在数据中去识别、搜索和挖掘其中的价值,使得数据的价值得以体现,让用户对于数据的使用体验更好。

生活中的各种监控以及直播很普及,一个城市可能有多达60万个摄像头,所以产生的视频数据确实非常多。那么该如何处理这么多的数据呢?如何才能发现我们需要的东西呢?

大家在日常生活中比方旅游时往往会拍摄很多图片以及视频,但是之后这些数据怎么办呢?怎么看?怎么查?怎么用?往往会成为一件非常麻烦的事情,那么技术能不能把这件事情做得更好呢?

当然在其他领域也有很多的图像视觉的东西,对于这些方面,我们可以用智能来实现比如疾病诊断、灾难报告、机械故障的检测以及体育比赛的解说等等,这些确实是实实在在的理性需求,这些需求向视觉智能提出了很多的挑战,同时也带来了很多的机会。

从个体角度而言,视觉智能可以分为个体智能和整体智能。对于个体智能,数据被处理的地方可能是云上或者是终端。一般而言,云上处理的计算复杂度比较高,而终端一般处理的计算复杂度比较低一些。而整体智能则不会只关注一个单点的数据,需要看很多数据一起才能出决策,这一部分在终端上是难以完成的,除非未来端到端的通讯达到无缝的状态。整体智能的意思就是我们拿到的是一个整体的大规模的视频数据,通过这些数据的协同,以及整合到一起才能得出结论并做出决策,比如对于交通灯的控制以及其他决策等。

62a64267cf795cb20e3ac5478e0a287b74a981ae

 

 

云上视觉智能五要素
1.算法
2.平台,我们所需要处理的数据量是非常大的,所以背后必须有一个高效率的计算平台才能处理这些数据。
3.数据,数据是必须有的,现在的数据也会越来越多,而且在使用的过程中,数据也在源源不断地产生。
4.用户,用户一方面是数据和技术的使用者,另一方面也是数据的产生者。
5.商业,商业是事物的生命力,没有商业,事物的发展也不会长久。

 

一、视觉大数据技术和应用方向

视觉计算技术方向
在技术方向大概可以分为如下5个方向:
1.视频图像分析识别,简单而言就是“认”。
2.视觉搜索,也就是“找”。
3.视频图像生成,也就是“攒”。
4.视频大数据挖掘,也就是“挖”。

5.大规模视觉计算平台,也就是“台”,需要建立在通用平台之上的适用于视觉大数据的平台。

 

3f46e7d0f3b6e19e3bc44e0bb61ab77af7c4bd4a

 

 

视觉计算应用方向

在业务方向大概可以分为如下4个:
1.视频监控分析
2.图像视频搜索
3.视频数据生成
4.视觉数据挖掘

a11fdd546af471d9b08d5fa3daa69244e582154f

 

 

接下来进入案例的分享。阿里云将所有的视觉信息处理汇总到一起,产生了阿里云眼,这也是阿里云所有技术汇总的一个品牌。阿里云眼实际上也就是大数据平台上的一个智能视觉计算中心,承载云上广泛、深入的视频图像分析、识别、搜索、生成和挖掘服务。

0e58c3f4b4c6be58b6d2dab408fa73602a2817ba

 

 

二、阿里云眼应用实例

接下来从七个方面的应用进行分享。

1.城市之眼

顾名思义,城市之眼也就是城市的眼睛,什么意思呢?也就是把城市中产生的所有的视觉数据进行分析、识别以及索引,有了这些信息就可以产生很多有意思的功能,当然这些数据的分析都是由机器来完成的,所以大家不必担心数据隐私问题。

比如交通视频而言,有视频数据分析的技术在背后,可以根据视频对车辆进行检测、跟踪以及识别,基于此可以做很多很有意思的事情。

那么面对如此海量的由摄像头采集到的视频数据,该如何进行处理呢?其实在这背后必须要有大的计算平台进行支撑,而且这个平台需要适合于视觉数据处理,下图展现的就是基于ODPS或者现在称之为MaxCompute的阿里云离线计算平台,在此之上我们做了基于视觉计算的流程,使得其能够将大量的视频图像数据导入进来并进行高效处理。还有一些应用场景下,视频数据是实时的,比如像刚才提到的交通的数据。

f36268dbef8ad3ead0f543d63960973ecbc4b395

刚才提到的平台处理的是离线的数据,那么视频实时数据怎么处理呢?其实同样也会有相应的计算平台,在实时处理的时候除了数据量和系统的容错性还要有时间上的依赖性。这个平台就建立在StreamCompute这个平台上,可以来处理时间上的相关性,使得时间上流的计算变得比较方便也能够支持空间领域,多个摄像头之间的实时协同,所以在实际应用中可以既看时间点以前的数据,又能看摄像头周围的所有摄像头的数据,从而做出综合的决策。

d81722c3a8060b415716b36ae63a7ceecdf3da22

接下来分享一下城市之眼上的应用:禁左策略。禁左是因为车辆在左转的时候往往会挡住对面直行的车流,阻碍交通。所以禁左策略在一些情况下可以改善交通情况。但是给不该禁左呢?该如何去禁左呢?这些都不是简单的问题。可以通过实时的视频数据分析,给车辆的左转时间长短以及是否需要禁左,做出合理的决策。

e17478e6f3cdaef5639f3f4ad5b9d5753d548103

2.数字记忆

之前谈到的数据往往不是我们自己产生的,接下来分享的数据来源是我们自身。看一看在这里面能玩出什么名堂。

对于个人的数据,其实在阿里云的存储系统OSS上,视频数据和图像的数据都占了一半,所以数据量是非常大的。对于这部分数据该如何处理呢?有没有很好的技术、平台以及系统能够将这些数据重新唤醒。我们为什么要拍照呢,其实往往是为了留下体验和经历,希望和别人分享。若果我们能使用平台建立起容易分享和浏览、编辑的功能,这些数据就会被激活,同时还可能带来一些商业价值,比方说如何赏心悦目地加入广告。

要进行这样的处理,首先要进行打标签,我们图片的内容种类很多,这方面其实技术上比较困难。目前阿里云正在做一些配套的机制,使得我们几乎可以识别任何东西。任意的东西听起来比较悬,但是其实是有条件的,第一这个东西必须是视觉可以识别的,有一定视觉上的特征。第二是可以从互联网上找到训练数据。第三就是有这样的一套系统可以自动挖掘互联网上的数据建立模型,进行识别。

在分享时可以直接分享,也可以变化一下再分享,阿里云眼的风格画其实很好玩的,大家可以试试。

f88a5bfbd55543252606ec90b20a808d78c9cf4e

3.商品搜素

在日常生活中,我们在朋友圈往往会看到一些想买的商品,但是不知道具体是什么品牌,这时候就需要进行图片的商品搜索了。比方阿里的拍立淘就能解决这样的问题。

cc0d434929bd178532ea084ca5f750b5dc0b9c90

4.体育视频

体育视频其实是一个比较老的题目,之前曾经火过一段时间。随着近几年深度学习的兴起以及视频数据量的增加,体育视频再一次成为了热点。现在的视频分析要求具有自动性,比方说通过视频在球场上判断什么时候进球了,什么时候传球失误了等等。其应用就是在对视频打标以后可以产生视频集锦,以及对于个人数据进行分析,对于教练的训练也会有很大帮助。

b23300d6859c198a6b22fd0381723f3ebcc0d0ab

5.故障检测

故障检测其实分为机器的故障和人的故障,人的故障也就是对医学图像的处理。通过视频智能计算,之前需要上万人检测的机器故障,现在可以全部或者部分由机器检测。

d1c24d94606a8aa35a23367870fadaaf598e4b37

6.医学图像

对于医疗图像而言,则使用了基于深度学习的方法,也产生了很多的应用,比方说检测人体X光片中小于3nm的结节。

 

7.视频广告

讲到挖掘视频的商业价值,最好的方法就是广告。但是通常情况下,大家对于硬性的广告比较反感。其实完全可以将广告嵌入到场景中去,让用户感觉不到广告。

cfbced27f4f4d28ffb9c247f97c192ef9833094e

 

结语
阿里云眼利用视觉数据和视觉关联的数据进行视觉分析,进而构建媒体库、索引以及模型,之后在应用层提供各种能力。阿里云眼基于的平台都是阿里云已有的平台,依靠阿里云搭建各种技术与服务。

440d7ea2efb153dccdf7f82ceb1d6a3a229fcef9

最后回到最初讲的问题,一个成功的应用不仅仅是技术的运用,也需要算法、数据和用户以及平台。

1daf3bc3d23fef30625410ebb69ee5f9bf272636

 

欢迎加入MaxCompute钉钉群讨论 (官网链接):

767858daefd6375399d47bd5f941d07fe469a8ae

本文转载自:https://yq.aliyun.com/articles/62509

_夜枫
粉丝 10
博文 506
码字总数 0
作品 0
朝阳
后端工程师
私信 提问
一起去云栖大会吧,我带着你,你带着这份参会指南!

距离 2017 年 10 月 11 日云栖大会开幕还有一个月左右的时间,今年,大会主题定为“飞天 · 智能 Apsara Intelligence”,作为全球最具影响力的科技展会之一,本届大会不仅有阿里集团专家以及...

王练
2017/09/07
929
1
阿里云MVP一张地图带你领略数据中国

2018年5月23日,武汉云栖大会Tech Insight-阿里云 MVP 专场首次亮相,便带领各参会者领略了数据驱动的数字化变革。 云栖大会Tech Insight由阿里云MVP为演讲嘉宾输出的精品分论坛,阿里云 MV...

阿里云服务
2018/05/30
0
0
IT人必看!2018年上半年云栖大会300份干货PPT免费开放!最前沿的技术都在这了!

如今,提起“云栖大会”这个名词,每位开发者一定都不会感到陌生,从09年的地方性站长会议,到15年正式定名,落户云栖小镇,这一阿里巴巴集团主办的开发者盛会如今已经成为全球云计算领域的头...

yunqi_share
2018/06/22
0
0
【全记录】2017云栖大会·北京峰会——企业云上业务优化专场

作为本年度科技界的压轴大戏,2017云栖大会·北京峰会盛大空前, 30+主题论坛、深度技术解读、行业前沿实践分享以及创新互动体验让来到现场的朋友们印象深刻。本次峰会中,由阿里云客户服务部...

阿里云服务
2017/12/22
0
0
【资料合集】2018云栖大会上半年深圳、南京、武汉、上海峰会全记录

2018年,云栖大会城市峰会已陆续在深圳、南京、武汉、上海四座城市举办。作为行业的先行军和领导者,云栖大会继续为大家带来高可用高可靠的前沿技术分享,应诸多云栖粉丝的恳求,方便大家回顾...

云迹九州
2018/06/29
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Taro 兼容 h5 踩坑指南

最近一周在做 Taro 适配 h5 端,过程中改改补补,好不酸爽。 本文记录📝遇到的问题,希望为有相同需求的哥们👬节约点时间。 Taro 版本:1.3.9。 解决跨域问题 h5 发请求会报跨域问题,需...

dkvirus
51分钟前
3
0
Spring boot 静态资源访问

0. 两个配置 spring.mvc.static-path-patternspring.resources.static-locations 1. application中需要先行的两个配置项 1.1 spring.mvc.static-path-pattern 这个配置项是告诉springboo......

moon888
今天
3
0
hash slot(虚拟桶)

在分布式集群中,如何保证相同请求落到相同的机器上,并且后面的集群机器可以尽可能的均分请求,并且当扩容或down机的情况下能对原有集群影响最小。 round robin算法:是把数据mod后直接映射...

李朝强
今天
4
0
Kafka 原理和实战

本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/bV8AhqAjQp4a_iXRfobkCQ 作者简介:郑志彬,毕业于华南理工大学计算机科学与技术(双语班)。先后从事过电子商务、开放平...

vivo互联网技术
今天
19
0
java数据类型

基本类型: 整型:Byte,short,int,long 浮点型:float,double 字符型:char 布尔型:boolean 引用类型: 类类型: 接口类型: 数组类型: Byte 1字节 八位 -128 -------- 127 short 2字节...

audience_1
今天
9
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部