文档章节

问题来了,大数据的特性究竟有多少个V?

雪饼
 雪饼
发布于 2018/01/08 23:28
字数 641
阅读 1770
收藏 0

—— 原文发布于本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),欢迎关注。

 

一提到大数据的特性,很多人马上就会想到3V、4V,那么大数据究竟有多少个V呢?

在大数据的不断发展阶段,业界对大数据的特征认识也在逐步完善,涵盖范围也更加全面。

 

1、3V

2001年麦塔集团(META Group)分析师莱尼在一份报告中对大数据提出了“3D数据管理”的观点,即认为大数据将往高速、多样、海量3个方向发展,提出了3个特性:高速性(Velocity)、多样化(Variety)、规模化(Volume),统称3V。

3V特性是大数据最具代表性的特性,被麦肯锡、IBM、微软等多家公司所认可并不断在大数据报告中提及。IDC(International Data Corporation,国际数据公司)在给大数据下定义时便是引用了3V的特性:“大数据技术是新一代的技术与架构,它被设计用于在成本可承受的条件下,通过非常快速(velocity)的采集、发现和分析,从大体量(volumes)、多类别(variety)的数据中提取价值”。

 

2、4V

4V也是广受认可的大数据特性,在3V的基础上再加上了价值(Value)的维度,主要强调大数据的总体价值大,但价值密度低。

规模性(Volume)、多样性(Varity)、高速性(Velocity)和价值性(Value),合称“4V”。

另外,还有一种大数据观点是“4V+1O”,在4V的基础上再加上1个O,即数据在线(Online),强调数据永远在线,能随时调用和计算,这也是有别于传统数据的特性之一。

 

3、5V、6V、7V、8V

随着大数据技术的不断发展,数据的复杂程度愈来愈高,不断有人提出了大数据特征新的论断,在4V的基础上增加了准确性(Veracity),强调有意义的数据必须真实、准确;增加了动态性(Vitality),强调整个数据体系的动态性;增加了可视性(Visualization),强调数据的显性化展现;增加了合法性(Validity),强调数据采集和应用的合法性,特别是对于个人隐私数据的合理使用。

 

下图展现了3V到8V的特性图

 

欢迎关注本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),获取更多资讯

© 著作权归作者所有

雪饼

雪饼

粉丝 411
博文 61
码字总数 134328
作品 0
广州
私信 提问
阿里员工吐槽:杭州22k拿到头条35k和shopee33k的offer,怎么选?

去年,有职场上的朋友在小编后台留言问我有关offer选择的问题,说自己接到两个看起来都是不错公司的offer,比来比去,不知道究竟选择哪个。小编看后,给她留言给她介绍了一些判断offer的角度...

微笑向暖wx
02/26
56
0
CNCC 2018 今日开幕,五场特邀报告引爆「大数据推动数字经济」| CNCC 2018

雷锋网(公众号:雷锋网) AI 科技评论按,2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府、浙江大学承办...

AI科技评论
2018/10/25
0
0
智领云发布BDOS大数据操作系统V2.0版本,BDOS Online版本同期上线

2018年09月10日,智领云发布BDOS大数据操作系统V2.0最新企业版,通过领先的技术,提供性能稳定的大数据平台(大数据运维,数据流水线,机器学习,人工智能,流数据处理,大数据组件集成),基于...

LinkTime_Cloud
2018/09/14
0
0
智领云发布BDOS大数据操作系统V2.0版本,BDOS Online版本同期上线

2018年09月10日,智领云发布BDOS大数据操作系统V2.0最新企业版,通过领先的技术,提供性能稳定的大数据平台(大数据运维,数据流水线,机器学习,人工智能,流数据处理,大数据组件集成),基于...

LinkTime_Cloud
2018/09/14
0
0
年薪500k阿里云大咖:掌握好以下数据库八大要点,月薪50k不是梦

阿里 如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是怎样的一群人?他...

qq_42002381
2018/04/18
0
0

没有更多内容

加载失败,请刷新页面

加载更多

只需一步,在Spring Boot中统一Restful API返回值格式与统一处理异常

统一返回值 在前后端分离大行其道的今天,有一个统一的返回值格式不仅能使我们的接口看起来更漂亮,而且还可以使前端可以统一处理很多东西,避免很多问题的产生。 比较通用的返回值格式如下:...

晓月寒丶
昨天
59
0
区块链应用到供应链上的好处和实际案例

区块链可以解决供应链中的很多问题,例如记录以及追踪产品。那么使用区块链应用到各产品供应链上到底有什么好处?猎头悬赏平台解优人才网小编给大家做个简单的分享: 使用区块链的最突出的优...

猎头悬赏平台
昨天
28
0
全世界到底有多少软件开发人员?

埃文斯数据公司(Evans Data Corporation) 2019 最新的统计数据(原文)显示,2018 年全球共有 2300 万软件开发人员,预计到 2019 年底这个数字将达到 2640万,到 2023 年达到 2770万。 而来自...

红薯
昨天
64
0
Go 语言基础—— 通道(channel)

通过通信来共享内存(Java是通过共享内存来通信的) 定义 func service() string {time.Sleep(time.Millisecond * 50)return "Done"}func AsyncService() chan string {retCh := mak......

刘一草
昨天
58
0
Apache Flink 零基础入门(一):基础概念解析

Apache Flink 的定义、架构及原理 Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行快速...

Vincent-Duan
昨天
60
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部