文档章节

为什么普通人看大数据就如雾里看花

大数据
 大数据
发布于 2015/03/23 16:21
字数 985
阅读 4
收藏 0

1. 大多数基本的术语都缺乏严格定义。究竟什么是大数据?数据科学又是什么意思?大数据和数据科学之间有什么关系?数据科学就是关于大数据的科学吗?只有像谷歌和Facebook这样的高科技企业才用得到数据科学吗?为什么有人认为大数据是一个交叉学科(比如天文学、金融学、科技等),但数据科学却只是科技界的事儿?大数据,多大才是大?这些术语及概念如此含混不清,简直毫无意义。

2. 对于数据科学领域的研究者,不管是在学术界还是工业界,公众都缺乏敬意。事实上,他们在这一领域内辛勤工作了很多年,而这些工作是继承了各个领域的前辈们数十年甚至数百年的工作成果,这些领域包括统计学、计算机科学、数学、工程学以及其他学科。而媒体传播给公众的信息却是这样的:机器学习算法是上个礼拜才发明出来的,谷歌出现之前都不存在所谓的大数据。这简直荒谬,很多正在使用的方法和技术,还有我们面临的挑战,都不过是在过去已有的方法、技术和挑战上演变而来的。我们并不否认新事物和新技术的出现,只是觉得应该对历史和前人的研究成果保持必要的敬意。

 

3. 媒体疯了。人们将各种各样的桂冠加诸数据科学家的头上,人们形容他们是掌握了宇宙奥秘的魔法师,其疯狂程度堪比金融危机之前。天花乱坠的宣传很容易掩盖真相、歪曲事实。这些宣传的噪声越多,真正有效的信息就越少。因此,若“大数据”被媒体吹得越久,公众越容易被误导,越难获知这一概念背后真正有益于社会的一面(如果有的话)。

4. 统计学家觉得他们正在干的事就是数据科学。换句话说,这本来就是他们的饭碗。亲爱的读者们,请设身处地替统计学家们想想,有人抢自己的饭碗是什么感受。媒体也常常将数据科学轻描淡写为统计学和机器学习在科技界的简单应用。我们会在书中阐明,不是说将统计学和机器学习这些“旧酒”装进新瓶里,就叫作数据科学。它绝对有资格作为一个独立的学科存在。

5. 所有自称为科学的都不是真正的科学。这句话或许有些道理,但不代表数据科学这一术语毫无意义,它代表的可能不是科学,而是某种技术。

 

“大数据这个词现在时常被人们随意使用,然而其语义十分模糊。简单地说,这个包罗万象的词条一般有三层含义:首先,它指代一揽子的技术;其次,它有可能引发一场度量数据规模的革命;最后,它为人们未来将会、甚或是应该如何制定决策提供了一个新视角,一种新理念。”


© 著作权归作者所有

大数据
粉丝 11
博文 73
码字总数 103738
作品 0
海淀
私信 提问
你印象中的“宅一族”,其实很励志!

近年来,越来越多的人喜欢“宅”在家里,他们用手机打发一天,他们沉迷于自己的兴趣、爱好不可自拔。尽管这种“宅文化”一兴起就频频遭到“与社会脱节”等各种指责,但“宅文化”的影响已经遍...

个推君
2018/05/23
0
0
熬得住,出众;熬不住,出局!

专注是一种价值选择,是一种工匠精神,是一种人生态度和情怀。任何一个人,哪怕智商天赋很一般,只要专注于一件事,坚持5年、10年、20年,肯定能做好。如果你几十年只对一处城墙进行轰击,也...

Betty__
2016/10/23
5
0
【随笔】成为独立的科研工作者之前,要坐得住冷板凳

版权声明:非技术文章禁止转载,如有需要请私信作者。技术类文章欢迎转载,转载请注明出处: http://blog.csdn.net/ztf312/ https://blog.csdn.net/ztf312/article/details/89286503 实验室申...

CS青雀
04/13
0
0
课程33:为什么你一定要学会写作?

为什么你一定要学会写作? 因为写作使人完整啊! 呸。 因为写作是“把自己的同一段时间重复销售很多很多次”的极少数选择之一,也是相对来看最容易成为普通人起步的台阶之一。 把自己的一份时...

闪电的蓝熊猫
2018/11/24
0
0
德国盗版党选举获胜的感想

上周日(9月18日),德国柏林地区选举的结果揭晓。 盗版党获得8.9%的选票,成功进入柏林议会,提名的15个候选人全部当选。 德国盗版党受瑞典盗版党的启发,成立于2006年。2009年议会选举,该...

阮一峰
2011/09/22
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Jenkins的配置

1 修改jenkins的根目录,默认地在C:\Documents and Settings\AAA\.jenkins 。 .jenkins ├─jobs │ └─JavaHelloWorld │ ├─builds │ │ ├─2011-11-03_16-48-17 │ │ ├─2011-11-0......

shzwork
22分钟前
1
0
使用 spring 的 IOC 解决程序耦合

工厂模式解耦 在实际开发中我们可以把三层的对象都使用配置文件配置起来,当启动服务器应用加载的时候,让一个类中的方法通过读取配置文件,把这些对象创建出来并存起来。在接下来的使用的时...

骚年锦时
26分钟前
1
0
group by分组后获得每组中时间最大的那条记录

用途: GROUP BY 语句用于 对一个或多个列对结果集进行分组。 例子: 原表: 现在,我们希望根据USER_ID 字段进行分组,那么,可使用 GROUP BY 语句。 我们使用下列 SQL 语句: SELECT ID,US...

豆花饭烧土豆
今天
3
0
android6.0源码分析之Camera API2.0下的Preview(预览)流程分析

本文将基于android6.0的源码,对Camera API2.0下Camera的preview的流程进行分析。在文章android6.0源码分析之Camera API2.0下的初始化流程分析中,已经对Camera2内置应用的Open即初始化流程进...

天王盖地虎626
今天
4
0
java 序列化和反序列化

1. 概述 序列恢复为Java对象的过程。 对象的序列化主要有两 首先我们介绍下序列化和反序列化的概念: 序列化:把Java对象转换为字节序列的过程。 反序列化:把字节序列恢复为Java对象的过程。...

edison_kwok
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部