文档章节

互联网吞噬世界,“大数据”吞噬互联网!

灵玖lingjoin
 灵玖lingjoin
发布于 2015/01/22 16:09
字数 2911
阅读 16
收藏 0

行业解决方案、产品招募中!想赚钱就来传!>>>

  美国国会图书馆是全球最重要的图书馆之一,1EB约等于4462个美国国会图书馆的数据存储量!《红楼梦》共有87万字(含标点),每个汉字占两个字节,即1个汉字=2B,由此计算1EB约等于6626亿部红楼梦!


  任何事物,当量变到一定程度必然要发生质变,量的积累引起起质的飞跃。我们知道,当速度抵达光速时,时间就可以倒流。而大数据的价值已经不再是只是巨大的社会和商业价值那么简单。在工业3.0时代之前,科学技术是第一生产力,而在工业4.0时代,大数据才是第一生产力!


  水木然认为,互联网的本质是横线的“连接”,大数据的本质是“纵向”的统一。互联网用连接改变一切。它的结构是“网”状的,可以“网罗天下”,因为那时万物的形态都是有形并可以被描述的。而在大数据时代,所有的物体形态都将变成无形的“点”,一个物体就是一个数据,万物都被“纵向”统一了起来,这时再用这张“网”去归拢天下就行不通了。“网罗天下”也就不复存在,未来应该是“以点带面”。互联网的本质是手段、是过程,大数据的本质是结果、是决策。我们甚至可以有了结果再去寻找过程。



  大数据时代,人们思维方式最大转变在于:在以前,我们遇到问题总是在问:“为什么?”。通过知晓事物的来龙去脉去发明和创造。而在大数据时代,人们最想做的是:“是什么?”,直接探知结果,根据已知的推断未知的,过程被忽略。


  我们知道,每个人都有自己的基因,即24种不同的染色体,其中最大的染色体约含有2亿5千万个碱基对,最小的则约有3800万个碱基对。这种基因就决定了你今后的生长和发育。在工业4.0时代,不仅人有基因,万物皆有基因,每一个产品在生产之前都被各种数据“描绘”好的,这同人的基因一样,也是与生俱来的。


  人类基因组计划(humangenomeproject,HGP),与曼哈顿计划和阿波罗计划并称为三大科学计划,是由美国科学家于1985年率先提出,旨在为30多亿个碱基对构成的人类基因组精确测序息,基因的本质就是大数据。研究大数据就是研究世界的基因,掌握世间万象的规律。


  关于大数据,目前还有一个很大的误读:很多人以为收集起了海量的数据就是大数据。比如我们经常看到某些机构发布的盘点、排名、信息公示等等。真正的大数据并不只是搜集起了这些信息,而是能在海量数据的基础上,找出内在逻辑,并给出结论性意见。


  比如,谷歌地图的价值并不是告诉你前面这条路上一共有多少车,而是根据路面的车辆情况,计算出前面哪个路口可以更快的到达目的地。比如,某医院搜集了很多孩子的哭声,然后根据某个小孩的哭声数据库来判断这个孩子的病状。他们还可以通过积累了很多病人的脉搏、血压、心电等数据,来判断或预警某病人可能产生的病情等。



  大数据,未来的第一生产力!


  通用电气CEO杰夫•伊梅尔特曾说:如果昨晚你睡觉时,GE还是一家工业公司,那么今天醒来就会变成一家软件和数据分析公司。


  这个时代发展太快,当很多企业还在考虑该如何“互联网化”的时候,大数据时代就压过来了,今后商业的产业链上的每一个环节都需要大数据。


  工厂对大数据存在渴求:我只知道谁帮我卖,但不知道谁在买,我的产品该如何改进?我下次该生产多少才没有库存?


  零售业对大数据存在渴求:我只知道谁在买,但不知道他因何而买?我该在什么环节采取什么措施才能提高购买率?


  电子商务也需要大数据:比如开一家淘宝店,我们能做的只有做广告去引流量,或者用“赠送”和“服务”拼命提高转化率,却不知道每一个消费IP背后的动向:消费者有跟其他商家比过价吗?是评价还是价格打动了他?


  香港有家海鲜店,老板会安排专人通过摄像头查看食客点餐的顺序、夹菜的顺序、剩菜的种类和分量,通过这些信息分析进而用于第二天的采购决策,循环反复,以此降低生意成本,这就实现采购的信息化管理。



  大数据可以预知未来?


  任何行为,皆有前兆。但在现实世界中,缺少实时记录的工具,许多行为看起来是“人似秋鸿有来信,事如春梦了无痕”。在互联网世界则完全不同,是“处处行迹处处痕”。要买商品,必先浏览、对比、询价;要搞活动,必先征集、讨论、策划。互联网的“请求”加“响应”机制恰恰在服务器上保留了人们大量的前兆性的行为数据,把这些数据搜集起来,进一步分析挖掘,就可以发现隐藏在大量细节背后的规律,依据规律,预测未来。


  这就让人们看到了解决未来预测问题的一丝曙光。通过利用大数据技术,可以预测预测自然、天气的变化,预测个体未来的行为,甚至预测某些社会事件的发生。它会让我们的生活更为从容,让决策不再盲目,让社会更加高效的运转。这就是大数据技术带给我们的好处。全球复杂网络权威巴拉巴西认为,人类行为93%是可以预测的。我的确不知道这位老先生是怎么计算出来93%这个数字的,但大数据可以预测未来是显而易见的,这是首个使人类具备了预测短期未来的技术。


  听起来似乎很玄妙,大数据不就是算命先生么?


  其实,或多或少,人们都具备预测的能力。譬如,儿子跟小伙伴们疯玩,我知道他肯定在7点之前会回家,因为他饿了。再如,家乡流传的很多谚语,其中一句“八月十五云遮月,正月十五雪打灯”,说明大自然就有许多规律性的东西。估计现在的科学也没有办法解释几乎半年跨度内气象间的因果关系,但是几千年的观察和积累,却发现了它。自然、社会、商业无不服从某些规律,大国兴衰、王朝更替亦有规律可循。只是过去囿于技术条件人们无法记录下造成某件事情发生的先兆数据,无法去计算其中的因果关系。这些规律要么被神秘化,要么被庸俗化。


  任何事情的发生,都会有蛛丝马迹的前兆表露出来。如果我们不去关注一支股票的行情走势,就不会去买卖这支股票;如果我们从不去询问某件商品的价格,也很难产生购买行为;如果事先没有联络沟通,人们就很难聚在一起;如果没有闷热的天气,似乎就没有透心凉的大雨。关于地震前种种异象,更是被许多书籍、文章大肆渲染。


  假定有一种技术可以记录下所有这些先兆,人们就获得了未卜先知的能力。利用大数据技术,能够广泛采集各种各样的数据类型,进行统计分析,从而预测未来。大数据影响之深远,波及之广泛,远非一般的信息技术可比。以上摘抄自赵国栋大数据书籍《大数据时代的历史机遇》


  那么问题来了:


  假如,我收集了100万个人的面相特征(或者手纹、生辰八字),再结合这些人在不同人生节点遇到的事情,是不是就可以找出面相(或者手纹、生辰八字)和命运的规律?


  假如,我收集了100万个住宅周边环境,再结合主人的不同人生节点遇到的事情,总结出来一套规律,是不是就是风水?


  好了,我们不怪力乱神。接下来就谈谈我们的中医吧!


  中医和大数据


  关于中医,为什么会有争论呢?就是因为中医在很多人眼里找不到根据。它不像西医,有很多临床实验和量化的指标。实际上中医的本质就是在“反复实践”摸索出来的规律,是一种古老和朴实的“大数据”。


  2000多年前,张仲景在《伤寒论》序言写到“勤求古训、博采众方”。其实他就是把大家和前任积累的经验给总结了,然后再总结提炼了一套防治伤寒病的方法。《伤寒论》至今我们还在应用,说明是有作用的,所以马克思也说:实践是检验真理的唯一标准。


  中医之所以能够发展2000多年长盛不衰,是因为有确实的疗效。但是,中医无法被量化,这就不符合现代科学精神。如果我们能够把中医的药材、诊断、过程、和结果都数据化,那么“中医”肯定能成为一门非常伟大又令人信服的学科。


  这里还有一个问题就是:是因果关系更重要?还是必然关系更重要?比如《伤寒论》中的“白虎汤”、“麻杏石甘汤”等古代经典名方,常常可以救治危重大病,而且不带有副作用。但是知道现在,药物个病症的“因果关系”还是没能被彻底搞清。这这并不妨碍我们现在还在用这些疗法治疗相关病症。


  水木然点评:大数据给人类思想的第一个冲击,很可能使人们从渴求事物之间的“因果”关系当中解脱出来,开始寻找复杂数据中的“必然”关系。


  所以,在大数据时代,中医完全可以给自己正名。但是一定要做到数据化,也就是量化。大部分老中医都习惯了凭感觉和经验从医,如果一直是这样的话,中医就很难有本质上的提升。而且我更相信,只有当我们把变化用数据表示出来时,才能更进一步发现更新的规律,因为量变才能引起质变,经验可以是朴素的,但是学科必须是严谨的。

 

 



灵玖lingjoin
粉丝 86
博文 2880
码字总数 4066035
作品 0
东城
私信 提问
加载中
请先登录后再评论。
我的架构演化笔记 功能1: 基本的用户注册

“咚咚”,一阵急促的敲门声, 我从睡梦中惊醒,我靠,这才几点,谁这么早, 开门一看,原来我的小表弟放暑假了,来南京玩,顺便说跟我后面学习一个网站是怎么做出来的。 于是有了下面的一段...

强子哥哥
2014/05/31
976
3
异步Tor控制协议的实现--txtorcon

txtorcon是一个基于Twisted的异步Tor控制协议的实现。Twisted 是一个用Python写的事件驱动的网络引擎,和洋葱路由网络Tor是一个旨在促进人们的隐私和安全的互联网。它包括单元测试有96% +覆盖...

匿名
2012/11/23
611
0
创新团队的效率工具--TeamToy

TeamToy是什么? TeamToy是专为创新团队设计的效率工具,它以【事】为核心,带动整个团队进行有价值的交流。在设计上,TeamToy以简捷为目标,更适合于移动设备和触屏。 TeamToy和TODO工具有什...

Easychen
2013/01/05
1.4W
0
高性能NoSQL数据库--SSDB

SSDB 是一个 C/C++ 语言开发的高性能 NoSQL 数据库, 支持 zset(sorted set), map(hash), kv, list 等数据结构, 用来替代或者与 Redis 配合存储十亿级别列表的数据. SSDB 在 QIHU 360 被大量使...

ideawu
2013/01/08
2.6W
4
复杂网络分析平台--Gephi

Gephi是一款开源的交互式的复杂网络分析平台。它支持Windows, Mac OS X以及Linux等环境。主要功能包括: 网络布局:提供了超过10种不同的布局算法 网络社区分析和分类 网络属性计算 动态网络...

匿名
2013/04/22
2.6W
0

没有更多内容

加载失败,请刷新页面

加载更多

【c++灵魂科普】(1) 第一部分第一章-初识c++语言

今天带来一篇灵魂科普~ 主要是认识c++语言~话不多说 走起! 【全是干货!】 第一节 c++语言简介 信息学奥林匹克竞赛是一项益智性的竞赛活动,核心是考查选手的智力和使用计算机解题的能力,选...

osc_facwbzof
26分钟前
13
0
谈谈AMD CPU购机心得 与 写代码的感受

序 之前用的是华硕飞行保垒。具体是几代忘记了。。I7 4代的标压CUP。 8G内存 换成了联想yoga 14s。 换电脑的原因 网卡问题,老旧的网卡争网络实在争不过别人。每次看别人网络很好,我却连不上...

osc_0m0d4mbq
27分钟前
0
0
springboot 定时任务

一、在 DemoApplycation.java 写入如下代码 package com.taven.demo;import org.springframework.boot.SpringApplication;import org.springframework.boot.autoconfigure.SpringBootA......

tavenpy
28分钟前
14
0
2020年8月中国编程语言排行榜

编程语言比例(市场份额) 工资 排名 编程语言 平均工资 中位数 最低()95% 最高(95%) 人数 百分比 1 julia 22539 22500 9000 37500 17 0.00% 2 rust 20987 18500 5371 45000 548 0.11% 3 scal...

osc_kvcz9ju6
28分钟前
12
0
北风在这里给大家拜年了!!!祝大家2020鼠年大吉!忠心祝愿❤在新的一年里:工作的朋友工作顺利,还在读书的童鞋硕果累累,学技术的伙伴技术更上一层楼!同时祝大家2020百毒不侵!😄最后:武汉...

本文分享自微信公众号 - 北风IT之路(beifengtz)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。...

beifengtz
01/24
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部