文档章节

大数据是“转方式”的抓手

王尘宇
 王尘宇
发布于 2017/09/06 23:49
字数 477
阅读 1
收藏 0
大数据更需要强调数据挖掘利用,而针对目前存在的技术应用、人才、安全与隐私等问题,最关键的是要有国家大数据战略,使其成为转变经济增长方式的有效抓手。 不要被大数据(Big Data)的“Big”误导,大数据更强调的不是数据之多,而是数据挖掘。数据大与价值大未必成正比,例如将一个人每分钟的身体数据记录下来,对了解该人的身体状况是有用的,但如果将他每毫秒的身体数据都记录下来,数据量将较前者高6万倍,与按每分钟记录的数据相比,其价值并不能增加。大数据的价值在于样本数的普遍性。统计一个人每分钟的身体状况数据与统计60个人每小时的身体状况数据相比,可能后者在统计上更有意义。大数据往往是低价值密度。大数据中的多数数据可能是重复的,忽略其中一些数据并不影响对其挖掘的效果。因此可以说大数据的价值好似沙里淘金和海底捞针。 大数据的量越大处理难度就越大,就需要更多的服务器或更高速的服务器。实时性是大数据挖掘面临的挑战,而非结构化是大数据挖掘的主要挑战。目前国际上大数据处理技术主要集中在结构性数据,但是大数据中80%以上都是非结构性数据。目前国内外都有很多大数据应用成功的例子,但基本上还是结构性数据,对结构性数据的挖掘是大数据应用的切入点。

© 著作权归作者所有

共有 人打赏支持
王尘宇
粉丝 1
博文 450
码字总数 469557
作品 0
西安
私信 提问

暂无文章

Ubuntu18.04 安装MySQL

1.安装MySQL sudo apt-get install mysql-server 2.配置MySQL sudo mysql_secure_installation 3.设置MySQL非root用户 设置原因:配置过程为系统root权限,在构建MySQL连接时出现错误:ERROR...

AI_SKI
今天
2
0
3.6 rc脚本(start方法) 3.7 rc脚本(stop和status方法) 3.8 rc脚本(以daemon方式启动)

3.6-3.7 rc脚本(start、stop和status方法) #!/usr/bin/env python# -*- coding: utf-8 -*-# [@Version](https://my.oschina.net/u/931210) : python 2.7# [@Time](https://my.oschina.......

隐匿的蚂蚁
今天
3
0
Cnn学习相关博客

CNN卷积神经网络原理讲解+图片识别应用(附源码) 笨方法学习CNN图像识别系列 深度学习图像识别项目(中):Keras和卷积神经网络(CNN) 卷积神经网络模型部署到移动设备 使用CNN神经网络进行...

-九天-
昨天
4
0
flutter 底部输入框 聊天输入框 Flexible

想在页面底部放个输入框,结果键盘一直遮住了,原来是布局问题 Widget build(BuildContext context) { return Scaffold( appBar: AppBar( title: Text("评论"), ...

大灰狼wow
昨天
4
0
Kernel I2C子系统

备注:所有图片来源于网络 1,I2C协议: 物理拓扑: I2C总线由两根信号线组成,一条是时钟信号线SCL,一条是数据信号线SDA。一条I2C总线可以接多个设备,每个设备都接入I2C总线的SCL和SDA。I...

yepanl
昨天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部