文档章节

浅议大数据的分析价值

openfea
 openfea
发布于 2016/12/08 10:16
字数 2229
阅读 18
收藏 0

        2015年,国务院颁布了大数据实施纲要通知《国务院关于印发促进大数据发展行动纲要的通知》,从国家层面上将大数据战略思想逐渐成型。随之,各行各业逐渐意识到海量数据的价值及重要性,分析数据并挖掘其潜在价值的需求不断加大。那么我们今天就来扒一扒:大数据能产生什么价值,值得我们去分析它?

一、什么是大数据

                 IDC以4V特征来定义大数据,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value);Amazon的John Rauser 将大数据定义为:任何超过了一台计算机处理能力的数据量。可见不同的主体对大数据的定义是不同,但有一个共同点,即数据必须是海量的。

           一个人每天可以产生如下社保信息:身份、医保/养老/工伤/失业/生育等各险种的参保信息、财务、薪酬等敏感信息…….

          一台工业设备每天可以产生的信息:第一、行为日志。访问信息、发送的控制指令等信息;第二、设备通信日志。包括数据连接建立时间、连接端口、访问外部节点信息、传输数据量等信息;第三、设备异常报警日志。如设备认证失败、异常行为类型等;第四、流量信息及阻断信息。

        这些信息每天都在产生,久而久之汇聚成海量的数据,通过不同的终端以各种各样的形式存在。比如,存储于关系型数据库Oracle、PostgreSQL,数据文件XML,Hadoop数据源HDFS等。但是它们的价值密度较低,海量数据中只有小部分是有用的,其他大部分数据没有什么价值,必须进行分析才能发现价值。

二、大数据的价值

           下面我们就从社保大数据和工业设备大数据这两个领域,来看看分析这些大数据能产生什么价值?

(一)分析社保大数据产生的价值

        经过近三十年的发展,我国社会保险制度逐步趋于完善,社会保险覆盖范围不断扩大,社会保险基金征缴和管理不断加强,各项社会保险待遇水平进一步提高。与此同时,伴随着信息技术的进步,金保工程的实施,一个以信息网络三级互联、应用软件基本统一、数据资源集中管理为主要特征的、统一的金保工程支撑平台已在全国基本形成,全国所有地级城市和省级人社部门均已建立了数据中心,32个省级单位全部实现了与部中央数据中心的网络联结,90%以上的地市实现了与省级数据中心的联网,城域网已经联接到92.5%的社会保险经办机构和就业服务机构,并且延伸到街道、社区、乡镇和定点医疗服务机构,覆盖全国的人力资源社会保障信息网络架构初具规模。社保数据不断向上集中,参保人数几乎覆盖全国,历史数据不断积累,社会保障信息呈现出“大数据”的特性。

        大数据系统可以将社保所有的经办点和服务机构联结起来,实现跨区域、跨险种社保数据的整合后进行分析,从而解决如下问题:

        第一,可以防止以下冒领社保待遇的行为。防止居住本地但不具备在本市办理退休的外地参保人员,采取伪造转移信息表,虚构缴费年限,骗取社会保险关系转移接续的;防止参保人员与中介(或用人单位)虚构劳动关系,提供虚假证明材料,按照单位职工突发重大疾病特殊审批政策规定骗取医疗保险待遇;防止单位为自愿离岗的职工出具解除职工劳动关系证明,骗取失业保险待遇享受资格的;防止非工伤人员虚构、伪造受伤事实,骗取工伤保险待遇;防止工伤人员虚构、伪造、变造、非法更改工伤认定、劳动能力鉴定原始结论,隐瞒、编造病史骗取工伤保险待遇;防止工亡职工供养亲属虚构、伪造、变造、非法更改原始证明材料骗取供养亲属抚恤金待遇的。

        第二,可以防止以下重复参保的行为。防止参保退休人员通过重复参保缴费,重复领取养老待遇;防止离退休人员死亡后,亲属不告知社会保险经办机构继续冒领养老金;防止享受失业保险待遇期间已重新就业,蓄意欺骗社会保险经办机构并继续享受失业保险待遇;防止享受失业保险待遇期间人员已经死亡或异地退休,不告知失业保险经办机构并继续享受失业保险待遇;防止享受工伤保险待遇的工伤人员、工亡职工供养亲属死亡后,亲属或所在单位不告知经办机构继续冒领工伤保险待遇。

        第三,有利于社保基金的监管。社保基金安全有效运营和在动态经济环境中保值增值,是社保的关键所在。基于这样的认识,运用数据挖掘算法,在对社会保险基金运行状况进行统计分析的基础上,通过设计监测预警模型,确定预警线及警戒标志来进行社保基金的事前监管。改变以往事后审计、事中监督的监管模式,不仅有利于防止实践中社保基金被挪用、侵占现象屡禁不止,违规操作的事件层出不穷,威胁到保障广大劳动者切实利益的“养命钱”和“保命钱”安全的弊端。而且,有助于进一步规范和完善监管制度,增强基金投资和运营情况的透明度,建立信息化的基金监管体系。从而充分发挥社会保障制度的“减震器”、“安全网”作用和对经济持续增长的“助推器”功能。对于构建和谐社会和保持经济结构调整、经济体制转型时期的社会稳定具有积极的意义。

(二)分析工业设备大数据产生的价值

       根据统计,大多数据的涉密犯罪来自于内部:应用单位未设立相应的安全管理系统、技术措施和制度。很多安全事故基本是因为内部人员和外部人员勾结所为,而且呈上升的趋势。因为内部人员比外部人员更加容易获得系统的权限,能够造成更大的威胁,而一般的安全防护系统对外部的防范比较多,而内部的防范和监控相对比较薄弱,造成内部人员的不合法操作很难被发现,具有威胁大、难防御、难发现的特点。

        通过大数据分析,除能通过系统报警和统计发现违规操作行为和频次这些基础功能外,还能保证设备的深度安全运行,以及对内部人员的高危操作进行捕捉。 

        第一,保证设备的深度安全运行。可以直接利用工业控制网络中的隔离设备作为日志采集探针,将其采集的上位机、下位机、设备、主机和应用系统日志进行全面的标准化处理,及时发现各种安全威胁、异常行为事件,透过事件的表象真实地还原事件背后的信息,提供真正可信赖的事件追责依据和业务运行的深度安全。

        第二,对内部人员的高危操作进行捕捉。轻松实现挖掘线索,追溯、定位到人,对犯罪行为起到足够的震慑,帮助工控企业最大程度规避内部人员违规操作的风险。强有力的防止内部人员滥用权利 进行计算机犯罪,或者把特权转让给有恶意目的的用户,从其服务器中盗取重要生产控制数据。

© 著作权归作者所有

openfea
粉丝 19
博文 88
码字总数 98530
作品 1
杭州
其他
私信 提问
大数据时代的到来,为我们提供了哪些便利之处?

以前还没有进入大数据时,社会发展相对比较慢,比如工作生活,交通出行,互联网并没有那么的便利,大家都是各顾各的,进入了大数据时代,大家开始相互分享资源,抱团取暖。下面来说说大数据时...

游客rt2gxfkwkuqsm
04/16
0
0
人人都在谈论人工智能,难道大数据已死?

  “大数据已死。”   大数据过时了。”   “我们不再需要大数据,我们现在需要机器学习。”   … …   这是我在2017年时常听到的话语,大数据已死?我并不认同,在我看来,大数据是...

大数据头条
2018/01/26
0
0
大统计与数据科学联合会议召开 百分点深入探讨大数据价值挖掘之道

5月27日-29日,由百分点集团、中国人民大学、北京大学、伦敦政治经济学院与统计之都共同主办的中国最大的大数据盛会“大统计与数据科学联合会议”在北京召开。28日,百分点集团与北京大学携手...

玄学酱
2018/05/24
0
0
大数据分析项目中的“最差”实践

在这里还是要推荐下我自己建的大数据学习交流群:784557197,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据软件开发相关的...

p柯西
2018/06/15
21
0
草根狂欢:程序员对《大数据时代》感悟

【IT168 评论】2012年被称作中国的大数据元年,有两本书功不可没。前有涂子沛的《大数据》(从美国政府的数据信仰、政策和实践娓娓道来,让中国政坛和知识精英接受了一次思维洗礼),后有舍恩伯...

作者:吴甘沙
2013/05/13
0
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周二乱弹 —— 他只能用这个办法劝你注意身体了

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @-冰冰棒- :#今日歌曲推荐# Kodaline《High Hopes》 《High Hopes》- Kodaline 手机党少年们想听歌,请使劲儿戳(这里) @xiaoshiyue :仙女...

小小编辑
7分钟前
195
6
Spring Boot Actuator 整合 Prometheus

简介 Spring Boot 自带监控功能 Actuator,可以帮助实现对程序内部运行情况监控,比如监控状况、Bean加载情况、环境变量、日志信息、线程信息等。这一节结合 Prometheus 、Grafana 来更加直观...

程序员果果
16分钟前
3
0
Linux文件查找命令详解

对于文件查找,我们最好用的还是属于find命令了,在说find命令之前,先把另外几个查找命令介绍一下。 目录 0x01 查询命令介绍 0x02 find命令介绍 0x01 查询命令介绍 在介绍之前,首先先了解一...

无心的梦呓
16分钟前
3
0
快速掌握的测试用例优先级划分方法

怎么样的设计才能算测试用例 引自:IEEE Standard 610 (1990): A set of test inputs, execution conditions, and expected results developed for a particular objective, such as to exe......

测者陈磊
20分钟前
3
0
[mycat]Attribute value "roadNodeId,version" of type NMTOKEN must be a name token

不能逗号配两个字段的主键 primaryKey="roadNodeId,version" Caused by: io.mycat.config.util.ConfigException: org.xml.sax.SAXParseException; lineNumber: 7; columnNumber: 105; Attrib......

Danni3
25分钟前
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部