文档章节

是谁泄露了你的数据?

openfea
 openfea
发布于 2017/03/24 13:19
字数 5273
阅读 16
收藏 1

您的房子需要出租吗?

请问无息抵押贷款,需要吗?

我们在**的精装修商铺你有兴趣了解下吗?

我们这里专做儿童早教,您宝宝多大了?

我们健身会所今天有体验课,来体验吧!

......

类似这样的电话

每天接到四五个算是少的

一天接到几十个也不算稀奇!

把名单拉黑也没用

过几天换个其它号码照打不误

恁你逃不掉!

之所以不断被骚扰

原因在于您的个人信息被泄露了!

您遇到的情况,只能说是冰山一角

因为信息被泄露的人不在少数!

2014年5月14日,乌云网爆出小米论坛存在用户资料泄露,涉及800万小米论坛注册用户。

2014年7月28日,苹果公司首次承认了iPhone确实存在“安全漏洞”,苹果员工可以利用此前未公开的技术提取用户个人数据。

2014年12月3日,智联招聘86万条简历数据泄露。

2015年2月5日,美国第二大医疗保险公司遭黑客攻击,8000万用户资料受影响。

2015年8月27日,乌云发布报告显示,大麦网600余万用户账户密码遭到泄露。

2015年11月24日,伟易达Learning Lodge网站500万客户资料外泄。

再看看最近的京东泄露事件,50亿条公民信息被泄漏啊。

时至今日

数据的安全已经关系到我们每一个人

我们必须严肃对待!

我们的信息为什么会被泄露?

    信息被泄露的原因是多方面的。既有技术原因,也有管理原因,更有人为因素。总结起来主要有以下四点:

一、数据高度集中

在IT时代,设备及数据都是分散的,共享程度低,信息孤岛普遍,相互之间的关联程度不大,数据壁垒存在,要获取其它业务系统的数据还是比较困难的,数据只掌握在少数有权限的组织手中。但进入DT时代,随着设备的互联互通以及多网络的接入,数据越来越集中化,为了开发大数据应用,发掘潜在的数据价值,多个部门之间、多组织之间的数据共享是必须的。在数据流通的同时,跨部门跨行业跨组织的数据高度集中,在实现数据资源共享和挖掘潜在价值的同时,也暴露出包含大量敏感和重要信息的数据资源被泄露和非法利用。

基于云计算的网络化社会,使各行业、各部门间信息互通变得容易,但也将这种开放的环境平台暴露在公众面前,不管是个人,还是组织,都可以利用大数据环境挖掘潜在的价值,而挖掘出来的价值,既可以用于正途,当然也可以用于攻击和破坏等斜路。

二、应用开发商对大数据平台的运维能力普遍不强

大数据IT架构日趋多元化,IT资源种类及其数量不断增多,网络形态也变得更加复杂,从而给运维工作带来了巨大的压力和挑战:管理超大量的设备集群,集群监控困难,虚拟化的管理不便,开源的软件平台,

   除此之外,由于大数据系统中数据的复杂性、动态性和不确定性,应用开发商对大数据平台的运维能力较弱,使数据安全会有各种风险产生。

第一, 数据传输风险。由于数据的传输离不开网络,因此网络的缺陷都会为数据带来各种安全威胁,例如黑客入侵、非法操作等,数据会通过网络被监视或窃听,目前已经采用相关技术对数据进行加密,或建立可靠的安全连接,但是这些技术仍然存在一定的风险。

第二,数据使用风险。虽然在云计算技术的发展下,极大的有利于数据资源的传输和共享,但是同时也增加了数据被非法访问和使用的风险。

第三,数据终端风险。数据终端使用户能够更加便捷获取数据资源,但是随着科学技术的发展,数据终端也朝多元化、智能化的方向演变,逐渐发展出了智能手机、平板电脑等手持终端,由于技术上受限,常见的终端上总会存在一些漏洞,这些漏洞也会严重的威胁终端数据的安全。

(引用自廖崇良.数据安全运维管理平台的建设[J].电子技术与软件工程,2017.)

三、没有对数据进行有效隔离

很多大数据平台架构中,为便于上层应用对数据的使用,应用系统开发商都没有对数据进行有效隔离,因为他们认为其应用系统本身的安全措施已经能够对数据进行防护。

其实这是误区!

    由于云计算对资源的充分高效利用,大幅降低了计算成本,大大增强了计算灵活性。但是,作为一个云化的平台,大数据平台架构中的组件、应用、数据都具有安全风险,在云的多租户环境中,大量用户共享同样的基础设施和网络,如何在这种环境下保证用户数据的安全和隐私,是一个比较严峻的问题。在没有实现多租户隔离的环境下,恶意用户可以比较容易地攻击其他使用同一平台的用户,特别是目前的PaaS、SaaS建立门槛已经很低,一些程序开发员可以通过GoogleApp等建立自己的云服务,其代码的安全性通常没有得到良好的审查。

    现在,还没好的解决办法来阻止这些攻击,即便部署了数据防泄露系统,也无法阻止云服务上的敏感信息泄露。技术手段的缺乏使得黑客和恶意的内部人员的攻击日益增加,云计算时代大型数据中心安全管理日益复杂,如何管控高价值的业务数据,成为所有数据提供商和用户面对的重要问题 。

四、疏于管理运维人员

    大数据与传统应用系统的最大区别之一,是传统应用系统在交付完成后,一般都不需要大量的数据运维人员存在;但大数据系统交付完成后,需要通过挖掘数据内在的关系,才能充分发挥数据的价值。虽然一直在提AI,但当前的发展阶段对数据的处理、分析、挖掘等都还离不开人,也就是说大数据应用在投入生产后,还需要有大量的数据运维人员、数据分析人员等直接触碰数据。这也正是近期京东数据泄漏的主要原因之一。

如何防止我们的信息被泄露?

    各方面的原因造成了个人隐私数据的泄露,采取何种有力措施才能保护这些敏感和重要数据呢?依托于数据安全领域十几载的深耕经验,专门处理大数据安全的合众大数据安全管控系统(简称DSM)建议政府机构、企事业单位的用户从以下几个方面着手解决。    

一、安全策略不依赖于集群本身,不对现有业务系统造成任何影响

《“十三五”国家信息化规划》中明确提出:“保障国家基础数据和敏感信息安全”,表明国家对基础数据和敏感信息的重视程度。随着大数据的发展,跨部门跨行业跨组织的数据高度集中,为了实现数据资源共享和价值挖掘的同时,对敏感和重要信息进行安全保护,常常需要部署认证、授权、脱敏等安全策略,这些策略的实施虽然达到一定程度的数据安全保护目的,但往往会对数据本身、大数据集群及现有的大数据各类应用/业务系统造成影响,是困扰大数据提供方及管理者的技术问题。而要从根本上解决这类问题,我们需要本着“四不”原则,有针对性的来解决。

    第一,不影响数据的使用,时效性高

    在以关系型数据库为存储单元的业务系统中,数据的时效性需求通常都不高,在数据从生产库拷贝到非生产库时,来对这些数据进行脱敏处理,且只可以处理静止的数据,无法处理流动的实时性数据。而在大数据环境下,为了挖掘数据的价值而做的分析工作,为了保证数据的隐私和安全,一般也需要使用这种处理方式,在敏感数据从生产环境脱敏完毕之后再在非生产环境使用。但是对于查询业务或运维测试人员通过运维工具的访问查询等人为触发的查询操作,单独采用这种方式是不合适的,需要在脱敏规则的引导下自动化进行敏感和重要数据的去隐私化这一弥补机制,对查询返回的若干结果集进行临时脱敏,切实满足生产环境中数据生成和处理速度极快的现状。  

    第二,不需要对数据存储方式及应用程序做出任何更改

    通过在客户端与大数据容器的出口处部署像DSM类似的安全管控网关集群,来检测和处理所有客户端与大数据系统之间的数据请求及响应。安全管控网关集群作为一个访问的统一口径,将双向摆渡数据。对于客户端发出的内容检测、规则查询、改写引擎的数据请求,实时转发到原始数据库,得到数据库反馈后,再将响应后的内容检测、规则查询、改写引擎的响应数据发送给客户端。全程数据交换过程,既使客户端有需要修正的数据访问请求,也不需要对大数据系统的数据存储方式及应用程序代码进行更改。

    第三,不破坏不同类型数据形态的格式和可用性

    数据脱敏常常在去隐私化与保持数据真实性之间存在着紧张关系,对数据过度的脱敏处理,往往使数据失去原有的格式和意义,影响数据最终用户、IT 人员和外包团队达到测试数据时要求的仿真度。例如,将职工姓名“梅雪”转换为随意汉字组合或者乱码序列 “8Ad232%”,将会带来不易识别的困惑。因此,在去隐私化与数据真实性之间找到最佳的结合点才是上策。

    通过数据脱敏实现数据安全的同时,针对不同类型的数据形态,实现不破坏其数据格式和可用性的数据脱敏处理。比如,当对Excel文件中的数据执行脱敏时,脱敏完成后文件格式依然为Excel而不是CSV。

    第四,不需要对应用程序和数据库进行改造

    提供灵活、实时的敏感、隐私信息安全防护的同时,不会对应用程序和数据库进行昂贵且耗时的变更,不干扰开发、测试及数据分析、挖掘者履行其各自的职责,就决定了脱敏策略的前置性及外部性。采用集防火墙、IPS系统、数据流过滤系统、用户认证系统、访问日志记录等功能于一身的安全管控网关集群,部署于大数据集群/大数据系统的访问入口,实现大数据访问用户和大数据集群/大数据系统内部之间数据消息的协议转换,在数据摆渡过过程中,对于定义的数据中的敏感信息,根据数据的脱敏要求进行过滤和脱敏,保证输出数据中无敏感内容;针对不同用户、不同数据类型,根据不同的合规检查规则,审核输出数据,保证输出数据的合规性;对于脱敏后输出的合规数据,根据用户的等级、输出的数据量大小和数据价值属性进行计量和计费;同时,在数据输出过程中,对数据输出的时间、对象、数据的元数据、脱敏规则、合规检查规则等进行永久性存档,以便于未来的合规性审计。

二、完善用户权限管理

大数据集群/系统中的每个组件,都有自己的用户账号,造成账号泛滥的情况突出,而一套大数据平台十几个组件的情况非常普遍,客户端访问大数据平台仅依赖传统的帐号、密码认证,由于认证强度不高,往往会导致帐号盗用、冒用的问题出现。

要解决此类问题,必须从完善用户权限方面下手。

第一,建立统一身份认证和权限控制机制

客户端要访问大数据平台的组件必须通过安全管控网关的认证,所有外部客户端或应用不都能直接访问大数据平台。

第二,权限分级策略

在统一身份认证和权限控制机制的基础上,增加对机构安全属性的划分,规定不同机构属性下的安全权限, 即授权访问,梯度控制。

第三,基于角色的访问控制

角色不同被授予的权限也不同,角色所属的用户有权执行某些特定的操作,这种权限不允许传递给其他用户。 

三、实现字段级的权限控制

    为了防止用户访问安全性的问题出现,我们可以采用统一身份认证和权限控制机制、权限分级策略、基于角色的访问控制的组合式解决方案,但对于用户经过身份认证获得合法访问权限后,我们如何对不同角色的用户设置不同的权限呢?

    目前的大数据平台普遍权限粒度太粗,控制力度不够,比如Hadoop系统中的Hive、Hbase,用户权限只能控制到访问目录不能控制到文件。另外,授权的操作繁琐不堪。需通过修改配置文件来达到控制权限,并且每个节点上都需要有相同的ACL配置,这些配置只能手动复制到对应节点上,没有同步机制,工作量相当巨大。

字段级权限控制的思想是,假定一个表有10个字段,我们可以设置用户A的权限和脱敏对象可以配置到其中5个,而设置用户B的权限和脱敏对象可以配置到其中10个。这种权限控制方式,对大数据平台的访问权限可以细化到字段,粒度更细。并且,不需要修改任何配置文件。

四、实现多租户的数据资源隔离

    在云计算环境下,很多应用都放到云端,导致在应用入口,敏感数据泄露、数据访问无详细记录、应用冒名访问开放接口;在运维入口,开发人员账号混用、操作无详细记录、高危险误操作无法控制、敏感数据泄露,就需要通过多租户数据资源隔离机制,来提高数据安全性。

多租户技术是一种软件架构,是指软件单个实例为多个租户提供服务。每个租户正常工作,同时又保证租户之间的隔离性和安全性,租户与租户之间相互独立。多租户技术在云计算中是相当重要的,云计算天生就是为不同租户服务而生,在公有云中多租户技术为成千上万的用户提供虚拟服务器,这些用户就是公有云中的租户。在私有云环境中,为政府部门或者公司各个部门提供服务,这些部门或者公司就是私有云中的租户。

    云计算SaaS模式下,基于硬件隔离和虚拟化的多租户技术已比较成熟,但是存在资源利用率不高,在用户量较大的情况下,服务质量容易得不到保证的情况发生。因此,需要采用一种新的用于构建多租户系统的数据隔离模式,这种隔离模式运行于应用程序与大数据运算环境之间,使应用程序租户只能够维护他们各自的数据及资源,而不能访问其他租户的数据及资源。并且在不改变集群配置的情况下,实现业务层的多租户隔离。租户在任何时候、任何地点都可以动态地申请计算资源,包括网络资源和存储资源,可以动态地部署服务器及其存储资源的整个生命周期(产生,更新,删除,迁移等),各个租户相互隔离的策略可以在网络中进行实施。出现在整个应用程序生命周期中的字段,不管是静态还是非静态,都只有对于租户敏感的字段才需要被隔离,从而使业务逻辑开发人员专注于应用逻辑及UI的定制开发,使底层架构开发者通过该隔离提供的接口实现多租户资源的隔离,使资源利用率高,即使在用户量较大的情况下,服务质量也容易得到保证。

以上几点保护敏感和重要数据的措施,都是针对用户和数据安全方面的,但是要全面提高大数据的安全,光有这些策略是不够的。

那还需要什么呢?

您还需要一套合众大数据安全管控系统(简称DSM)!

DSM,采用用户安全与数据安全并用的双层均衡策略,以海量大数据的信息安全为研究对象,以信息系统内部各类信息的保密和重要程度,系统性地对其在存储、获取、传递和处理过程中保持完整、真实、可用和不被非法泄露的数据给予不同程度的保证。信息的安全性保证,覆盖信息的整个生命周期以及信息在整个生命周期中的各种存在形式,保证合法用户的合法使用,防止外部/内部用户的非法访问,在信息通过正常的外联口传递出系统时,防止敏感信息的流失和泄露。

DSM主要实现数据平台的用户安全和数据安全。第一,用户安全。是指访问数据平台的用户,其身份认证的安全、权限控制的安全,保证合法的用户能够访问平台上指定的组件和数据;第二,数据安全。是指存储在数据平台上的数据的安全,包括数据全生命周期的整体安全,数据访问的审计等方面。通过网关隔离用户与数据系统,在网关端对接入的用户做身份认证,访问业务的权限管理,以及操作访问审计、平台运维审计。

DSM能防止数据被攻击、盗取、破坏,通过多种策略,将攻击、盗取、破坏予以抵挡,从而构筑起从外围用户访问到数据安全的一套信息安全综合防护技术!

    

参考资料:

廖崇良.数据安全运维管理平台的建设[J].电子技术与软件工程,2017.

© 著作权归作者所有

openfea
粉丝 18
博文 86
码字总数 95615
作品 1
杭州
其他
私信 提问
数据泄漏!我们的信息还安全么?

7月初,《2017年全球数据泄露成本研究》报告发布。研究结果显示,IBM Security 和 Ponemon Institute两家研究机构针对419家公司进行调研,合计数据泄露总成本达到362万美元。每条包含敏感和机...

玄学酱
2018/03/19
0
0
电商警钟:eBay泄露1.45亿用户数据

IMAGE: Andrew Harrer/Bloomberg/Getty Image eBay近日确认今年2月底3月初发生大规模用户数据泄露事故,约1.45亿用户数据遭泄露,这些数据包括用户名、电子邮件地址、家庭地址、电话号码和生...

Cashcow
2014/05/22
0
0
盘点2017全球数据泄露案件,刷新你的认知!

来源:CSDN 本文长度为2600字,建议阅读5分钟 互联网时代,数据呈现方式的多样化及获取渠道的多元化都让我们的隐私被暴在“光天化日”下。 近日,有关公民个人隐私数据泄露的新闻此起彼伏,前...

enohtzvqijxo00atz3y8
2017/11/28
0
0
NSA数据泄露带AWS上热门,看360多机智!

  【IT168 资讯】这几天最“热”的新闻无非是美国国家安全局(NSA)残留的数据泄密问题。据悉,属于该机构的虚拟硬盘图像被曝光在AWS的公共存储服务器上,虽说该服务器未被明确列出来,但由于...

it168网站
2017/11/30
0
0
数据脱敏介绍

数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据 的可靠保护。这样,就可以在开...

zancun
2018/03/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多

哪些情况下适合使用云服务器?

我们一直在说云服务器价格适中,具备弹性扩展机制,适合部署中小规模的网站或应用。那么云服务器到底适用于哪些情况呢?如果您需要经常原始计算能力,那么使用独立服务器就能满足需求,因为他...

云漫网络Ruan
48分钟前
3
0
Kafka 2.3 Producer (0.9以后版本适用)

kafka0.9版本以后用java重新编写了producer,废除了原来scala编写的版本。 这里直接使用最新2.3版本,0.9以后的版本都适用。 注意引用的包为:org.apache.kafka.clients.producer import ja...

实时计算
57分钟前
3
0
Java 中的 String 有没有长度限制

转载: https://juejin.im/post/5d53653f5188257315539f9a String是Java中很重要的一个数据类型,除了基本数据类型以外,String是被使用的最广泛的了,但是,关于String,其实还是有很多东西...

低至一折起
今天
14
0
OpenStack 简介和几种安装方式总结

OpenStack :是一个由NASA和Rackspace合作研发并发起的,以Apache许可证授权的自由软件和开放源代码项目。项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenSta...

小海bug
昨天
11
0
DDD(五)

1、引言 之前学习了解了DDD中实体这一概念,那么接下来需要了解的就是值对象、唯一标识。值对象,值就是数字1、2、3,字符串“1”,“2”,“3”,值时对象的特征,对象是一个事物的具体描述...

MrYuZixian
昨天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部