加载中
用机器学习构建模型,进行信用卡反欺诈预测

本文通过利用信用卡的历史交易数据进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 1. 数据的下载和数据介绍 数据的下载地址为 https://www.kaggle.com/dalpozz...

数据分析繁华的背后,都隐藏着怎样的哀伤

大数据技术的核心是什么? 面对这个问题,相信大家都会回答是大数据分析系统。 大数据分析系统从海量类型多样、增长快速、内容真实的数据背后挖掘、分析,从中找出可以帮助决策的价值信息,未...

用SPK技术分析,泰坦尼克号沉船之后哪些人活下来了

本文采用Kaggle中比较知名的数据集Titanic Machine Learning from Disaster作为分析数据源,该数据集被评为五大最适合数据分析练手项目之一。 分析目的是根据训练集预测部分乘客在沉船事件中...

Spark2.x写入Elasticsearch的性能测试

一、Spark集成ElasticSearch的设计动机 ElasticSearch 毫秒级的查询响应时间还是很惊艳的。其优点有: 1. 优秀的全文检索能力 2. 高效的列式存储与查询能力 3. 数据分布式存储(Shard 分片) 相...

Spark2.x与ElasticSearch的完美结合

ElasticSearch(简称ES)是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RestFul web接口。ElasticSearch是用Java开发的,并作为Apache许可条款下的开放源...

基于Spark ML 聚类分析实战的KMeans

聚类分析是一个无监督学习 (Unsupervised Learning) 过程, 一般是用来对数据对象按照其特征属性进行分组,经常被应用在客户分群,欺诈检测,图像分析等领域。K-means 应该是最有名并且最经常...

可视化设计器的正确打开方式

FEA可视化设计器越来越强大了 强大到你真的有点不认识它了! 你不信? 跟我来看看 一、背景和样式全面改版 ———————————————————————————————————————...

你用着单屏多任务系统,却想打造实时预警/分析中心

为帮助决策者实时且全面地把控各类安全状况 在大屏态势感知系统中加入实时预警功能是非常有必要的 可以实时预警通报各类网络攻击事件、有害程序事件、信息破坏事件、重大网络安全隐患事件等 ...

FEA设计器大变脸,掀门户百变风!

你是否看腻了 大数据可视化界面 千篇一律的深色背景 也厌烦了图表样式 通过FEA提供的可自定义+多应用的百变门户 换换口味怎么样? 相信下面的视频会给你惊喜! https://mp.weixin.qq.com/mp/...

看图秒懂多租户,形象具体!

小飞,小象,小君三人大学毕业后 同租了一套三室两厅的房子 三人各占一间独立卧室 每间房各配一把钥匙 从而保证每个人都有自己的独立私密空间 如果别人要进入,必须通过权限验证(也就是配套...

听说有人看3D版的《战狼2》掀翻爆米花,那看加入3D图的可视化会怎么样?

最近大火的电影 非《战狼2》莫属 8月2日票房已达到16.08亿 上映才7天! (战狼2海报) 百度、搜狗、新榜的排行基本在top10以内 除了精彩的故事情节之外 3D效果也是十分的提气 提气到什么程度呢...

2017/08/10 14:26
9
深入浅出FEA-spk,有原理有案例接地气!

随着大数据和云计算时代的到来,数据规模越来越大,随之出现了很多大数据框架,比如Hadoop用来实现分布式文件存储的HDFS,MapReduce、Spark、Storm等计算框架,Hbase,Mongob等数据库,Hive数...

热的不止《我的前半生》还有持续的高温天气和...

实力派老戏骨演出的《我的前半生》 播出接近尾声,收视率一路飙升 朋友圈 / 各大网站首页 / 各迷你首页 都用很醒目的标题 讲述着贺函、罗子君、唐晶之间的故事走向及各种评说 (图片来自网络...

用随机森林分类算法进行Iris 数据分类训练,是怎样的体验?

MLlib是Spark的机器学习(ML)库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。 MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层...

什么?多个体多维度分析效率能从3天压缩到30分钟?

在进行机器学习的时候,我们需要对单个体进行多维度分析,比如说在日志审计系统,我们需要对每一个操作账户进行操作次数统计,总操作次数统计,方差,极值,中值,突变度等计算。有时,也要计...

数据清洗很要命?那是因为你没看到这份攻略!

对数据挖掘和分析的人员来说,数据清洗和转化是一项非常繁琐和复杂的工作,占用了很大的工作量。 目前,数据的挖掘和分析,基本都是采用pandas,numpy或者R语言,这种处理过程复杂,而且没有一...

2017/08/10 10:57
266
当局者“密”,密钥者清

目前,面对国防、医疗保健以及金融行业的数据安全问题,越来越多的应用程序开始应用于数据的处理。其实,任何一个组织都难以保证重要的数据不会被窥探,而对于公有云来说,这个问题更为严重。...

基于FEA spk的web日志分析

数据准备 数据:美国宇航局肯尼迪航天中心WEB日志 数据下载:http://ita.ee.lbl.gov/html/contrib/NASA-HTTP.html 我们先来看看数据:首先将日志加载到df表,并查看前十行 打开fea的界面,运...

使用FEA Spk探索经典数据集MovieLens

有一种烦恼 叫“巧妇难为无米之炊” 一身的好技术 却苦于没有原料而无法发挥 相信很多想练手的FEA数据分析师 也有为找不到可以分析的数据集而烦恼的时候吧 今天我就告诉大家一个获取数据集的...

因为有它,Spark集群的交互操作变得更简单

Spark 2.X开发的一个动机是让它可以触及更广泛的受众,特别是缺乏编程技能但可能非常熟悉SQL的数据分析师或业务分析师。因此,Spark 2.X现在比以往更易使用。 在以前的Spark 1.x版本中,主要...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部