加载中
FEA从入门到精通系列 | 基础原语分类

FEA原语分为基础原语、SDF函数、UDF函数三大类。 SDF函数是系统自带,用于常量定义、变量运算、条件判断、时间格式化等操作。 UDF函数,分为 udf0包、udfA包、RS包、NSM包、NTC包、可视化VL包...

Spark2.x与ElasticSearch的完美结合

ElasticSearch(简称ES)是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RestFul web接口。ElasticSearch是用Java开发的,并作为Apache许可条款下的开放源...

干货 | 可视化设计:地图四部曲之迁徙图

再过一个月的时间,2017年春运将会浩浩荡荡的开始,作为一名分析师你肯定很想看看用什么样的可视化图形来动态展示人员的流动情况。那么,我们今天就来看看用OpenFEA如何设计迁徙图。 1、什么...

2016/12/14 17:13
62
Spark2.x写入Elasticsearch的性能测试

一、Spark集成ElasticSearch的设计动机 ElasticSearch 毫秒级的查询响应时间还是很惊艳的。其优点有: 1. 优秀的全文检索能力 2. 高效的列式存储与查询能力 3. 数据分布式存储(Shard 分片) 相...

干货 | 可视化设计:地图四部曲之地图热力

马上快过年了,回家的旅游的探亲的看世界的马上就要出动了。这一年一度的候鸟式大迁徙即将轮回,相信很多人都很关心天气吧,必竟来场说走就走的旅行,还得天气给力不是。 “在北方的寒夜里四...

智慧中国杯百万大奖赛解读 | 精准资助机器学习(三)

通过前面两篇的数据探索,我们对教育精准资助的数据已经有所了解了,接下来我们就要建立模型来进行机器学习了。对于机器学习这个事还真是挺有意思,写的深了会让大家觉得太难,打消大家学习的...

用机器学习构建模型,进行信用卡反欺诈预测

本文通过利用信用卡的历史交易数据进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 1. 数据的下载和数据介绍 数据的下载地址为 https://www.kaggle.com/dalpozz...

用SPK技术分析,泰坦尼克号沉船之后哪些人活下来了

本文采用Kaggle中比较知名的数据集Titanic Machine Learning from Disaster作为分析数据源,该数据集被评为五大最适合数据分析练手项目之一。 分析目的是根据训练集预测部分乘客在沉船事件中...

智慧中国杯算法赛解读 | 精准资助数据探索(一)

智慧中国杯是由DataCastle(数据城堡)主办的全国大数据创新应用大赛,提供了百万的竞赛奖金,数据城堡的创始人周涛是《大数据时代》的中文翻译者,在业内享有很高的名气。 OpenFEA将对此次大...

干货|可视化设计:地图四部曲之地图散点

中国是人口大国,也是资源大国,自古以来就有地大物博的美名。金矿、银矿、铜矿、煤矿、石油、天然气、稀土、各种稀有金属等多种多样的矿产应有尽有。我们的老祖宗给华夏儿孙留下这么多宝藏,...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部