加载中
《时间序列分析及应用-R语言》读书笔记

《时间序列分析及应用-R语言》,由美 Jonathan D. Cryer和Kung-Sik Chan编著,潘鸿宇等译,机械工业出版社出版,我这本是第二版。这是一本2008年就写好的书,2011年中文出版。算起来都7年了...

AirFlow/NiFi/MLFlow/KubeFlow进展

大数据分析中,进行流程化的批处理是必不可少的。传统的大数据处理大部分是基于关系数据库系统,难以实现大规模扩展;主流的基于Hadoop/Spark体系总体性能较强,但使用复杂、扩展能力弱。大数...

互联网+农业,美国如何通过农业大数据提升效益

美国农业正在采用大数据和互联网方法提升农业生产的效率和效益,以1%的农业人口维持庞大的农业生产体系,不仅满足美国本土需要,而且还大量出口。

R语言空间分析功能简介

空间数据是跟大多数的数据都有关系,而常用的数据中大量的也都有空间属性。因此,R语言已经包含了很多空间分析的软件模块。这里简单介绍R中的Spatial软件包,以及其它可以用于空间分析的软件...

Spark大数据分析框架的核心部件

Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyon文件系统、SparkR计算引擎等...

Databook-数据之书

Databook-数据之书 用于数据分析的Jupyter Notebooks。 不需购买服务器,快速开始自己的数据分析过程。 源码:https://github.com/databooks/databook 源码镜像:https://gitlab.com/databo...

PRS三剑合璧,大数据利器出鞘[Python+R+Sublime]

R是一种专门用于数据分析的语言,得到很多科研工作者的青睐,随着“大数据”概念的升温,R也是炙手可热了。python自然不用多说了,简单实用,无出其右。这两个运行环境在Sublime里都有很好的...

深度学习与处理用于数据驱动的地球系统科学

深度学习与处理用于数据驱动的地球系统科学 由Markus Reichstein 在 2019 发表于 《Nature》。 这是一篇综述性文章,介绍了机器学习如何在地学中的应用与挑战。地球系统科学进入了大数据时代...

NiFi-面向流程的大数据处理框架

任何一个大数据分析的软件,都需要一个强大的数据拉取组件、数据仓储系统、数据处理引擎、任务调度引擎和流程设计界面。Hadoop和Spark的重点是在数据的存储和任务调度,R的重点是数据分析引擎...

00_镜像构建-iObjects Python with JupyterHub for K8s

JupyterHub是一个广泛使用的大数据分析的WebUI界面,在JupyterHub for K8s中集成SuperMap iObjects Python,即可在JupyterLab的Notebook环境下中使用各种地理空间数据的处理功能,实现一体化...

GIScript2015的第一个入门教程-使用UbuntuKylin15.04

GIScript2015是一个通用的GIS脚本库,可以帮助进行地理空间数据的处理和分析,提高数据处理的效率,帮助进行地理科学的研究。GIScript2015是一个开源工程,已建立Git版本库和虚拟Team、微信群...

2015/07/27 14:38
488
JupyterHub容器镜像自定义方法与步骤

IPython、JupyterHub、JupyterLab是用于大数据分析和机器学习的流行的环境,JupyterHub可以运行于Kubernetes集群环境中,从而供多人同时使用,支持动态伸缩。 虽然登录后可以通过pip和conda...

PostgreSQL的集群化和容器化部署

对于PostgreSQL用户来说,随着数据增多、业务负载上升,需要将其进行容器化和集群化改造,以便于管理和伸缩规模。PostgreSQL虽然可以支持集群,但仍然是传统数据库架构而非分布式数据库架构。...

基于GIScript和GeoIP进行访问网址的地理定位分析

通过网页访问日志分析使用者的地址,然后将其放到地图上,分析访问来源的热区从而得到用户的地图分布,是不是很有用、也很酷?这里介绍个使用GIScript和GeoIP来进行访问网址的地理定位的例子...

2015/07/09 16:23
172
数据科学中最好的5个机器学习API

原文 http://www.infoq.com/cn/news/2015/12/5-best-ml-api-to-use 机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部...

2015/12/18 14:22
210
解读美国国家安全部NSA的大数据战略

棱镜门事件以来,NSA的全球监控行为遭到各国政府和人民的谴责,但美国情报部门所展现的大数据和信息安全技术实力也成为各国政府甚至一流IT企业为之“艳羡”的对象。 NSA为代表的美国国家安全...

2016/01/25 10:57
148
DARPA出手, Python有望成为大数据分析语言

当前, 在大数据领域, Java成为了当仁不让的必修语言。原因就是大数据平台必备的Hadoop分布式管理平台需要使用Java,但是这种局面有可能被DARPA改变。 IT经理网在“大数据成为美国军队的’新...

Statsmodel,基于Pandas的统计模型库

Statsmodels 是Python的统计建模和计量经济学工具包,包括一些描述统计、统计模型估计和推断。 主页:http://www.statsmodels.org/stable/index.html 源代码:https://github.com/statsmodel...

打造基于Python的流式数据分析平台

基于Python已经有多个科学研究和数据分析库,使用非常方便。结合OpenStack、RabbitMQ、Celery可以打造一个实时数据的分析平台。

TuShare,免费、开源的python财经数据接口

TuShare是一个免费、开源的python财经数据接口包,下些数据来做数据分析的练习很不错。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁、...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部