加载中
Spark大数据分析框架的核心部件

Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyon文件系统、SparkR计算引擎等...

构建功能强大的微数据中心(Micro Data Center)

构建功能强大的微数据中心(Micro Data Center),不在云里、胜似云里。 定位于边缘服务器,着重于联网服务、存储服务、下载服务、媒体服务、区块链接点等几种主要功能。 1、基本设想 基于容...

Spark快速入门

什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hadoop和Storm...

2016/03/12 10:17
209
Spark Streaming 编程指南[中]

Spark Streaming是一个分布式架构的流式数据处理框架。得益于庞大的Hadoop/Spark生态体系,利用RDD的内存迭代计算引入Streaming处理能力,是Spark的一个重要的模块。本Spark Streaming 编程指...

英特尔分布式深度学习平台Nauta-使用指南

英特尔分布式深度学习平台Nauta-使用指南 Nauta 软件提供了多用户、分布式的计算环境,可以为运行深度学习模型的训练实验提供支持。实验结果可以通过命令行、web UI 和/或 TensorBoard来进行...

03/03 09:51
32
分布式机器学习框架-百度的PADDLE(计划开源)

PADDLE是百度开发的一个分布式的机器学习框架,是基于Spark的。

开源大数据处理工具汇总(上)

开源大数据处理工具汇总(上),一共81个。

8 个优秀的 Linux 图形图像及色彩工具

对艺术家、摄影师、动画师和设计师而言,Linux是一个有潜力的平台。廉价的硬件,优秀的免费软件,任何有才华的人都能在上面创作专业水平的计算 机图形。开源社区提供了丰富的开源图形工具,但...

2015/04/07 13:22
102
容器SDN技术与微服务架构实践

Docker的横空出世很大程度上推动了容器技术的热度和发展。容器技术和传统的虚拟化技术有很大的不同,具体包括:首先是相对于传统的虚拟机,以前一个虚拟机里做的事情,要打散成很多个容器去做...

Spark Streaming 编程指南[中英对照]

Spark Streaming是一个分布式架构的流式数据处理框架。得益于庞大的Hadoop/Spark生态体系,利用RDD的内存迭代计算引入Streaming处理能力,是Spark的一个重要的模块。本Spark Streaming 编程指...

区块链与比特币相关的专业术语

以太坊,作为一个基于加密货币的泛化的分散的应用开发平台,必然既包含这些概念的集合,也增加了许多自身的概念。为了帮助新来以太坊的人,无论他们是加密货币爱好者,企业家,社会或政治愿景...

2016/09/28 08:58
209
CG_Hadoop:基于MapReduce的计算几何

摘要:Hadoop使用了MapReduce编程范式,目前已经被公认为是分布 式环境中分析大数据的标准框架。然而,它并不能很好的应用于大规模的计算几何处理。本文介绍的CG_Hadoop是一套可伸缩的和高效...

深度学习框架的发展与展望(2019.3)

机器学习算法发展比较迅速,但为了能够实现工程化的规模化应用,还需要稳定的框架和一致的流程的支持。 目前的机器学习算法主要分为两类,即深度学习与传统的机器学习。传统的机器学习如随机...

基于Python的分布式计算平台-DPark

DPark是一个基于Mesos的集群计算框架(cluster computing framework),是Spark的Python实现版本,类似于MapReduce,但是比其更灵活,可以用Python非常方便地进行分布式计算,并且提供了更多的...

MXNet设计和实现简介

Docs » MXNet设计和实现简介 Edit on GitHub The following is an overview of MXNet in Chinese. For english readers, please refer to our NIPS learnsys paper MXNet设计和实现简介 神经...

Kafka+Spark Streaming+Redis实时计算整合实践

基于Spark通用计算平台,可以很好地扩展各种计算类型的应用,尤其是Spark提供了内建的计算库支持,像Spark Streaming、Spark SQL、MLlib、GraphX,这些内建库都提供了高级抽象,可以用非常简...

2016/03/11 16:00
509
pandas.DataFrame对行和列求和及添加新行和列

导入模块: from pandas import DataFrame import pandas as pd import numpy as np 生成DataFrame数据 df = DataFrame(np.random.randn(4, 5), columns=['A', 'B', 'C', 'D', 'E']) DataFra...

2018/07/31 16:43
1K
Amazon推出机器学习云服务

Amazon宣布推出 P2 实例,这是一种专为计算密集型应用程序而设计的全新实例类型,此类应用程序需要高性能 GPU 协处理器和大规模并行浮点性能。 P2 实例非常适合深度学习、计算流体动力学、计...

TensorFow的基本使用

TensorFlow是一个基于Graph的计算框架,主要用于数据驱动的机器学习领域。但TensorFlow本身并不是一个神经网络系统,而是一个通用的数据和模型驱动的流程,与传统的逻辑驱动的语言有较大的区...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部