加载中
Spark机器学习库(MLlib)指南

spark-1.6.1 机器学习库(MLlib)指南 MLlib是Spark的机器学习(ML)库。旨在简化机器学习的工程实践工作,并方便扩展到更大规模。MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚...

分布式机器学习框架-CaffeOnSpark

CaffeOnSpark被设计成为一个Spark深度学习包。Spark MLlib支持各种非深度学习算法用于分类、回归、聚类、推荐等,但目前缺乏深度学习这一关键能力,而CaffeOnSpark旨在填补这一空白。CaffeOn...

Spark上的深度学习流水线

Spark上的深度学习流水线 本文根据 https://github.com/databricks/spark-deep-learning 翻译。 本文地址 https://my.oschina.net/u/2306127/blog/1811876,By openthings,2018-05-18. 深度...

PySpark-使用Python在Spark上编程

The Spark Python API (PySpark) exposes the Spark programming model to Python. To learn the basics of Spark, we recommend reading through theScala programming guide first; it sho...

快速运行TensorFlow的6种方式

这里将介绍几种可以在隔离环境中运行TensorFlow的方式,包括:Anaconda、Docker、Jupyter、Kubernetes POD、Kubeflow、Spark DL on MLlib,将更容易管理和扩展到集群中运行。...

Spark大数据分析框架的核心部件

Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyon文件系统、SparkR计算引擎等...

Spark 学习资源收集

关于Spark的安装、部署、使用的教程、经验和书籍等等的学习资源集合,来自于http://my.oschina.net/leejun2005/blog/311486

2016/05/29 19:05
494
Spark 1.2 发布,开源集群计算系统

Spark 1.2 发布,此版本包括 172 位贡献者和超过 1000 个 commits。 此版本包括 Spark 核心操作和性能改进; 添加新的网络传输子系统,进行了较大的改进; Spark SQL 引入了一个外部数据源的...

2015/01/20 20:43
56
分布式机器学习框架-百度的PADDLE(计划开源)

PADDLE是百度开发的一个分布式的机器学习框架,是基于Spark的。

15款开源机器学习软件

15款开源机器学习软件 机器学习是目前最热门的科研领域之一。诸如IBM、谷歌、微软、脸书和亚马逊这类大型公司不仅加大了对旗下发展研究部门的资金投入,同时也开始并购一些在机器学习、神经网...

Spark快速入门

什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hadoop和Storm...

2016/03/12 10:17
322
机器学习技术研究报告-2016年10月

机器学习技术跟踪研究报告-2016年10月 欢迎引用,注明来源:【https://my.oschina.net/u/2306127/blog】 1、机器学习概述 2016年是机器学习的元年。 以AlphaGo战胜李世石为标志,机器学习的能...

Top Spark Ecosystem Projects(英)

Apache Spark has developed a rich ecosystem, including both official and third party tools. We have a look at 5 third party projects which complement Spark in 5 different ways. ...

2016/03/10 10:39
200
Kafka+Spark Streaming+Redis实时计算整合实践

基于Spark通用计算平台,可以很好地扩展各种计算类型的应用,尤其是Spark提供了内建的计算库支持,像Spark Streaming、Spark SQL、MLlib、GraphX,这些内建库都提供了高级抽象,可以用非常简...

2016/03/11 16:00
826
Spark Streaming 编程指南[中英对照]

Spark Streaming是一个分布式架构的流式数据处理框架。得益于庞大的Hadoop/Spark生态体系,利用RDD的内存迭代计算引入Streaming处理能力,是Spark的一个重要的模块。本Spark Streaming 编程指...

深度学习框架的发展与展望(2019.3)

机器学习算法发展比较迅速,但为了能够实现工程化的规模化应用,还需要稳定的框架和一致的流程的支持。 目前的机器学习算法主要分为两类,即深度学习与传统的机器学习。传统的机器学习如随机...

Spark Streaming 编程指南[中]

Spark Streaming是一个分布式架构的流式数据处理框架。得益于庞大的Hadoop/Spark生态体系,利用RDD的内存迭代计算引入Streaming处理能力,是Spark的一个重要的模块。本Spark Streaming 编程指...

Spark编程指南—Python版

使用Python在Spark上进行数据分析的教程,翻译自Spark(spark.apache.org)的官方文档。

Spark编程指南《Spark 官方文档》

Spark编程指南《Spark 官方文档》,中文翻译,后面包含一些深度使用的方法。

Introducing Deep Learning Pipelines for Apache Spark

Introducing Deep Learning Pipelines for Apache Spark Deep Learning Pipelines is a new library published by Databricks to provide high-level APIs for scalable deep learning model...

2018/05/17 23:01
1.7K

没有更多内容

加载失败,请刷新页面

返回顶部
顶部