如何把云计算大数据处理速度提高 100 倍以上?Spark 给出了答案。

原创
2014/06/14 20:55
阅读数 250

    如何把云计算大数据处理速度提高 100 倍以上?Spark 给出了答案。
Spark 是可以革命 Hadoop 的目前唯一替代者,能够做 Hadoop 做的一切事情,同时速度比 Hadoop 快了
100 倍以上,Spark 是基于内存,是云计算领域的继 Hadoop 之后的下一代的最热门的通用的并行计算框

架开源项目,尤
其出色的支持 Interactive Query、流计算、图计算等。
Spark 在机器学习方面有着无与伦比的优势,特别适合需要多次迭代计算的算法。同时 Spark 的拥有非

常出
色的容错和调度机制,确保系统的稳定运行,Spark 目前的发展理念是通过一个计算框架集合 SQL、

Machine
Learning、Graph Computing、Streaming Computing 等多种功能于一个项目中,具有非常好的易用性。
    目前 SPARK 已经构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL
查询等方面都有自己的技术,并且是 Apache 顶级 Project,可以预计的是 2014 年下半年在社区和
商业应用上会有爆发式的增长。
国内的淘宝、优酷土豆等已经使用 Spark 技术用于自己的商业生产系统中,国内外的应用开始
越来越广泛,国外一些大型互联网公司已经部署了 Spark。甚至连 Yahoo 是 Hadoop 的早期主要贡
献者,现在也在多个项目中部署使用 Spark,国内我们已经在运营商、电商等传统行业部署了 Spark。

http://www.cnblogs.com/guoshiandroid/p/3785112.html

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部