加载中
流数据处理

大数据界很早以前就意识到了批处理的不足,实际应用中对于实时查询和流处理的需求越来越迫切。近年来涌现出了很多解决方案,像Twitter的Storm,Yahoo的S4,Cloudera的Impala,Apache Spark,...

使用AWS搭建高度伸缩的数据分析平台

这是我在2013第四届中国数据库技术大会上的分享内容 使用AWS搭建高度伸缩的数据分析平台 演讲PPT下载地址 新浪微盘 http://vdisk.weibo.com/s/z0c0C/1366947648y 百度云 http://pan.baidu.c...

为 Key-Value 数据库实现MVCC 事务

本文译自 Implementation of MVCC Transactions for Key-Value Stores 本文另一地址请见为Key-Value 数据库实现MVCC事务 ACID 是软件领域使用最广泛的技术之一,它是关系数据库的基石,是企业...

2013/03/04 18:01
1K
NoSQL数据库的35个应用场景

本文另一地址请见 NoSQL数据库的35个应用场景 本文翻译自 35+ Use Cases For Choosing Your Next NoSQL Database 之前有三篇文章 What The Heck Are You Actually Using NoSQL For?. 101 Que...

2013/02/03 02:21
4.1K
MapReduce的常用算法

本文另一地址见MapReduce的常用算法 本系列文章翻译自博客codingjunkie.net , 作者总结了在《Data-Intensive Processing with MapReduce》这本书中涉及到的处理数据的方法,并写了真实可用的...

2013/02/01 11:26
1K
用MapReduce进行数据密集型文本处理-本地聚合(下)

本文另一地址请见用MapReduce进行数据密集型文本处理-本地聚合(下) 本文译自 Working Through Data-Intensive Text Processing with MapReduce – Local Aggregation Part II 本文是《Dat...

2013/01/29 15:02
453
用MapReduce进行数据密集型文本处理-本地聚合(上)

本文另一地址请见用MapReduce进行数据密集型文本处理-本地聚合(上) 本文译自Working Through Data-Intensive Text Processing with MapReduce 因为最近忙于 Coursera提供 的一些课程,我已...

2013/01/28 12:04
585
用 Hadoop 计算共生矩阵

本文另一地址请见用 Hadoop 计算共生矩阵 本文译自Calculating A Co-Occurrence Matrix with Hadoop 本文是《Data-Intensive Text Processing with MapReduce》提到的MapReduce算法的系列文章...

2013/01/27 23:39
438
MapReduce 算法 - 反转排序 (Order Inversion)

本文另一地址请见MapReduce算法-反转排序 本文译自 MapReduce Algorithms - Order Inversion排序 译者注:在刚开始翻译的时候,我将Order Inversion按照字面意思翻译成“反序”或者“倒序”,...

2013/01/27 18:09
988
定风波 - 滑雪

腊月初八,与同事至温都水城屋顶滑雪场一试身手。填小词两首,格律不严,权作消遣 定风波-滑雪(之一) 腊月初八天气寒,温都水城雪如盐。 远望屋顶明似练,快看,雪上翻飞云中燕。 迫不及待...

2013/01/21 17:25
44
Apache Hadoop 的最佳实践和反模式

本文另一地址请见Apache Hadoop 的最佳实践和反模式 本文译自 Apache Hadoop: Best Practices and Anti-Patterns @AlfredCheung 同学亦对此文有贡献 Apache Hadoop是一个用来构建大规模共享存...

NoSQL数据库的分布式算法

本文另一地址请见NoSQL数据库的分布式算法 本文译自 Distributed Algorithms in NoSQL Databases 系统的可扩展性是推动NoSQL运动发展的的主要理由,包含了分布式系统协调,故障转移,资源管理...

2012/11/09 16:06
14.5K
细说HDFS的Rebalance功能

本文另一地址请见 HDFS的Rebalance功能 HDFS中的数据按照一定策略分布在集群中的多个数据节点上,但在某些情况下,数据的分布也会出现不均衡的情况,比如说集群新增加了节点,在新增加的节点...

2012/10/31 13:50
2.1K
大数据中的SMAQ技术

本文另一地址请见 大数据中的SMAQ技术 本文译自 The SMAQ stack for big data 所谓海量数据,是指数据的规模大到已经难以使用传统的方式来处理。最早面临这个问题的是网络搜索引擎,而如今,...

MapReduce 模式、算法和用例

本文另一地址请见 MapReduce 模式、算法和用例 本文译自 Mapreduce Patterns, Algorithms, and Use Cases 在这篇文章里总结了几种网上或者论文中常见的MapReduce模式和算法,并系统化的解释了...

2012/10/30 12:17
6.8K

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部