深入理解tera——百度开源万亿级数据库

原创
2016/10/26 19:36
阅读数 3.4K

最近偶然发现百度的同学 00k ,发布了百度万亿级数据库tera。 从介绍可以看出该系统已成为百度spider 3.0和网页数据库的核心模块,管理节点过万,数据存储量级达到pb级。虽然该系统开源较晚,但相比于同类开源产品,如hbase等,性能、可靠性和稳定性应该有非常大的提升。从公布资料看,tera每天能实时处理百亿的链接数据,管理万亿数据规模,而类似hbase的系统还没有哪个应用能达到百度的数据量级。

tera另外一个吸引人的特点是全c++实现,终于可以摆脱java了。

后续开一个深入理解tera的技术专题,与大家分享一下。

记录一下代码地址:http://github.com/baidu/tera,代码走起!

展开阅读全文
打赏
1
2 收藏
分享
加载中
用的是HDFS
2017/06/15 11:03
回复
举报
tera集群部署后,运行不起来,出现以下问题,哪位仁兄帮看一下:

[192.168.247.130:2181], sessionId=0x25c9b804ca20009, negotiated timeout=10000

E0613 14:31:56.213695 80339 tablet_io.cc:304] fail to open table: /tera/meta, Corruption: CURRENT file lost

E0613 14:31:56.213883 80339 tabletnode_impl.cc:328] fail to load tablet: meta [, ], status: kTableCorrupt

E0613 14:31:56.228971 80411 tabletnode_zk_adapter.cc:230] kick mark node is created
2017/06/15 11:03
回复
举报
期待楼主的专题开张!
2016/11/08 13:57
回复
举报
更多评论
打赏
3 评论
2 收藏
1
分享
返回顶部
顶部