加载中
基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式...

搜索引擎的分片(shard)和副本(replica)机制

搜索引擎通过分片(shard)和副本(replica)实现了高性能、高伸缩和高可用。

分布式内存文件系统:Tachyon

Tachyon是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存储在Tachyon里的文件。

Windows上安装HADOOP单机伪分布式集群

Windows上安装HADOOP单机伪分布式集群

Ubuntu上安装HADOOP单机伪分布式集群

Ubuntu上安装HADOOP单机伪分布式集群

Ubuntu上安装HADOOP多机完全分布式集群

Ubuntu上安装HADOOP多机完全分布式集群

word v1.3 发布,Java 分布式中文分词组件

word v1.3 发布,Java 分布式中文分词组件

Java分布式中文分词组件word分词v1.2发布

Java分布式中文分词组件word分词v1.2发布

Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift有何不同?

Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift的异同

计算ITEYE博文在百度的收录与排名情况

计算ITEYE博文在百度的收录与排名情况

2015/04/04 04:00
489
我的ITEYE和OSCHINA博客的异同(截止2015年5月17日)

我的ITEYE和OSCHINA博客的异同

2015/04/03 05:17
805
计算OSCHINA博文在百度的收录与排名情况

计算OSCHINA博文在百度的收录与排名情况

2015/04/03 16:49
633
ITEYE博文抄袭检查

比如我写了一篇文章:“使用Java8实现自己的个性化搜索引擎”,我想知道有哪些网站转载了我的文章,我该怎么办呢?

使用Java调用百度搜索

使用Java调用百度搜索

没有更多内容

加载失败,请刷新页面

返回顶部
顶部