加载中
基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式...

分布式内存文件系统:Tachyon

Tachyon是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存储在Tachyon里的文件。

Windows上安装HADOOP单机伪分布式集群

Windows上安装HADOOP单机伪分布式集群

中文分词之9271组反义词

中文分词之9271组反义词

Java分布式中文分词组件word分词v1.2发布

Java分布式中文分词组件word分词v1.2发布

Ubuntu上安装HADOOP单机伪分布式集群

Ubuntu上安装HADOOP单机伪分布式集群

一种基于词性序列的人名识别方法

一种基于词性序列的人名识别方法

我的ITEYE和OSCHINA博客的异同(截止2015年5月17日)

我的ITEYE和OSCHINA博客的异同

2015/04/03 05:17
340
计算ITEYE博文在百度的收录与排名情况

计算ITEYE博文在百度的收录与排名情况

2015/04/04 04:00
175
中文分词之11946组同义词

中文分词之11946组同义词

Java应用系统中自动实时检测资源文件内容变化

如何对各种配置信息进行自动加载并实时检测变化

Ubuntu上安装HADOOP多机完全分布式集群

Ubuntu上安装HADOOP多机完全分布式集群

Java实现的基于模板的网页结构化信息精准抽取组件:HtmlExtractor

Java实现的基于模板的网页结构化信息精准抽取组件:HtmlExtractor

APDPlat拓展搜索之集成ElasticSearch

APDPlat充分利用Compass的OSEM和ORM integration特性,提供了简单易用且功能强大的内置搜索特性。

word v1.3 发布,Java 分布式中文分词组件

word v1.3 发布,Java 分布式中文分词组件

APDPlat拓展搜索之集成Solr

APDPlat充分利用Compass的OSEM和ORM integration特性,提供了简单易用且功能强大的内置搜索特性。

没有更多内容

加载失败,请刷新页面

返回顶部
顶部