加载中
搜索引擎的分片(shard)和副本(replica)机制

搜索引擎通过分片(shard)和副本(replica)实现了高性能、高伸缩和高可用。

保障服务的持续高可用、高性能及负载均衡

保障服务的持续高可用、高性能及负载均衡 高可用: 服务多副本 高性能: 超时限制 负载均衡: 环形队列 已经实现的功能: 1. HTTP调用方式的搜索服务 2. REDIS访问 一句话说明白这个项目的原理...

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式...

中文分词算法 之 基于词典的逆向最大匹配算法

实验表明:对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效。在大规模文本分析中,如何提高分词算法的性能呢?

互联网时代下的合作治理机制及其应用:以开源软件项目为例

互联网时代下的合作治理机制及其应用:以开源软件项目为例

986组同义词辨析

192本软件著作用词分析

2015/03/28 00:10
433
利用1912个精选句子彻底掌握3231个单词

利用1912个精选句子彻底掌握3231个单词,第一部分是句子,句子中对词频小于10的词做了标注,第二部是词,词后面跟的是词频。

2015/04/02 06:13
1K

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部