加载中
Amazon Dynamo的NWR模型

Amazon Dynamo的NWR模型,把CAP的选择权交给了用户,让用户自己选择CAP中的哪两个。

APDPlat如何自动建库建表并初始化数据?

APDPlat共支持10种数据库:DB2、DERBY、H2、HSQL、INFORMIX、MYSQL、ORACLE、POSTGRESQL、SQL_SERVER、SYBASE。

数据生成器

data-generator是一个Java实现的数据生成器开源项目。 如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin...

2018/04/29 23:12
925
对Nutch2.1抽象存储层的一些看法

对Nutch2.1抽象存储层的一些看法

中文分词算法 之 基于词典的全切分算法

中文分词算法 之 基于词典的全切分算法

搜索引擎的分片(shard)和副本(replica)机制

搜索引擎通过分片(shard)和副本(replica)实现了高性能、高伸缩和高可用。

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式...

如何使用Eclipse在Github上开发使用Java8的Maven项目?

如何使用Eclipse在Github上开发使用Java8的Maven项目?

Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift有何不同?

Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift的异同

一种利用ngram模型来消除歧义的中文分词方法

一种利用ngram模型来消除歧义的中文分词方法

中文分词算法 之 基于词典的逆向最大匹配算法

实验表明:对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效。在大规模文本分析中,如何提高分词算法的性能呢?

如何选择使用字符串还是数字呢?

如何选择使用字符串还是数字呢?

2015/08/31 16:17
5.9K
struts2和spring mvc,孰优孰劣?

struts2和spring mvc,孰优孰劣?

2015/04/19 17:40
11.9K
Java开源项目cws_evaluation:中文分词器分词效果评估

想知道最常用的9大Java中文分词是哪些吗? 想凑凑热闹看看分词效果大PK吗?

没有更多内容

加载失败,请刷新页面

返回顶部
顶部