加载中
中文分词算法 之 词典机制性能优化与测试

中文分词的速度能有多快?120万字符/秒。词典机制的优化很重要,且看慢慢道来......

微服务管理平台如何防止开发人员的本地环境污染注册中心

微服务的代码由两部分构成,一部分是根据模型定义自动生成的,这部分代码不可修改,另外一部分代码是留给开发人员实现业务逻辑的,可以修改。 防止开发人员的本地环境污染注册中心最开始的解...

2018/09/12 22:57
2.3K
软件业的奥斯卡奖:JOLT奖 之 最好的书

一项技术产品只有在获得了Jolt奖之后才能真正成为行业的主流,一本技术书籍只有在获得了Jolt奖之后才能真正奠定经典的地位。

APDPlat的系统启动和关闭流程剖析

APDPlat接管了Spring的启动关闭权,为各种运行其上的开源框架和类库的无缝集成提供了支持。

保障服务的持续高可用、高性能及负载均衡

保障服务的持续高可用、高性能及负载均衡 高可用: 服务多副本 高性能: 超时限制 负载均衡: 环形队列 已经实现的功能: 1. HTTP调用方式的搜索服务 2. REDIS访问 一句话说明白这个项目的原理...

APDPlat如何自动建库建表并初始化数据?

APDPlat共支持10种数据库:DB2、DERBY、H2、HSQL、INFORMIX、MYSQL、ORACLE、POSTGRESQL、SQL_SERVER、SYBASE。

APDPlat中数据库备份恢复的设计与实现

APDPlat提供了web接口的数据库备份与恢复,支持手工操作和定时调度,可下载备份文件到本地,也可把备份文件发送到异地容错,极大地简化了数据库的维护工作。

一种使用随机抽样梯度下降算法来预估词汇量的方法

一种使用随机抽样梯度下降算法来预估词汇量的方法

100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序

100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序

2015/09/26 17:39
2K
Java应用系统中自动实时检测资源文件内容变化

如何对各种配置信息进行自动加载并实时检测变化

中文分词算法 之 基于词典的正向最大匹配算法

基于词典的正向最大匹配算法,算法会根据词典文件自动调整最大长度,分词的好坏完全取决于词典。随着词典越来越大,算法的时空复杂性怎么权衡呢?

SOLR4.2+NUTCH1.6

SOLR4.2+NUTCH1.6

word分词器、ansj分词器、mmseg4j分词器、ik-analyzer分词器分词效果评估

word分词在千万字级(2837 4490字)超大规模人工标注语料库中分词完美率为:55.352688%。测试结果表明,bigram消歧效果良好,完美率提升10%。

2000个软件开发领域的高频特殊词及精选例句(一)

2000个软件开发领域的高频特殊词及精选例句

2015/03/19 22:15
1.2K
Ubuntu上安装HADOOP单机伪分布式集群

Ubuntu上安装HADOOP单机伪分布式集群

如何使用Eclipse在Github上开发使用Java8的Maven项目?

如何使用Eclipse在Github上开发使用Java8的Maven项目?

没有更多内容

加载失败,请刷新页面

返回顶部
顶部