加载中
ES中如何使用逗号来分词

ES中如何使用逗号来分词

利用word分词来对文本进行词频统计

利用word分词来对文本进行词频统计

2015/05/21 13:27
9.2K
利用word分词通过计算词的语境来获得相关词

利用word分词通过计算词的语境来获得相关词

word分词器、ansj分词器、mmseg4j分词器、ik-analyzer分词器分词效果评估

word分词在千万字级(2837 4490字)超大规模人工标注语料库中分词完美率为:55.352688%。测试结果表明,bigram消歧效果良好,完美率提升10%。

Java分布式中文分词组件word分词v1.2发布

Java分布式中文分词组件word分词v1.2发布

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

Java开源项目cws_evaluation:中文分词器分词效果评估

想知道最常用的9大Java中文分词是哪些吗? 想凑凑热闹看看分词效果大PK吗?

word v1.3 发布,Java 分布式中文分词组件

word v1.3 发布,Java 分布式中文分词组件

中文分词效果对比

简单比较word分词、搜狗分词和ansj分词的分词效果

中文分词算法 之 基于词典的逆向最大匹配算法

实验表明:对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效。在大规模文本分析中,如何提高分词算法的性能呢?

中文分词算法 之 词典机制性能优化与测试

中文分词的速度能有多快?120万字符/秒。词典机制的优化很重要,且看慢慢道来......

中文分词算法 之 基于词典的全切分算法

中文分词算法 之 基于词典的全切分算法

中文分词算法 之 基于词典的正向最小匹配算法

正向最小匹配算法,和正向最大匹配算法相得益彰,一个强调细粒度,一个强调粗粒度

没有更多内容

加载失败,请刷新页面

返回顶部
顶部