加载中
利用word分词来对文本进行词频统计

利用word分词来对文本进行词频统计

2015/05/21 13:27
9.2K
word v1.3 发布,Java 分布式中文分词组件

word v1.3 发布,Java 分布式中文分词组件

利用word分词通过计算词的语境来获得相关词

利用word分词通过计算词的语境来获得相关词

word分词器、ansj分词器、mmseg4j分词器、ik-analyzer分词器分词效果评估

word分词在千万字级(2837 4490字)超大规模人工标注语料库中分词完美率为:55.352688%。测试结果表明,bigram消歧效果良好,完美率提升10%。

Java分布式中文分词组件word分词v1.2发布

Java分布式中文分词组件word分词v1.2发布

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

Java开源项目cws_evaluation:中文分词器分词效果评估

想知道最常用的9大Java中文分词是哪些吗? 想凑凑热闹看看分词效果大PK吗?

中文分词效果对比

简单比较word分词、搜狗分词和ansj分词的分词效果

SOLR4.2+NUTCH1.6

SOLR4.2+NUTCH1.6

superword开源项目中的定义相似规则

superword开源项目中的定义相似规则

一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法

本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法,对于其他的用户生成内容站点类型也具有同样的适用性。

中文分词之9271组反义词

中文分词之9271组反义词

没有更多内容

加载失败,请刷新页面

返回顶部
顶部