加载中
中文分词效果对比

简单比较word分词、搜狗分词和ansj分词的分词效果

中文分词之9271组反义词

中文分词之9271组反义词

中文分词之11946组同义词

中文分词之11946组同义词

中文分词算法 之 词典机制性能优化与测试

中文分词的速度能有多快?120万字符/秒。词典机制的优化很重要,且看慢慢道来......

中文分词算法 之 基于词典的全切分算法

中文分词算法 之 基于词典的全切分算法

中文分词算法 之 基于词典的正向最小匹配算法

正向最小匹配算法,和正向最大匹配算法相得益彰,一个强调细粒度,一个强调粗粒度

中文分词算法 之 基于词典的逆向最小匹配算法

逆向最小匹配算法,和逆向最大匹配算法相得益彰,一个强调细粒度,一个强调粗粒度

中文分词算法 之 基于词典的逆向最大匹配算法

实验表明:对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效。在大规模文本分析中,如何提高分词算法的性能呢?

一种利用ngram模型来消除歧义的中文分词方法

一种利用ngram模型来消除歧义的中文分词方法

中文分词算法 之 基于词典的正向最大匹配算法

基于词典的正向最大匹配算法,算法会根据词典文件自动调整最大长度,分词的好坏完全取决于词典。随着词典越来越大,算法的时空复杂性怎么权衡呢?

word v1.3 发布,Java 分布式中文分词组件

word v1.3 发布,Java 分布式中文分词组件

Java分布式中文分词组件word分词v1.2发布

Java分布式中文分词组件word分词v1.2发布

superword开源项目中的定义相似规则

superword开源项目中的定义相似规则

互联网时代下的合作治理机制及其应用:以开源软件项目为例

互联网时代下的合作治理机制及其应用:以开源软件项目为例 陈晓红 伴随着国家战略层面的推动,互联网在2015年成为了全国瞩目的焦点。“互联网+”开放数据、分享经济、大众创业万众创新,所...

2016/03/23 01:33
2.5K
开源项目中如何同时支持Git@OSC和Github

开源项目中如何同时支持Git@OSC和Github

2015/05/17 07:52
1.6K
100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序

100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序

2015/09/26 17:39
2K
Java开源项目cws_evaluation:中文分词器分词效果评估

想知道最常用的9大Java中文分词是哪些吗? 想凑凑热闹看看分词效果大PK吗?

计算ITEYE博文在百度的收录与排名情况

计算ITEYE博文在百度的收录与排名情况

2015/04/04 04:00
489

没有更多内容

加载失败,请刷新页面

返回顶部
顶部