Gitee (gitee.com) 是 OSCHINA 推出的代码托管平台,支持 Git 和 SVN,提供免费的私有仓库托管。目前已有近 1000 万的开发者选择 Gitee。
Gitee 贡献 反映用户在 Gitee 上评论、Fork、Star、Push等操作的次数。
免费开通 Gitee
连击 天
fork: star:
word v1.3 发布,Java 分布式中文分词组件
正确地猜测用户的意图
实现JDK没有提供的AtomicFloat
利用word分词通过计算词的语境来获得相关词
利用word分词来对文本进行词频统计
利用word分词来计算文本相似度
如何利用多核提升分词速度
中文分词算法 之 基于词典的全切分算法
中文分词之9271组反义词
一种利用ngram模型来消除歧义的中文分词方法
一种基于词性序列的人名识别方法
中文分词之11946组同义词
Java分布式中文分词组件word分词v1.2发布
给LUKE增加word分词器
如何对各种配置信息进行自动加载并实时检测变化
Java Chinese Word Segmentation Component
逆向最小匹配算法,和逆向最大匹配算法相得益彰,一个强调细粒度,一个强调粗粒度
正向最小匹配算法,和正向最大匹配算法相得益彰,一个强调细粒度,一个强调粗粒度
中文分词的速度能有多快?120万字符/秒。词典机制的优化很重要,且看慢慢道来......
实验表明:对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效。在大规模文本分析中,如何提高分词算法的性能呢?
没有更多内容
加载失败,请刷新页面
下一页
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复
评论删除后,数据将无法恢复