ITEYE博文抄袭检查

比如我写了一篇文章:“使用Java8实现自己的个性化搜索引擎”,我想知道有哪些网站转载了我的文章,我该怎么办呢?

OSCHINA博文抄袭检查

比如我写了一篇文章:“使用Java8实现自己的个性化搜索引擎”,我想知道有哪些网站转载了我的文章,我该怎么办呢?

一种利用ngram模型来消除歧义的中文分词方法

一种利用ngram模型来消除歧义的中文分词方法

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

网络爬虫面临的挑战 之 链接构造

爬虫与反爬虫就好像是安全领域的破解与反破解一样,相互矛盾,相互克制,同时也相互促进。

superword中的模板抽取实践

superword中的模板抽取实践

这真真是极好的

这真真是极好的

2015/11/20 23:10
222
一种使用随机抽样梯度下降算法来预估词汇量的方法

一种使用随机抽样梯度下降算法来预估词汇量的方法

中文分词算法 之 基于词典的正向最大匹配算法

基于词典的正向最大匹配算法,算法会根据词典文件自动调整最大长度,分词的好坏完全取决于词典。随着词典越来越大,算法的时空复杂性怎么权衡呢?

superword中一次精彩的重构

superword中一次精彩的重构

2016/04/20 21:50
663
中国机器翻译的世纪回顾

中国机器翻译的世纪回顾

2015/05/25 13:31
164
100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序

100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序

2015/09/26 17:39
860
986组同义词辨析

192本软件著作用词分析

2015/03/28 00:10
382
利用1912个精选句子彻底掌握3231个单词

利用1912个精选句子彻底掌握3231个单词,第一部分是句子,句子中对词频小于10的词做了标注,第二部是词,词后面跟的是词频。

2015/04/02 06:13
1K

没有更多内容

加载失败,请刷新页面