Go 语言的高性能协程池
加载中
原
构建自己的搜索引擎之Lucene详解
要开发自己的搜索引擎,就不得不用到Apache基金会的Luence项目,这个项目是一个开放源代码的全文检索引擎工具包,利用Lucene,可以很快捷地开发出自己的搜索引擎。
原
搜索引擎之有限状态机
中文分词中用规则识别的词 数字:123,456.781 90.7% 3/8 11/20/2000 日期:1998年 2009年12月24日10:30 缩略(包含不同的情况): 字母-点号-字母-点号组成的序列,比如:U.S. i.e. 等...
原
Lucene与中文分词
词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与...
没有更多内容
加载失败,请刷新页面
没有更多内容
删除文章
文章删除后无法恢复,确定取消删除此文章吗?
删除动弹
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复