NLPIR大数据分词技术行业信息挖掘的推动者

  随着计算机的日益普及,互联网的快速发展,文本的数量(电子邮件、新闻、网页、科技论文等)在不停的增长,因而对文本作智能化处理以获取所需信息的需求日益迫切。在这样的社会需求下,自然...

ljrj123
04/17
0
0
中文分词开源版--CRF

中文分词是互联网应用不可缺少的基础技术之一,也是其他语音和语言产品必不可少的技术组件。 自2003年第一届国际中文分词评测以来,由字构词的分词方法获得了压倒性优势,国内主要通过CRF++...

langiner
2010/08/26
7.6K
0
基于Sphinx构建准实时更新的分布式通用搜索引擎平台

前言:   2008年7月,我写过一篇文章《基于Sphinx+MySQL的千万级数据全文检索(搜索引擎)架构设计》。有不少网友希望阅读全文,我将该文档整理了一下,分享出来。文档解压后大小为7.33M,...

冬瓜1
2013/12/31
224
1
构建垂直搜索引擎

##定义与原理   搜索引擎( Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用...

fymoon
2016/11/10
97
0
PHP使用中文分词初步接触

PHP使用中文分词学习 因工作上需要,要求在excel表格提交后,对其中的数据进行自动识别,先根据条形码一栏和模板库里的商品进行比对,若是没有条形码,则根据输入的商品名进行比对,此时就需...

xsctx7788
2016/11/23
85
0

没有更多内容

加载失败,请刷新页面

加载更多