文档章节

全文检索Solr集成HanLP中文分词

hankcs
 hankcs
发布于 2015/08/23 00:22
字数 135
阅读 53
收藏 0
点赞 0
评论 0
全文检索Solr集成HanLP中文分词
以前发布过HanLP的Lucene插件,后来很多人跟我说其实Solr更流行,于是就抽空做了个Solr插件出来,开源在Github上,欢迎改进。HanLP中文分词solr插件支持Solr5.x,兼容Lucene5.x。快速上手将hanlp-portable.jar和hanlp-solr-plugin.jar共两个jar放入${webapp}/WEB-INF/lib下修改solr core的配置文件${core}/conf/schema.xml:<fieldType name="tex...

继续阅读码农场 » 全文检索Solr集成HanLP中文分词

原文链接http://www.hankcs.com/nlp/segment/full-text-retrieval-solr-integrated-hanlp-chinese-word-segmentation.html

© 著作权归作者所有

共有 人打赏支持
hankcs
粉丝 33
博文 222
码字总数 53918
作品 1
美国
基于python的几种中文分词-词性获取

基于python的几种中文分词-词性获取 根据当前网络上关于中文分词的python包,先取以下四种方式: jieba分词; 清华大学的THULAC; HanLP; pynlpir. 1.测试环境 系统:win10; python版本:pyt...

meiqi0538 ⋅ 05/12 ⋅ 0

汉语言处理包 HanLP 1.6.4 发布,优化新词发现

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,...

王练 ⋅ 05/22 ⋅ 0

汉语言处理包 HanLP 1.6.3 发布,支持动态用户词典

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,...

淡漠悠然 ⋅ 04/16 ⋅ 0

使用solr搭建你的全文检索

文章来源:http://www.blogjava.net/RongHao/archive/2007/11/06/158621.html Solr Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。 一、solr介绍 solr是基于Lucene Java...

hiqj ⋅ 2014/04/18 ⋅ 0

资源 | Chinese Word Vectors:目前最全的中文预训练词向量集合

  选自GitHub   作者:shenshen-hungry   机器之心编译   参与:刘晓坤、思源      对于国内自然语言处理的研究者而言,中文词向量语料库是需求很大的资源。近日,来自人民大学等...

机器之心 ⋅ 05/15 ⋅ 0

[转]solr入门

solr作为nosql,和mysql等关系数据库区别于,solr数据查询功能简单,做倒排索引, 查询效率相对于mysql快. 1,下载solr3.4.0 2,solr+tomcat: 3,solr 过滤查询+like/not like查询 4,solr and/not 查...

skanda ⋅ 2016/01/19 ⋅ 0

Solr Apache Solr 初级教程(介绍、安装部署、Java接口、中文分词)

Apache Solr 介绍 Solr 是什么? Solr 是一个开源的企业级搜索服务器,底层使用易于扩展和修改的Java 来实现。服务器通信使用标准的HTTP 和XML,所以如果使用Solr 了解Java 技术会有用却不是...

David_Tio ⋅ 2013/12/05 ⋅ 0

solr搜索不到中文分词的结果

使用的hanlp分词,索引和搜索的时候都将enableIndexMode参数设为true了,分词结果如下: 全词匹配搜“中医”是可以搜出来的 全词匹配搜“中医药”就搜索不出结果 但是在term info中是可以看到...

雨林神话 ⋅ 2017/04/21 ⋅ 4

自然语言处理--HanLP

hankcs ⋅ 2015/03/28 ⋅ 3

Solr环境搭建及IK分词的集成及solrJ的调用(二)

看上一篇请移步到这里:http://my.oschina.net/zimingforever/blog/120732 Solr环境搭建及IK分词的集成及solrJ的调用(一) 这里首先介绍如何做分词,首先solr并没有加入中文分词在里面,所以...

王小明123 ⋅ 2013/04/08 ⋅ 5

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Springboot2 之 Spring Data Redis 实现消息队列——发布/订阅模式

一般来说,消息队列有两种场景,一种是发布者订阅者模式,一种是生产者消费者模式,这里利用redis消息“发布/订阅”来简单实现订阅者模式。 实现之前先过过 redis 发布订阅的一些基础概念和操...

Simonton ⋅ 18分钟前 ⋅ 0

error:Could not find gradle

一.更新Android Studio后打开Project,报如下错误: Error: Could not find com.android.tools.build:gradle:2.2.1. Searched in the following locations: file:/D:/software/android/andro......

Yao--靠自己 ⋅ 昨天 ⋅ 0

Spring boot 项目打包及引入本地jar包

Spring Boot 项目打包以及引入本地Jar包 [TOC] 上篇文章提到 Maven 项目添加本地jar包的三种方式 ,本篇文章记录下在实际项目中的应用。 spring boot 打包方式 我们知道,传统应用可以将程序...

Os_yxguang ⋅ 昨天 ⋅ 0

常见数据结构(二)-树(二叉树,红黑树,B树)

本文介绍数据结构中几种常见的树:二分查找树,2-3树,红黑树,B树 写在前面 本文所有图片均截图自coursera上普林斯顿的课程《Algorithms, Part I》中的Slides 相关命题的证明可参考《算法(第...

浮躁的码农 ⋅ 昨天 ⋅ 0

android -------- 混淆打包报错 (warning - InnerClass ...)

最近做Android混淆打包遇到一些问题,Android Sdutio 3.1 版本打包的 错误如下: Android studio warning - InnerClass annotations are missing corresponding EnclosingMember annotation......

切切歆语 ⋅ 昨天 ⋅ 0

eclipse酷炫大法之设置主题、皮肤

eclipse酷炫大法 目前两款不错的eclipse 1.系统设置 Window->Preferences->General->Appearance 2.Eclipse Marketplace下载【推荐】 Help->Eclipse Marketplace->搜索‘theme’进行安装 比如......

anlve ⋅ 昨天 ⋅ 0

vim编辑模式、vim命令模式、vim实践

vim编辑模式 编辑模式用来输入或修改文本内容,编辑模式除了Esc外其他键几乎都是输入 如何进入编辑模式 一般模式输入以下按键,均可进入编辑模式,左下角提示 insert(中文为插入) 字样 i ...

蛋黄Yolks ⋅ 昨天 ⋅ 0

大数据入门基础:SSH介绍

什么是ssh 简单说,SSH是一种网络协议,用于计算机之间的加密登录。 如果一个用户从本地计算机,使用SSH协议登录另一台远程计算机,我们就可以认为,这种登录是安全的,即使被中途截获,密码...

董黎明 ⋅ 昨天 ⋅ 0

web3j教程

web3j是一个轻量级、高度模块化、响应式、类型安全的Java和Android类库提供丰富API,用于处理以太坊智能合约及与以太坊网络上的客户端(节点)进行集成。 汇智网最新发布的web3j教程,详细讲解...

汇智网教程 ⋅ 昨天 ⋅ 0

谷歌:安全问题机制并不如你想象中安全

腾讯科技讯 5月25日,如今的你或许已经对许多网站所使用的“安全问题机制”习以为常了,但你真的认为包括“你第一个宠物的名字是什么?”这些问题能够保障你的帐户安全吗? 根据谷歌(微博)安...

问题终结者 ⋅ 昨天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部