文档章节

solr 6.4.1配置中文分词IK

jsspring
 jsspring
发布于 2017/02/12 21:02
字数 406
阅读 436
收藏 1

1.首先在solr-6.4.1/server/solr-webapp/webapp/WEB-INF目录下新建classes目录(如果存在则忽略).

2.在classes目录下放入以下三个文件在(可从IK-Analyzer下载,也可从文章最后链接下载)

IKAnalyzer.cfg.xml
mydict.dic
stopword.dic

3.在webapp/WEB-INF/lib放入IK分词jar包

ik-analyzer-solr5-5.x.jar

4.配置所添加的core的managed-schema文件

在“<schema name="example-basic" version="1.6">”节点内,添加如下配置

<fieldType name="text_ik" class="solr.TextField">  
  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
</fieldType>  
<field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" />

5.重新Reload.

6.进行分词测试

7.添加mysql索引支持。

表数据如下:

8.修改core中的solrconfig.xml配置文件添加requestHandler节点,

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
	<lst name="defaults">
		<str name="config">dataimport-config.xml</str>
	</lst>
</requestHandler>
<requestHandler name="/select" class="solr.SearchHandler">

9.在同级目录添加dataimport-config.xml文件,配置mysql连接属性和索引

<dataConfig>
	<dataSource type="JdbcDataSource"
			  driver="com.mysql.jdbc.Driver"
			  url="jdbc:mysql://localhost/solr"
			  encoding="UTF-8"
			  user="root"
			  password="root"/>
	<document name="blog_publishing">
		<entity name="blog" transformer="DateFormatTransformer"
			query="select * from blog">
			<field column='id' name='id'/>
			<field column='title' name='title'/>
			<field column='content' name='content'/>
		</entity>
	</document>
</dataConfig>

10.修改managed-schema配置文件

<schema name="example-basic" version="1.6">
    <fieldType name="blog_ik" class="solr.TextField">  
        <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
	<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
    <field name="id_"  type="string" indexed="true"  stored="true"  multiValued="false" />
    <field name="title" type="string" indexed="true" stored="true" />
    <field name="content" type="blog_ik" indexed="true" stored="true" multiValued="false"/>
................
................

11.执行dataimport,导入或更新索引。

注:此处可能会出现org.apache.solr.handler.dataimport.DataImportHandler相关错误,我在solr-6.4.1\contrib\extraction\lib下添加mysql-connector-java-5.1.34-bin.jar和solr-dataimporthandler-6.4.1.jar包可解决,solr-dataimporthandler-6.4.1.jar在solr-6.4.1\dist目录下可找到。

12.查询结果如下

注:文中提到的所有配置资源可从此处下载。

© 著作权归作者所有

共有 人打赏支持
jsspring
粉丝 1
博文 21
码字总数 4410
作品 0
苏州
程序员
私信 提问
Solr环境搭建及IK分词的集成及solrJ的调用(二)

看上一篇请移步到这里:http://my.oschina.net/zimingforever/blog/120732 Solr环境搭建及IK分词的集成及solrJ的调用(一) 这里首先介绍如何做分词,首先solr并没有加入中文分词在里面,所以...

王小明123
2013/04/08
0
5
m631521383/IKAnalyzer2017_6_6_0

IKAnalyzer201766_0 码云:https://git.oschina.net/iicode/IKAnalyzer2017660 Github:https://github.com/ittalks/IKAnalyzer2017660 IKAnalyzer2017660.jar:https://github.com/ittalks/IK......

m631521383
2017/09/15
0
0
Solr之中文分词的配置

一、ik包配置 ik-analyzer-solr5-5.x.jar这个jar包放入solr项目下的WEB-INFlib目录中去,将IKAnalyzer.cfg.xml,mydict.dic(搜狗的扩展词库),stopword.dic放在solr项目下的WEB-INFclasse...

小兵成长记
2016/11/15
2
0
Solr4.9.1在linux环境下的配置安装

运行环境:CentOS6.4 Tomcat7.0 JDK1.7 软件版本: solr-4.9.1 下载链接:http://apache.fayea.com/lucene/solr/ IK-Analyzer-2012FF 下载链接:http://git.oschina.net/wltea/IK-Analyzer-......

三平行者
2015/04/02
0
0
solr配置IK分词

IK Analyzer分词器 这个其实比较好配,奈何资源不好找,而且用solr搜中文一般都用这个我把分词器打了个包放在下面了。里面没有字典,希望哪位又好用的互通下有无。 http://pan.baidu.com/s/1...

千惊万喜
2016/06/23
25
0

没有更多内容

加载失败,请刷新页面

加载更多

iOS个人中心渐变动画、微信对话框、标签选择器、自定义导航栏、短信验证输入框等源码

iOS精选源码 简单的个人中心页面-自定义导航栏并予以渐变动画 程序员取悦女票的正确姿势---Tip1(iOS美容篇) iOS 前台重启应用和清除角标的问题 微信原生提醒对话框3.0 JHLikeButton - 有趣...

Android爱开源
3分钟前
0
0
Yii2使用驼峰命名的形式访问控制器

yii2在使用的时候,访问控制器的时候,如果控制器的名称是驼峰命名法,那访问的url中要改成横线的形式。例如: public function actionRoomUpdate(){//}//访问的时候就要www.test.co...

dragon_tech
6分钟前
0
0
Navicat使用教程:使用Navicat Query Analyzer优化查询性能(第2部分)

下载Navicat Monitor最新版本 Navicat Monitor 是一套安全、简单而且无代理的远程服务器监控工具。它具有强大的功能使你的监控发挥最大效用。受监控的服务器包括 MySQL、MariaDB 和 Percona ...

电池盒
13分钟前
0
0
Python3 读写utf-8文本文件

with open('testRead.txt', 'r', encoding='utf-8') as f: for each_line in f: Passwith open('testWrite.txt', 'w', encoding='utf-8') as f: f.write('写入的内容'......

编程老陆
16分钟前
0
0
Linux syslog相关函数详解

介绍 syslog是Unix系统的日志系统。可以将日志记录在本地系统中。 一个完整的syslong日志包含如下信息:程序模块 | 严重性 | 时间 | 主机名 | 进程名 | 进程ID | 正文。 syslong相关函数 1....

RongJinhui0
20分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部