文档章节

solr 6.4.1配置中文分词IK

jsspring
 jsspring
发布于 2017/02/12 21:02
字数 406
阅读 425
收藏 1

1.首先在solr-6.4.1/server/solr-webapp/webapp/WEB-INF目录下新建classes目录(如果存在则忽略).

2.在classes目录下放入以下三个文件在(可从IK-Analyzer下载,也可从文章最后链接下载)

IKAnalyzer.cfg.xml
mydict.dic
stopword.dic

3.在webapp/WEB-INF/lib放入IK分词jar包

ik-analyzer-solr5-5.x.jar

4.配置所添加的core的managed-schema文件

在“<schema name="example-basic" version="1.6">”节点内,添加如下配置

<fieldType name="text_ik" class="solr.TextField">  
  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
</fieldType>  
<field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" />

5.重新Reload.

6.进行分词测试

7.添加mysql索引支持。

表数据如下:

8.修改core中的solrconfig.xml配置文件添加requestHandler节点,

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
	<lst name="defaults">
		<str name="config">dataimport-config.xml</str>
	</lst>
</requestHandler>
<requestHandler name="/select" class="solr.SearchHandler">

9.在同级目录添加dataimport-config.xml文件,配置mysql连接属性和索引

<dataConfig>
	<dataSource type="JdbcDataSource"
			  driver="com.mysql.jdbc.Driver"
			  url="jdbc:mysql://localhost/solr"
			  encoding="UTF-8"
			  user="root"
			  password="root"/>
	<document name="blog_publishing">
		<entity name="blog" transformer="DateFormatTransformer"
			query="select * from blog">
			<field column='id' name='id'/>
			<field column='title' name='title'/>
			<field column='content' name='content'/>
		</entity>
	</document>
</dataConfig>

10.修改managed-schema配置文件

<schema name="example-basic" version="1.6">
    <fieldType name="blog_ik" class="solr.TextField">  
        <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
	<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
    <field name="id_"  type="string" indexed="true"  stored="true"  multiValued="false" />
    <field name="title" type="string" indexed="true" stored="true" />
    <field name="content" type="blog_ik" indexed="true" stored="true" multiValued="false"/>
................
................

11.执行dataimport,导入或更新索引。

注:此处可能会出现org.apache.solr.handler.dataimport.DataImportHandler相关错误,我在solr-6.4.1\contrib\extraction\lib下添加mysql-connector-java-5.1.34-bin.jar和solr-dataimporthandler-6.4.1.jar包可解决,solr-dataimporthandler-6.4.1.jar在solr-6.4.1\dist目录下可找到。

12.查询结果如下

注:文中提到的所有配置资源可从此处下载。

© 著作权归作者所有

共有 人打赏支持
jsspring
粉丝 1
博文 21
码字总数 4410
作品 0
苏州
程序员
Solr环境搭建及IK分词的集成及solrJ的调用(二)

看上一篇请移步到这里:http://my.oschina.net/zimingforever/blog/120732 Solr环境搭建及IK分词的集成及solrJ的调用(一) 这里首先介绍如何做分词,首先solr并没有加入中文分词在里面,所以...

王小明123
2013/04/08
0
5
m631521383/IKAnalyzer2017_6_6_0

IKAnalyzer201766_0 码云:https://git.oschina.net/iicode/IKAnalyzer2017660 Github:https://github.com/ittalks/IKAnalyzer2017660 IKAnalyzer2017660.jar:https://github.com/ittalks/IK......

m631521383
2017/09/15
0
0
Solr之中文分词的配置

一、ik包配置 ik-analyzer-solr5-5.x.jar这个jar包放入solr项目下的WEB-INFlib目录中去,将IKAnalyzer.cfg.xml,mydict.dic(搜狗的扩展词库),stopword.dic放在solr项目下的WEB-INFclasse...

小兵成长记
2016/11/15
2
0
Solr4.9.1在linux环境下的配置安装

运行环境:CentOS6.4 Tomcat7.0 JDK1.7 软件版本: solr-4.9.1 下载链接:http://apache.fayea.com/lucene/solr/ IK-Analyzer-2012FF 下载链接:http://git.oschina.net/wltea/IK-Analyzer-......

三平行者
2015/04/02
0
0
solr配置IK分词

IK Analyzer分词器 这个其实比较好配,奈何资源不好找,而且用solr搜中文一般都用这个我把分词器打了个包放在下面了。里面没有字典,希望哪位又好用的互通下有无。 http://pan.baidu.com/s/1...

千惊万喜
2016/06/23
25
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

nginx访问日志-日志切割-静态文件不记录日志和过期时间

nginx访问日志: vim /usr/local/nginx/conf/nginx.conf #搜索log_format 该字段定义日志格式,默认如下: #combined_realip日志格式的名字,可随意定义; 定义访问日志: 需在虚拟主机配置文...

ZHENG-JY
4分钟前
0
0
180.mariadb 主从复制

参考:https://blog.csdn.net/chengxuzaza/article/details/62042920 睡觉睡觉,明天写 1.效果 当主库中数据有变化的时候,从库就自动同步 2. 环境要求 至少两台 linux服务器 (教程:https...

Lucky_Me
13分钟前
0
0
erlng file id3v1 id3v1.1

%% ---%% Excerpted from "Programming Erlang",%% published by The Pragmatic Bookshelf.%% Copyrights apply to this code. It may not be used to create training material, %% ......

xueyuse0012
14分钟前
1
0
RabbitMq的安装

环境Centos6.5 32位 JDK 1.7.8 Jdk的卸载 rpm -qa|grep jdk yum –y remove 上边的安装包 JDK的安装 Rpm –ivh jdk安装包 配置环境变量 export JAVA_BIN=/usr/java/jdk1.7.0_80/bin export J......

DemonsI
18分钟前
0
0
http和https协议

HTTPS全称为Hypertext Transfer Protocol over Secure Socket Layer,中文含义为“超文本传输协议在安全加密字层”,简单来说就是加密数据传输,通俗的说就是安全连接。 HTTPS安全超文本传输...

寰宇01
25分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部