文档章节

solr 6.4.1配置中文分词IK

jsspring
 jsspring
发布于 2017/02/12 21:02
字数 406
阅读 427
收藏 1

1.首先在solr-6.4.1/server/solr-webapp/webapp/WEB-INF目录下新建classes目录(如果存在则忽略).

2.在classes目录下放入以下三个文件在(可从IK-Analyzer下载,也可从文章最后链接下载)

IKAnalyzer.cfg.xml
mydict.dic
stopword.dic

3.在webapp/WEB-INF/lib放入IK分词jar包

ik-analyzer-solr5-5.x.jar

4.配置所添加的core的managed-schema文件

在“<schema name="example-basic" version="1.6">”节点内,添加如下配置

<fieldType name="text_ik" class="solr.TextField">  
  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
</fieldType>  
<field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" />

5.重新Reload.

6.进行分词测试

7.添加mysql索引支持。

表数据如下:

8.修改core中的solrconfig.xml配置文件添加requestHandler节点,

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
	<lst name="defaults">
		<str name="config">dataimport-config.xml</str>
	</lst>
</requestHandler>
<requestHandler name="/select" class="solr.SearchHandler">

9.在同级目录添加dataimport-config.xml文件,配置mysql连接属性和索引

<dataConfig>
	<dataSource type="JdbcDataSource"
			  driver="com.mysql.jdbc.Driver"
			  url="jdbc:mysql://localhost/solr"
			  encoding="UTF-8"
			  user="root"
			  password="root"/>
	<document name="blog_publishing">
		<entity name="blog" transformer="DateFormatTransformer"
			query="select * from blog">
			<field column='id' name='id'/>
			<field column='title' name='title'/>
			<field column='content' name='content'/>
		</entity>
	</document>
</dataConfig>

10.修改managed-schema配置文件

<schema name="example-basic" version="1.6">
    <fieldType name="blog_ik" class="solr.TextField">  
        <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
	<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
    <field name="id_"  type="string" indexed="true"  stored="true"  multiValued="false" />
    <field name="title" type="string" indexed="true" stored="true" />
    <field name="content" type="blog_ik" indexed="true" stored="true" multiValued="false"/>
................
................

11.执行dataimport,导入或更新索引。

注:此处可能会出现org.apache.solr.handler.dataimport.DataImportHandler相关错误,我在solr-6.4.1\contrib\extraction\lib下添加mysql-connector-java-5.1.34-bin.jar和solr-dataimporthandler-6.4.1.jar包可解决,solr-dataimporthandler-6.4.1.jar在solr-6.4.1\dist目录下可找到。

12.查询结果如下

注:文中提到的所有配置资源可从此处下载。

© 著作权归作者所有

共有 人打赏支持
jsspring
粉丝 1
博文 21
码字总数 4410
作品 0
苏州
程序员
私信 提问
Solr环境搭建及IK分词的集成及solrJ的调用(二)

看上一篇请移步到这里:http://my.oschina.net/zimingforever/blog/120732 Solr环境搭建及IK分词的集成及solrJ的调用(一) 这里首先介绍如何做分词,首先solr并没有加入中文分词在里面,所以...

王小明123
2013/04/08
0
5
m631521383/IKAnalyzer2017_6_6_0

IKAnalyzer201766_0 码云:https://git.oschina.net/iicode/IKAnalyzer2017660 Github:https://github.com/ittalks/IKAnalyzer2017660 IKAnalyzer2017660.jar:https://github.com/ittalks/IK......

m631521383
2017/09/15
0
0
Solr4.9.1在linux环境下的配置安装

运行环境:CentOS6.4 Tomcat7.0 JDK1.7 软件版本: solr-4.9.1 下载链接:http://apache.fayea.com/lucene/solr/ IK-Analyzer-2012FF 下载链接:http://git.oschina.net/wltea/IK-Analyzer-......

三平行者
2015/04/02
0
0
Solr之中文分词的配置

一、ik包配置 ik-analyzer-solr5-5.x.jar这个jar包放入solr项目下的WEB-INFlib目录中去,将IKAnalyzer.cfg.xml,mydict.dic(搜狗的扩展词库),stopword.dic放在solr项目下的WEB-INFclasse...

小兵成长记
2016/11/15
2
0
solr配置IK分词

IK Analyzer分词器 这个其实比较好配,奈何资源不好找,而且用solr搜中文一般都用这个我把分词器打了个包放在下面了。里面没有字典,希望哪位又好用的互通下有无。 http://pan.baidu.com/s/1...

千惊万喜
2016/06/23
25
0

没有更多内容

加载失败,请刷新页面

加载更多

SonarQube+Scanners代码质量管理

简介 sonaqube是一个开源代码质量管理平台,致力于持续分析和测量技术质量。 系统构成 SonarQube平台由4部分组成: SonarQube服务器 Web服务器的开发者,管理者,浏览质量快照和配置SonarQu...

阿dai
58分钟前
0
0
mysql-router 8 yum安装

1.配置安装源 #配置MySQL5.7的安装源 #https://repo.mysql.com/mysql57-community-release-el7.rpm #https://repo.mysql.com/mysql57-community-release-el7-11.noarch.rpm rpm -Uvh https:/......

MichaelShu
今天
0
0
     甲骨人-MySQL网络课-day03

===================================================================================== ======================= 第三章 mysql SQL语句 1、mysql接口自带命令 1.1、\h 或 help 或 ? 1.2、......

hnairdb
今天
0
0
Redis异构集群之间数据迁移方案

一、Redis集群迁移工具 最近在做Redis数据迁移,网上找了两款开源的Redis迁移工具。 第一种:redis-port Codis官方提供的一个工具,redis-port是一个Redis工具,通过解析rdb文件,实现Redis...

IT--小哥
今天
3
0
解压zip包(zip4j)

1:引入zip4j_1.3.2.jar 2:源码如下: package test;import java.io.File;import java.io.IOException;import java.util.ArrayList;import java.util.List;import net.lingal......

uug
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部