solr 6.4.1配置中文分词IK
博客专区 > jsspring 的博客 > 博客详情
solr 6.4.1配置中文分词IK
jsspring 发表于1年前
solr 6.4.1配置中文分词IK
  • 发表于 1年前
  • 阅读 418
  • 收藏 1
  • 点赞 0
  • 评论 0

新睿云服务器60天免费使用,快来体验!>>>   

1.首先在solr-6.4.1/server/solr-webapp/webapp/WEB-INF目录下新建classes目录(如果存在则忽略).

2.在classes目录下放入以下三个文件在(可从IK-Analyzer下载,也可从文章最后链接下载)

IKAnalyzer.cfg.xml
mydict.dic
stopword.dic

3.在webapp/WEB-INF/lib放入IK分词jar包

ik-analyzer-solr5-5.x.jar

4.配置所添加的core的managed-schema文件

在“<schema name="example-basic" version="1.6">”节点内,添加如下配置

<fieldType name="text_ik" class="solr.TextField">  
  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
</fieldType>  
<field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" />

5.重新Reload.

6.进行分词测试

7.添加mysql索引支持。

表数据如下:

8.修改core中的solrconfig.xml配置文件添加requestHandler节点,

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
	<lst name="defaults">
		<str name="config">dataimport-config.xml</str>
	</lst>
</requestHandler>
<requestHandler name="/select" class="solr.SearchHandler">

9.在同级目录添加dataimport-config.xml文件,配置mysql连接属性和索引

<dataConfig>
	<dataSource type="JdbcDataSource"
			  driver="com.mysql.jdbc.Driver"
			  url="jdbc:mysql://localhost/solr"
			  encoding="UTF-8"
			  user="root"
			  password="root"/>
	<document name="blog_publishing">
		<entity name="blog" transformer="DateFormatTransformer"
			query="select * from blog">
			<field column='id' name='id'/>
			<field column='title' name='title'/>
			<field column='content' name='content'/>
		</entity>
	</document>
</dataConfig>

10.修改managed-schema配置文件

<schema name="example-basic" version="1.6">
    <fieldType name="blog_ik" class="solr.TextField">  
        <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
	<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
    <field name="id_"  type="string" indexed="true"  stored="true"  multiValued="false" />
    <field name="title" type="string" indexed="true" stored="true" />
    <field name="content" type="blog_ik" indexed="true" stored="true" multiValued="false"/>
................
................

11.执行dataimport,导入或更新索引。

注:此处可能会出现org.apache.solr.handler.dataimport.DataImportHandler相关错误,我在solr-6.4.1\contrib\extraction\lib下添加mysql-connector-java-5.1.34-bin.jar和solr-dataimporthandler-6.4.1.jar包可解决,solr-dataimporthandler-6.4.1.jar在solr-6.4.1\dist目录下可找到。

12.查询结果如下

注:文中提到的所有配置资源可从此处下载。

  • 打赏
  • 点赞
  • 收藏
  • 分享
共有 人打赏支持
粉丝 1
博文 11
码字总数 4379
×
jsspring
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: