文档章节

7步从零开始搭建一个SOLR支持中文分词【solr3.3】

abcijkxyz
 abcijkxyz
发布于 2016/07/08 16:31
字数 499
阅读 1
收藏 0

下载如下三个软件【请注意版本】

1:Solr的下载地址
http://labs.renren.com/apache-mirror//lucene/solr/3.3.0/apache-solr-3.3.0.zip 【使用 D:\solr\apache-solr-3.3.0\example\solr文件夹里的内容】
2:Tomcat的下载地址
http://apache.etoak.com/tomcat/tomcat-6/v6.0.33/bin/apache-tomcat-6.0.33.tar.gz 【使用其运行JAVA WEB】
3:IKAnalyzer下载地址
http://ik-analyzer.googlecode.com/files/IKAnalyzer3.2.8%20bin.zip 【只使用其IKAnalyzer3.2.5Stable.jar】

提前是安装好JDK1.6+,并将每个软件解压到 /sinykk 里


1、将TOMCAT解压到 /usr/local/apache-tomcat-6.0.33/ 

2、将 /solr/apache-solr-3.3.0/example/solr 文件拷贝到 /usr/local/apache-tomcat-6.0.33/

3、然后修改TOMCAT的/usr/local/apache-tomcat-6.0.33/conf/server.xml【增加中文支持】

Xml代码   收藏代码
  1. <Connector port="8983" protocol="HTTP/1.1"   
  2.               connectionTimeout="20000"   
  3.               redirectPort="8443" URIEncoding="UTF-8"/>  

 

 4、添加文件 /usr/local/apache-tomcat-6.0.33/conf/Catalina/localhost/solr.xml 内容如下

 

 

Xml代码   收藏代码
  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <Context docBase="/usr/local/apache-tomcat-6.0.33/webapps/solr" debug="0" crossContext="true" >  
  3.    <Environment name="solr/home" type="java.lang.String" value="/usr/local/apache-tomcat-6.0.33/solr" override="true" />  
  4. </Context>  
 

5、将/sinykk/solr/apache-solr-3.3.0/example/webapps/solr.war文件放到/usr/local/apache-tomcat-6.0.33/webapps文件夹下,并启动TOMCAT

6、将/sinykk/solr/IKAnalyzer3.2.8.jar 文件放到/usr/local/apache-tomcat-6.0.33/webapps/solr/WEB-INF/lib 目录下


7、修改/usr/local/apache-tomcat-6.0.33/solr/conf/schema.xml文件为

 

Xml代码   收藏代码
  1. <?xml version="1.0" encoding="UTF-8" ?>  
  2. <schema name="example" version="1.4">  
  3.  <types>  
  4.     <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>  
  5.      <!--   
  6.     <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">  
  7.       <analyzer type="index">  
  8.         <tokenizer class="solr.StandardTokenizerFactory"/>  
  9.         <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />  
  10.         <filter class="solr.LowerCaseFilterFactory"/>  
  11.       </analyzer>  
  12.       <analyzer type="query">  
  13.         <tokenizer class="solr.StandardTokenizerFactory"/>  
  14.         <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />  
  15.         <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>  
  16.         <filter class="solr.LowerCaseFilterFactory"/>  
  17.       </analyzer>  
  18.     </fieldType>  
  19.     -->  
  20.   
  21.      <fieldType name="textik" class="solr.TextField" >  
  22.                <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>    
  23.          
  24.                <analyzer type="index">    
  25.                    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>    
  26.                    <filter class="solr.StopFilterFactory"    
  27.                            ignoreCase="true" words="stopwords.txt"/>    
  28.                    <filter class="solr.WordDelimiterFilterFactory"    
  29.                            generateWordParts="1"    
  30.                            generateNumberParts="1"    
  31.                            catenateWords="1"    
  32.                            catenateNumbers="1"    
  33.                            catenateAll="0"    
  34.                            splitOnCaseChange="1"/>    
  35.                    <filter class="solr.LowerCaseFilterFactory"/>    
  36.                    <filter class="solr.EnglishPorterFilterFactory"    
  37.                        protected="protwords.txt"/>    
  38.                    <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>    
  39.                </analyzer>    
  40.                 <analyzer type="query">    
  41.                    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>    
  42.                    <filter class="solr.StopFilterFactory"    
  43.                            ignoreCase="true" words="stopwords.txt"/>    
  44.                    <filter class="solr.WordDelimiterFilterFactory"    
  45.                            generateWordParts="1"    
  46.                            generateNumberParts="1"    
  47.                            catenateWords="1"    
  48.                            catenateNumbers="1"    
  49.                            catenateAll="0"    
  50.                            splitOnCaseChange="1"/>    
  51.                    <filter class="solr.LowerCaseFilterFactory"/>    
  52.                    <filter class="solr.EnglishPorterFilterFactory"    
  53.                        protected="protwords.txt"/>    
  54.                    <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>    
  55.                </analyzer>    
  56.          
  57. </fieldType>  
  58.  </types>  
  59.   
  60.   
  61.  <fields>  
  62.   <field name="id" type="string" indexed="true" stored="true" required="true" />   
  63.  </fields>  
  64.   
  65.  <uniqueKey>id</uniqueKey>  
  66.   
  67. </schema>  

 

 

最后运行http://192.168.171.129:8983/solr/admin/analysis.jsp

效果图如下

 


 

本文转载自:http://blog.csdn.net/yuwenruli/article/details/8426982

共有 人打赏支持
abcijkxyz
粉丝 61
博文 6196
码字总数 1876
作品 0
深圳
项目经理
Solr环境搭建及IK分词的集成及solrJ的调用(二)

看上一篇请移步到这里:http://my.oschina.net/zimingforever/blog/120732 Solr环境搭建及IK分词的集成及solrJ的调用(一) 这里首先介绍如何做分词,首先solr并没有加入中文分词在里面,所以...

王小明123
2013/04/08
0
5
Solr环境搭建及IK分词的集成及solrJ的调用(一)

项目需要,最近在做使用solr进行搜索的项目。 solr是一个基于lucene的java开发的搜索服务器,简单点说solr是一个已经完成的war包,直接部署起来即可。 solr的安装比较简单,但是第一次使用,...

王小明123
2013/04/08
0
0
大数据下精确快速搜索OpenSearch

相信做过一两个项目的人都会遇到上级要求做一个类似百度或者谷歌的站内搜索功能。传统的sql查询只能使用like 或者FINDINSET来实现、后者性能稍微好点但是必须要逗号分隔才可以实现匹配、甚至...

小柒2012
2014/10/11
1K
1
JAVAEE——宜立方商城08:Zookeeper+SolrCloud集群搭建、搜索功能切换到集群版、Activemq消息队列搭建与使用

1. 学习计划 1、solr集群搭建 2、使用solrj管理solr集群 3、把搜索功能切换到集群版 4、添加商品同步索引库。 a) Activemq b) 发送消息 c) 接收消息 2. 什么是SolrCloud SolrCloud(solr 云)...

kent鹏
07/28
0
0
m631521383/IKAnalyzer2017_6_6_0

IKAnalyzer201766_0 码云:https://git.oschina.net/iicode/IKAnalyzer2017660 Github:https://github.com/ittalks/IKAnalyzer2017660 IKAnalyzer2017660.jar:https://github.com/ittalks/IK......

m631521383
2017/09/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

深入理解OAuth2.0协议

1. 引言 如果你开车去酒店赴宴,你经常会苦于找不到停车位而耽误很多时间。是否有好办法可以避免这个问题呢?有的,听说有一些豪车的车主就不担心这个问题。豪车一般配备两种钥匙:主钥匙和泊...

xtof
10分钟前
0
0
Linux学习-0920

3.4 usermod命令 3.5 用户密码管理 3.6 mkpasswd命令 一、usermode命令 usermode作用是用来修改用户信息。 方法: usermod 参数 username 示例1:修改用户uid usermod -u 1010 test5 示例2...

wxy丶
20分钟前
0
0
synchronized锁对象的坑

今天本来写点其他东西,碰巧写了一下synchronized,没想到掉坑里面了,大佬别笑。 起初代码大概是这样的: package com.ripplechan.part_1_2_3;import java.util.concurrent.CountDownL...

RippleChan
23分钟前
0
0
XAMPP环境搭建(Apache + MariaDB + PHP + Perl)

operation system:ubuntu-18.04.1 step1:download XAMPP #sudo wget https://www.apachefriends.org/xampp-files/7.2.9/xampp-linux-x64-7.2.9-0-installer.run step2:install XAMPP #sudo ......

硅谷课堂
25分钟前
0
0
关于获取3DS MAX中的蒙皮数据 3DSMAX C++API的应用

目的是为OSG做自定义的导出插件. 记录取得数据的方法. Max在代码中会提供一个INode对象. 从这个对象里取出各种数据. getSkin这个函数取出了ISkin修改器 下面这个函数一样是用于学习, 把数据输...

洛克人杰洛
32分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部