文档章节

solr4.8安装步骤和配置IK分词器

java梦想家01
 java梦想家01
发布于 2015/03/30 15:56
字数 547
阅读 52
收藏 0

Solr4.8 安装步骤如下:

1. 下载solr4.8,到Apache官网下载

2. 准备一个tomcat,我这边用tomcat7

3. 将下载好的solr4.8解压缩开,将里面的solr-4.8.0\solr-4.8.0\example\webapps\solr.war拷贝到上面的tomcat的webapps目录。

4. 建立一个solr工作目录,比如D:\solr\home。将\solr-4.8.0\solr-4.8.0\example\下的solr文件夹拷贝到这个工作目录中。

5. 启动tomcat,solr.war会自动解压,solr4.8需要jdk1.7,我系统变量配置的是1.6。所以,打开上面那个tomcat7下的D:\apache-tomcat-solr\bin下的setclasspath.bat,在 rem Otherwise either JRE or JDK are fine 这句后面手动指定启动JDK和JRE

?
1
2
3
rem 指定你本机的JDK1.7
set JRE_HOME=F:/Java7/jre
set JAVA_HOME=F:/Java7/jdk

6. 将solr-4.8.0\solr-4.8.0\example\lib\ext包下的jar包,全部拷贝到上面tomcat/webapps下解压开的solr工程的lib目录下。

7. 修改tomcat/webapps下solr的web.xml配置文件,指定solr工作目录

?
1
2
3
4
5
<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:/solr/home/solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
 </env-entry>

8. 启动tomcat,访问http://localhost:9090/solr。

备注:修改 D:\solr\home\solr\collection1\conf下的 solrconfig.xml,可以指定一些配置,如索引文件保存路径等,具体看apache帮助文档。

--------------------------------------------------------------------------

接下来,为Solr配置IK中文分词器

1.下载IK Analyzer分词器,lucene4.X和solr4.X的IK Analyzer 要用下面这个版本IK Analyzer 2012FF_hfl

2. 解压IK Analyzer 2012FF_hf1.zip,获得IK Analyzer 2012FF_hf1。将该目录下的IKAnalyzer.cfg.xml,stopword.dic放到之前安装 TOMCAT_HOME/webapps/solr/WEB-INF/classes目录下(没有就创建classes文件夹) IKAnalyzer2012FF_u1.jar放到之前安装的TOMCAT_HOME/webapps/solr/WEB-INF/lib目录下

3.修改/solr_home/collection1/conf/中的schema.xml中增加如下内容:

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
        <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

同时修改filed 使filed引用text_ik.这样才能使用IK分词器。

<field name="name" type="text_ik" indexed="true" stored="true"/>

4.测试:http://localhost:9090/solr/#/collection1/analysis 输入语句,下拉选择name,查看分析结果,说明配置成功。

5. 可以到 D:\solr\solrIndex 上面配置的索引文件路径下,看下是否生成了索引。

本文转载自:http://my.oschina.net/sharkbobo/blog/260735

共有 人打赏支持
java梦想家01
粉丝 11
博文 61
码字总数 14212
作品 0
海淀
加载中

评论(1)

ohoforever
ohoforever
为什么我的ik 装不上
solr4.8安装步骤和配置IK分词器

Solr4.8 安装步骤如下: 1. 下载solr4.8,到Apache官网下载 2. 准备一个tomcat,我这边用tomcat7 3. 将下载好的solr4.8解压缩开,将里面的solr-4.8.0solr-4.8.0examplewebappssolr.war拷贝到...

james_you
2014/05/05
0
1
Elasticsearch 5 Ik+pinyin分词配置详解

一、拼音分词的应用 拼音分词在日常生活中其实很常见,也许你每天都在用。打开淘宝看一看吧,输入拼音”zhonghua”,下面会有包含”zhonghua”对应的中文”中华”的商品的提示: 拼音分词是根据...

napoay
2016/12/28
0
0
solr添加中文IK分词器,以及配置自定义词库

Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于HTTP 的管理界面...

超人学院
2015/05/08
0
0
linux安装elasticsearch部署配置教程

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是...

alan_liuyue的博客
2017/12/13
0
0
ElasticSearch安装ik分词插件

一、IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,...

萧十一郎君
2014/05/03
0
15

没有更多内容

加载失败,请刷新页面

加载更多

下一页

OSChina 周日乱弹 —— 种族不同,禁止交往

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @小小编辑:推荐歌曲《苏菲小姐》- 鱼果 《苏菲小姐》- 鱼果 手机党少年们想听歌,请使劲儿戳(这里) @貓夏:下大雨 正是睡觉的好时候 临睡前...

小小编辑
今天
199
6
Python 搭建简单服务器

Python动态服务器网页(需要使用WSGI接口),基本实现步骤如下: 1.等待客户端的链接,服务器会收到一个http协议的请求数据报 2.利用正则表达式对这个请求数据报进行解析(请求方式、提取出文...

代码打碟手
今天
1
0
Confluence 6 删除垃圾内容

属性(profile)垃圾 属性垃圾的定义为,一个垃圾用户在 Confluence 创建了用户,但是这个用户在自己的属性页面中添加了垃圾 URL。 如果你有很多垃圾用户在你的系统中创建了属性,你可以使用...

honeymose
今天
0
0
qduoj~前端~二次开发~打包docker镜像并上传到阿里云容器镜像仓库

上一篇文章https://my.oschina.net/finchxu/blog/1930017记录了怎么在本地修改前端,现在我要把我的修改添加到部署到本地的前端的docker容器中,然后打包这个容器成为一个本地镜像,然后把这...

虚拟世界的懒猫
今天
1
0
UML中 的各种符号含义

Class Notation A class notation consists of three parts: Class Name The name of the class appears in the first partition. Class Attributes Attributes are shown in the second par......

hutaishi
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部