文档章节

solr的分词器

xpttxsok
 xpttxsok
发布于 2016/06/21 21:19
字数 297
阅读 26
收藏 1
1.将IKAnalyzer2012FF_u1.jar包拷贝到 /usr/local/devTools/solr/apache-tomcat-7.0.47/webapps/solr/WEB-INF/lib文件夹下面

2.将IKAnalyzer.cfg.xml,ext_stopword.dic,mydict.dic拷贝到/usr/local/devTools/solr/apache-tomcat-7.0.47/webapps/solr/WEB-INF/classes,classpath下面
注意扩展词典,和停用词词典必须是UTF-8

3.配置filedType,在solrhome/collection1/conf/schema.xml末尾中配置如下信息
<fieldType name="text_ik" class="solr.TextField">
  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

4.配置业务字段,
    业务字段判断标准,
    1.该字段是否在搜索时是否需要在字段上收索,
    2.后续操作是否需要用到该字段

用到的字段
    商品id,商品title,商品买点,价格,商品img,商品分类名称,商品描述
    1.id===>商品id
    ... ...
在solrhome/collection1/conf/schema.xml文件末尾配置如下

<field name="item_title" type="text_ik" indexed="true" stored="true"/>
<field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>
<field name="item_price"  type="long" indexed="true" stored="true"/>
<field name="item_image" type="string" indexed="false" stored="true" />
<field name="item_category_name" type="string" indexed="true" stored="true" />
<field name="item_desc" type="text_ik" indexed="true" stored="false" />

<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
<copyField source="item_title" dest="item_keywords"/>
<copyField source="item_sell_point" dest="item_keywords"/>
<copyField source="item_category_name" dest="item_keywords"/>
<copyField source="item_desc" dest="item_keywords"/>

item_keywords:搜索域


5.从新启动tomcat

 

配置:

 

浏览器页面

 

 

 

 

© 著作权归作者所有

上一篇: El表达式
下一篇: solr安装
xpttxsok
粉丝 7
博文 185
码字总数 108076
作品 0
徐汇
程序员
私信 提问
solr7.0 中文分词+拼音分词

资料准备 • solr7.0下载 • IK分词器下载 • 拼音分词器下载 solr文件目录(只讲一下7有些变化的目录) • web目录 : solr7/server/solr_webapp/webapp/ • home目录 : solr7/server/solr • ...

supersyd
2018/03/12
0
0
solr 分词过程基本介绍

managed-schema 配置文件中指定了所有的fields及对应的分词器设置 对应的配置文件如下 Solr 中一个典型的分词器配置如下 先配置一个 field,如下 Field 对应的分词器,需要配置一个analyzer(...

walle-Liao
2016/05/29
264
0
solr添加中文IK分词器,以及配置自定义词库

Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于HTTP 的管理界面...

超人学院
2015/05/08
7.1K
0
【Solr】- 分析器 Analyzers

作用:解析用户传递的搜索信息,抽取出关键字,然后进行过滤,最后去索引库检索,返回用户需要的信息,例如百度的关键字竞价机制 Solr分析器组成:分词器和过滤器 分词器:抽取关键字 过滤器...

ZeroneLove
02/26
14
0
springboot 整合 solr

一、下载 solr 下载地址 ,选择你想要下载的版本 下载解压 二、启动 solr solr 的启动方式有多种,可以结合 tomcat,新版本的 solr 可以直接启动。这里通过命令行启动。 打开 cmd,启动项目 ...

嘴角轻扬30
07/24
57
0

没有更多内容

加载失败,请刷新页面

加载更多

Activity启动模式二

上篇文章Activity启动模式一主要介绍了Activity的四种启动模式,这些启动模式都是在AndroidManifest中进行配置的。除此之外,Android系统还通过Intent类提供了一些标志位,同样可以指定Activ...

ltlovezh
58分钟前
7
0
三原色还原

1、Color Filter Array — CFA 随着数码相机、手机的普及,CCD/CMOS 图像传感器近年来得到广泛的关注和应用。 图像传感器一般都采用一定的模式来采集图像数据,常用的有 BGR 模式和 CFA 模式...

天王盖地虎626
今天
7
0
kubernetes pod exec接口调用

正文 一般生产环境上由于网络安全策略,大多数端口是不能为集群外部访问的。多个集群之间一般都是通过k8s的ApiServer组件提供的接口通信,如https://192.168.1.101:6443。所以在做云平台时,...

码农实战
今天
8
0
3_数组

3_数组

行者终成事
今天
8
0
经典系统设计面试题解析:如何设计TinyURL(二)

原文链接:https://www.educative.io/courses/grokking-the-system-design-interview/m2ygV4E81AR 编者注:本文以一道经典的系统设计面试题:《如何设计TinyURL》的参考答案和解析为例,帮助...

APEMESH
今天
7
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部