文档章节

Apache solr使用

引鸩怼孑
 引鸩怼孑
发布于 2015/09/10 15:46
字数 581
阅读 91
收藏 7

一、Solr介绍

最近在一个项目中做了一个全文检索的功能,刚开始本来打算用Apache Lucene去实现,毕竟之前对Lucene有一点了解,但是在网上看技术类文章时看见了别人介绍Apache Solr,感觉挺好的,

还是一个开源的搜索服务器,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的,高亮显示搜索结果,有自带的中文分词技术。

二、Solr配置

第一步:下载Solr, http://www.apache.org/dyn/closer.cgi/lucene/solr

解压到我下载的是3.6.1版本,把它解压到E盘。E:/apache-solr-3.6.1

第二步:修改conf\server.xml,把8080端口所在的那一行修改如下:

<Connector port="8080" protocol="HTTP/1.1"  

           connectionTimeout="20000"  

           redirectPort="8443" URIEncoding="UTF-8"/>

增加了URIEncoding="UTF-8"这一配置。

第三步:配置solr

在tomcat的conf目录下,增加 Catalina\localhost\solr.xml 文件,如果conf文件夹下没有Catalina,新建它。

solr.xml内容:

<Context docBase="E:/apache-solr-3.6.1/dist/apache-solr-3.6.1.war" debug="0" crossContext="true" >

<Environment name="solr/home" type="java.lang.String" value="E:/apache-solr-3.6.1/example/solr" override="true" /></Context> 

第四步:启动Tomcat。输入http://localhost:8080/solr/ 出现欢迎界面,表示成功。

三、solr使用

在调用Solr服务时使用了apache-solr-solrj-3.6.1.jar,Apache 已经为我们提供了 Solrj 这个工具,我们只需要简单的导入相关包,使用其简单的 API 就可以轻松对 solr 进行操作了

建立与Solr服务的连接

String url = "http://10.13.17.38:8983/solr";  

        CommonsHttpSolrServer server = new CommonsHttpSolrServer(url);  

        server.setSoTimeout(3000); // socket read timeout  

        server.setConnectionTimeout(1000);  

        server.setDefaultMaxConnectionsPerHost(1000);  

        server.setMaxTotalConnections(10);  

        server.setFollowRedirects(false); // defaults to false  

        server.setAllowCompression(true);  

        server.setMaxRetries(1);  

搜索条件的设置

SolrQuery query = new SolrQuery();  

query.setQuery("tags:t5 AND t7");  

        query.addField("auction_id");  

        query.setStart(0);  

        query.setRows(4);  

        query.addSortField("auction_id", SolrQuery.ORDER.desc);  

        query.addSortField("auction_point", SolrQuery.ORDER.asc);  

 

// 设置高亮

query.setHighlight(true); // 开启高亮组件

query.addHighlightField("content");// 高亮字段

query.addHighlightField("titleStr");// 高亮字段

query.setHighlightSimplePre("<font color='red'>");// 标记,高亮关键字前缀

query.setHighlightSimplePost("</font>");// 后缀

query.setHighlightSnippets(3);// 结果分片数,默认为1

query.setHighlightFragsize(70);// 每个分片的最大长度,默认为100

 

加入中文分词

修改solr\conf\schema.xml文件,在文件中加入如下字段类型,

<fieldType name="text_zh" class="solr.TextField"

positionIncrementGap="100">

<analyzer type="index">

<tokenizer

class="org.wltea.analyzer.solr.IKTokenizerFactory" useSmart="false" />

</analyzer>

<analyzer type="query">

<tokenizer

class="org.wltea.analyzer.solr.IKTokenizerFactory" useSmart="false" />

</analyzer>

</fieldType>

然后再你需要分词的字段使用此类型

<field name="content" type="text_zh" indexed="true" stored="true" />

本文转载自:http://w1985chun.iteye.com/blog/1783824

共有 人打赏支持
引鸩怼孑
粉丝 43
博文 205
码字总数 16947
作品 0
南京
项目经理
私信 提问
Solr使用入门指南

由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索。...

楠木楠
2016/08/21
13
0
Solr Installation and Configuration

Introduction Download Solr: http://lucene.apache.org/solr/ 由于OSchina的原因,图片展示成缩略图,如看不清楚的话,请选中相应图片在新标签页进行打开查看。 例如:Solr (Version:sol...

Nathans
2016/09/12
38
0
Solr使用入门指南

由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索。...

帅的不像男的
2016/05/24
26
0
Apache Solr 3.3 发布

Apache Solr 3.3 发布。Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每...

小卒过河
2011/07/01
1K
1
Tomcat下Solr安装配置

由于Solr基于java开发,因此Solr在windows及Linux都能较好部署使用,但由于Solr提供了一些用于测试及管理、维护较为方便的shell脚本,因此在生产部署时候建议安装在Linux上,测试时候可以在w...

超人学院
2015/05/22
0
0

没有更多内容

加载失败,请刷新页面

加载更多

CentOS 安装PHP5和PHP7

安装PHP5 下载解压二进制包 [root@test-a src]# cd /usr/local/src/[root@test-a src]# wget http://cn2.php.net/distributions/php-5.6.32.tar.bz2[root@test-a src]# tar jxvf php-5.6......

野雪球
今天
4
0
windows上类似dnsmasq的软件Dual DHCP DNS Server

官网地址:http://dhcp-dns-server.sourceforge.net/官网定向的下载地址:https://sourceforge.net/projects/dhcp-dns-server/files/ 设置参考地址:http://blog.51cto.com/zhukeqiang/18264......

xueyuse0012
今天
3
0
LinkedHashMap源码解析

前言 HashMap中的元素时无序的,也就是说遍历HashMap的时候,顺序和放入的顺序是不一样的。 如果需要有序的Map,就可以采用LinkedHashMap. LinkedHashMap通过维护一个包含所有元素的双向链表,...

grace_233
今天
3
0
初识flask

文档 0.10.1版本 http://www.pythondoc.com/flask/index.html 1.0.2版本 https://dormousehole.readthedocs.io/en/latest/ 安装flask $ pip3 install flaskCollecting flask Downloading......

yimingkeji
昨天
5
0
Akka系统《sixteen》译

Actor是一个封装状态(state)和行为(behavior)的对象,它们只通过交换消息通信(放入收件人邮箱的邮件)。从某种意义上说,Actor是最严格的面向对象编程形式,但它更适合将他们视为人:在与Act...

woshixin
昨天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部