文档章节

【原创】Lucene vs Solr

摩云飞
 摩云飞
发布于 2016/04/20 17:38
字数 1084
阅读 126
收藏 7

Lucene vs Solr

原文地址:这里 。

许多新接触 Lucene 和 Solr 的朋友会问这样的问题:我应该使用 Lucene 和 Solr 中的哪一个?
其实答案很简单:如果你是像上面那样问自己的,那么 99% 的情况下,你需要使用的是 Solr

将 Solr 和 Lucene 之间的关系进行概念化类比,可以想象一下汽车和其内部的引擎。你无法直接驾驶引擎,但是你可以驾驶车。同样的道理,Lucene 是一种程序库,你无法直接跑起来,而 Solr 是一种完整应用,可以拿来就用。

什么是 Solr ?

Apache Solr 是一种 web 应用,构建于 Lucene 之上,并实现了很多其他功能。
其添加了如下功能:
  • XML/HTTP and JSON APIs
  • Hit highlighting(高亮命中内容)
  • Faceted Search and Filtering分面搜索和过滤
  • Geospatial Search地理空间搜索
  • Fast Incremental Updates and Index Replication(快读增量更新和索引复制)
  • Caching
  • Replication
  • Web administration interface etc
与 Lucene 不同的是,Solr 是一种 web 应用(WAR),可以部署在任意一种 servlet 容器中,例如 Jetty, Tomcat, Resin 等。
Solr 可以被经由非程序人员安装和使用,而 Lucene 却不行。

支持情况如何?
Solr 社区非常活跃,能够提供大量帮助信息。

Solr 的索引能被 Lucene 读取使用么?反过来可以么?
由于 Solr 底层使用的是 Lucene ,所以 Solr 索引和 Lucene 索引是相同的东西。
从技术上讲,其实不存在 Solr 索引这样一个东西,Solr 示例只会创建 Lucene 索引。

那么我应该在什么情况下使用 Lucene ?
例如,如果你需要嵌入搜索功能到桌面应用中,那么 Lucene 将是非常合适的选择。
在你需要针对底层 Lucene API 进行高度定制化控制,直接使用 Solr 会造成一些困扰,因为其已经在 Lucene 之上提供了额外的间接层。

参考:
  1. Hit-Highlighting in Full-Text Search
  2. 分面搜索
  3. 地理位置搜索

========

以下内容来自: 这里

      首先 Solr 是基于 Lucene 做的,Lucene 是一套信息检索工具包,但并不包含搜索引擎系统,它包含了索引结构、读写索引工具、相关性工具、排序等功能,因此在使用 Lucene 时你仍需要关注搜索引擎系统,例如数据获取、解析、分词等方面的东西。
      而 Solr 的目标是打造一款企业级的搜索引擎系统,因此它更接近于我们认识的搜索引擎系统,它是一个搜索引擎服务,通过各种 API 可以让你的应用使用搜索服务,而不需要将搜索逻辑耦合在应用中。而且 Solr 可以根据配置文件定义数据解析的方式,更像是一个搜索框架,它也支持主从、热换库等操作。还添加了飘红、facet 等搜索引擎常见功能的支持。
      因而,Lucene 在使用上更加灵活,但是你需要自己处理搜素引擎系统架构,以及其他附加功能的实现。而 Solr 帮你做了更多,但是属于一种高层的框架,Lucene 很多新特性不能及时向上透传,所以有时候可能发现需要一个功能,Lucene 是支持的,但是 Solr 上已经看不到相关接口。

      Lucene 更像是一个 SDK 。有完整的 API 族以及对应的实现。你可以利用这些在自己的应用里实现高级查询(基于倒排索引技术的),Lucene 对单机或者桌面应用很实用很方便。 但是 Lucene,需要开发者自己维护索引文件,在多机环境中备份同步索引文件很是麻烦。于是就有了 Solr 。 
      而 Solr 是一个有 HTTP 接口的基于 Lucene 的查询服务器,封装了很多 Lucene 细节,自己的应用可以直接利用诸如 .../solr?q=abc 这样的 HTTP GET/POST 请求去查询,维护修改索引。
      给个比方就是,Lucene 是给你一堆包,让你自己从底层构建一个数据库。而 Solr 是一个实现好的数据库程序,安装后就可以直接用了。


附赠:Apache Solr vs Elasticsearch



© 著作权归作者所有

共有 人打赏支持
摩云飞
粉丝 368
博文 534
码字总数 952694
作品 0
徐汇
程序员
Solr简单介绍

简介 Solr是一个高性能,采用Java5开发,Solr基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提...

邵鸿鑫
2016/06/29
0
0
Solr Apache Solr 初级教程(介绍、安装部署、Java接口、中文分词)

Apache Solr 介绍 Solr 是什么? Solr 是一个开源的企业级搜索服务器,底层使用易于扩展和修改的Java 来实现。服务器通信使用标准的HTTP 和XML,所以如果使用Solr 了解Java 技术会有用却不是...

David_Tio
2013/12/05
0
0
Solr使用入门指南

由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索。...

帅的不像男的
2016/05/24
26
0
solr原理详解

Solr对外提供标准的http接口来实现对数据的索引的增加、删除、修改、查询。在 Solr 中,用户通过向部署在servlet 容器中的 Solr Web 应用程序发送 HTTP 请求来启动索引和搜索。Solr 接受请求...

超人学院
2016/07/07
81
0
在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4

这个简短的教程描述了如何在 Ubuntu Server 上安装 Solr 4,我使用的版本是:Ubuntu Server 12.04 和 Apache Solr 4.0-BETA. 我同时将展示如何测试安装以及执行一个简单的索引和查询任务。 ...

红薯
2012/09/24
6.6K
11

没有更多内容

加载失败,请刷新页面

加载更多

下一页

centos7安装redis及开机启动

配置编译环境: sudo yum install gcc-c++ 下载源码: wget http://download.redis.io/releases/redis-3.2.8.tar.gz 解压源码: tar -zxvf redis-3.2.8.tar.gz 进入到解压目录: cd redis-3......

hotsmile
41分钟前
0
0
Confluence 6 数据库和临时目录

数据库 所有的其他数据库,包括有页面,内容都存储在数据库中。如果你安装的 Confluence 是用于评估或者你选择使用的是 Embedded H2 Database 数据库。数据库有关的文件将会存储在 database...

honeymose
55分钟前
1
0
day62-20180820-流利阅读笔记

1.今日导读 2.带着问题听讲解 3.新闻正文(中英文对照) 4.重点词汇 5.拓展内容

aibinxiao
今天
0
0
分布式锁实现及对比

一、问题介绍 日常工作中很多场景下需要用到分布式锁,例如:任务运行(多个节点同一时刻同一个任务只能在一个节点上运行(分片任务除外)),交易接受(前端交易请求发送时,可能由于两次提...

yangjianzhou
今天
7
0
【AI实战】快速掌握TensorFlow(二):计算图、会话

在前面的文章中,我们已经完成了AI基础环境的搭建(见文章:Ubuntu + Anaconda + TensorFlow + GPU + PyCharm搭建AI基础环境),以及初步了解了TensorFlow的特点和基本操作(见文章:快速掌握...

雪饼
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部