文档章节

企业级搜索应用服务器solr介绍

_夏天的风_
 _夏天的风_
发布于 2014/09/03 16:09
字数 1808
阅读 207
收藏 14

简介

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果;

特点

    Solr是一个独立的企业搜索服务器REST-like API。 你把文件(称为“索引”) 通过XML、JSON、CSV通过HTTP或二进制。 你查询它通过HTTP GET和接收XML、JSON、CSV或二进制的结果。

    • 高级全文搜索功能

    • 优化了高容量的网络流量

    • 基于标准的开放接口——XML、JSON和HTTP

    • 综合HTML管理接口

    • 服务器统计数据暴露在JMX监控

    • 线性可伸缩、自动索引复制,自动故障转移和恢复

    • 接近实时索引

    • 灵活和适应性强的XML配置

    • 可扩展的插件体系结构

Solr使用Lucene TM 搜索库和扩展了它!

    • 真正的数据模式,数值类型、动态字段,独特的钥匙

    • 强大的扩展Lucene查询语言

    • 面向方面的搜索和过滤

    • 地理空间搜索支持多个分文档和geo多边形

    • 先进、可配置的文本分析

    • 高度可配置和用户可扩展的缓存

    • 性能优化

    • 外部配置通过XML

    • 一个基于AJAX的管理界面

    • 可监控日志

    • 快接近实时增量索引和索引复制

    • 高度可伸缩的分布式搜索分散指数跨多个主机

    • JSON、XML、CSV / delimited-text和二进制格式更新

    • 简单的方法将数据从数据库和XML文件从本地磁盘和HTTP消息

    • 丰富的文档解析和索引(PDF、Word、HTML等)使用Apache Tika

    • Apache UIMA集成配置元数据提取

    • 多个搜索指数

详细的功能

模式

    • 定义文档的字段类型和字段

    • 可以更智能的处理

    • 声明式Lucene分析仪规范

    • 动态字段支持动态添加新字段

    • CopyField功能允许索引一个领域的多个方面,或将多个字段组合成一个可搜索的字段

    • 显式类型不需要猜测类型的字段

    • 外部文件的配置stopword列表、同义词列表和受保护的单词列表

    • 许多额外的文本分析组件,包括分词、正则表达式和近似读音过滤器

    • 可插入的每个领域相似模型

查询

    • HTTP接口具有可配置响应格式(XML / XSLT、JSON、Python、Ruby PHP,速度、CSV、二进制)

    • 通过任意数量的字段进行排序,并通过复杂的数值字段功能

    • 高级DisMax查询解析器高相关性用户输入的查询的结果

    • 强调上下文片段

    • 分面搜索基于独特的字段值,显式查询,日期范围,数值范围或枢轴

    • 同时选中分类通过标记和选择性地排除过滤器

    • 拼写建议用户查询

    • 更像这个建议给定文档

    • 函数查询——影响的分数通过用户指定复杂的功能 数值字段或查询相关性分数。

    • 范围过滤函数查询结果

    • 日期数学——相对于“现在”指定日期的查询和更新

    • 使用Carrot2动态搜索结果聚类

    • 数值字段统计如最小,最大,平均值,标准偏差

    • 结合查询源自不同的语法

    • 完成用户查询之功能

    • 允许配置的结果为一个查询,覆盖正常的得分和排序

    • 简单的两个文档类型之间的连接能力

    • 性能优化

核心

    • 没有重新启动动态创建和删除文档集合

    • 可插拔的查询处理程序和可扩展的XML数据格式

    • 可插拔的用户查询的功能函数

    • 可定制的基于组件的请求处理程序与分布式搜索的支持

    • 文档独特性执行基于独特的关键字段

    • 文档复制检测,包括模糊附近重复

    • 自定义索引处理链,使索引之前文档操作

    • 用户可配置的命令触发指数变化

    • 与排序字段丢失控制文档的能力将被放置

    • “路加福音”语料库信息请求处理程序

缓存

    • 可配置查询结果、过滤和文档缓存实例

    • 可插拔的缓存实现,包括锁自由、高并发性实现

    • 缓存变暖背景

    • 当一个新搜索器打开,可配置搜索与运行 避免为了温暖起来 缓慢的第一个打击。 在变暖,当前搜索器处理请求。

    • Autowarming背景

    • 最近访问的缓存条目 新搜索器搜索器,使高缓存命中 利率在索引/搜索者的变化。

    • 快速/小过滤器实现

    • 用户级缓存autowarming支持

SolrCloud

    • 集中基于Apache动物园管理员配置

    • 自动化的分布式索引/分片-文档发送到任何节点,它将转发到正确的切分

    • 接近实时索引与直接基于推的复制(也支持基于复制慢)

    • 事务日志可以确保不丢失更新即使还没有索引的文档到磁盘

    • 自动查询故障转移,指数领袖选举和恢复失败的情况下

    • 没有单点故障

管理界面

    • 综合统计数据缓存利用率、更新和查询

    • 互动模式浏览器,包括索引统计信息

    • 复制监控

    • SolrCloud仪表盘图形集群节点状态

    • 完整的日志记录控制

    • 文本分析调试器,显示每个阶段在一个分析器的结果

    • 网页查询接口w /调试输出

    • 解析查询输出

    • Lucene文档得分详细解释()

    • 解释分数以外的文件请求的范围来调试为什么给定文档没有排名更高。


总结

    Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。文档通过Http利用XML 加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

© 著作权归作者所有

_夏天的风_
粉丝 8
博文 31
码字总数 55375
作品 0
海淀
其他
私信 提问
Solr简单介绍

简介 Solr是一个高性能,采用Java5开发,Solr基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提...

邵鸿鑫
2016/06/29
0
0
【solr】solr介绍及安装

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/j15533415886/article/details/88735292 一、Solr介绍 1.solr是什么? Solr是一种开放源码的、基于Lucene Ja...

Live a happy life
03/22
0
0
Apache Solr介绍及安装

Solr是什么 Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API,高亮查询结果,缓存,复制,还有一个WEB管理界面。Solr运行在Servlet容器中,其架构如下: 主要功能包...

丢失的羊羔
2015/12/25
57
0
关于solr如何加入到自己的应用

大家好,之前我也只是使用lucene了做了个系统中搜索模块。 现在学习solr,主要是想通过它来实现分布式索引搜索,搭建企业级搜索应用。 我按照资料在本地搭建了服务器,能够搜索,能够自己手动...

昵称不见了
2012/01/12
604
0
服务器(3)--搭建单机版Solr服务器+配置中文分析器

背景:学习到Solr这部分内容,整理一下思路,这篇文章重点介绍了一下单机版的Solr服务器的搭建过程,还有中文分析器的配置,下一篇文章中重点介绍Solr集群的搭建步骤。 一、Solr Solr是一个独...

u013043341
2017/05/29
0
0

没有更多内容

加载失败,请刷新页面

加载更多

arduino项目-1. 模拟楼道灯

@toc 1.1 情景说明 说明 漆黑的夜晚,当有人非法进入一所房屋,房屋内的灯在恰当的时间亮起,也许会有效阻止非法活动的继续。 效果展示 1.2 实验器材 器材名称 数量 继电器 1 人体红外感应器...

acktomas
5分钟前
1
0
Nacos 常见问题及解决方法

Nacos 开源至今已有一年,在这一年里,得到了很多用户的支持和反馈。在与社区的交流中,我们发现有一些问题出现的频率比较高,为了能够让用户更快的解决问题,我们总结了这篇常见问题及解决方...

阿里云官方博客
11分钟前
2
0
pinyin4j 满足中文转拼音的需求

引入依赖 // https://mvnrepository.com/artifact/com.belerweb/pinyin4j //汉字转拼音compile group: 'com.belerweb', name: 'pinyin4j', version: '2.5.1' 写入中文转拼英的工具......

edison_kwok
16分钟前
2
0
IPSE接入Substrate/Polkadot插槽实现互操作性的运行原理

Substrate框架将区块链的众多功能都模块化,对于开发者来说,只是一个选择的问题,同时还保持了众多的可以定制的功能和模块,比如底层通信模块,比如账户体系,比如共识机制等都是可以自己定...

IPSE
22分钟前
74
0
linux配置安装phpMyAdmin的步骤记录

1、首先在phpMyAdmin官方网站 http://www.phpmyadmin.net/downloads下载源码包,或者通过脚本之家进行下载://www.jb51.net/codes/405261.html ,下载后上传到服务器解压即可,或者通过Linux...

蜗牛女孩
23分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部