文档章节

lucene开发必备工具luke介绍

曾杰
 曾杰
发布于 2012/04/30 18:47
字数 1073
阅读 4532
收藏 27

本文已经迁移到搞搜索

做lucene开发的,免不了要和索引文件打交道,但是一些二进制的文件我们怎么去看,下面就要隆重的有请luke了

根据百度百科的说法:Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改。

我们可以通过luke来进行一般的索引查看和修改操作。

就打个比方,lucene的索引文件就好像是数据库存储的数据文件,luke就是一个DBMS系统,相信都懂的^_^

首先jdk是必须地,然后直接到googlecode上把最新的luke下下来,我现在用的是3.5版本,下下来就是一个jar包,可以直接双击打开,或者到命令行:java -jar /lukeall-3.5.0.jar,界面还是不错的哈,然后上方的菜单栏上的file按钮就可以打开索引目录了,如果当前索引已经被打开了(里面有write.lock文件了),我们就可以使用强制解锁的方法来打开目录,或者是使用readonly的方法来打开索引目录,打开后就可以像DBMS一看的查看索引里面保存的数据了,如果索引改变了,可以点击overview界面上的re-open按钮重新打开。

共有5个界面:

overview是用来进行索引的一般性查看和操作的,比如索引目录民,索引文件版本。。。等等概要信息,右上角三个按钮分别可以重新打开索引,提交索引更改和关闭当前打开的索引,下面两个list就是显示词和字段的相关信息了。

documents界面是用来进行文档的操作和查看的,比如文件的删除、添加。下面一个大listview就可以用来查看文档的详细信息了,是不是和DBMS的查看表数据非常的像呢?上面有两个查找文档的方法,根据文档编号来查找和根据词来查找了,其实这个就是搜索了

search界面是我认为最有用的一个界面了,其中我们可以在这里进行索引的搜索测试,可以编写最的lucene搜索语句,然后可以看到语句解析后的query树,这样就可以知道为什么我们有些查询会查询不到我们想要的信息了,然后还可以选择进行搜索的分词器、默认字段和重复搜索次数的(可以通过多次搜索来获取平均一个搜索过程的耗时长短,这个对查询的性能测试时非常有用的),然后下面的listview中就会列出一个搜索的的文档的所有保存的(store)字段的值,下面可以看到查询花费的时间

file界面,故名思义,这个就是用来查看每个索引相关文件的一些属性的界面,具体的话,可以通过这个界面分析下索引文件的多少,是否需要优化或者合并等等。。。。

最后一个plugins界面,就是可以看到luke提供的各种插件,我认为比较有用的还是那个分词工具,提供一个分词的类,然后下面文本框输入一段文本,然后就可以让这个工具帮你分词,你可以看到详细的分词信息,相信这个对自定义分词器的调试或者测试还是很有用的。然后还有一个hadoop插件,支持从hadoop节点中获取节点中文件的相关信息,这个应该对分布式搜索引擎搭建还是有那么点用吧。。。。不过我认为如果用hadoop的话,一定会用更强大的插件的。。。这个是不是有点多余了,哈哈

 附上下载地址:http://code.google.com/p/luke/downloads/list

文笔不好,而且没有配上图片(不知道怎么上传图片 = =)希望大家多多批评指教哈,另外五一快乐!!!!IT民工们!!

© 著作权归作者所有

曾杰
粉丝 63
博文 29
码字总数 33133
作品 0
广州
高级程序员
私信 提问
加载中

评论(1)

活的自由
活的自由
这个工具不错,谢谢分享。
lucene开发序幕曲之luke神器

Lucene是一款很优秀的全文检索的开源库,目前最新的版本是Lucene4.4。 很多人知道lucene或者solr,但是却很少人知道luke,在这里笔者就对luke做一个简单的介绍,Luke是一个用于Lucene搜索引擎...

heroShane
2014/02/20
947
0
lucene开发序幕曲之luke神器

有很多人知道lucene或者solr,但是却有很少人知道luke,在这里笔者就对luke做一个简单的介绍,Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并...

一枚Sir
2014/04/10
327
0
Confluence 6 查看索引和提示

查看索引 Confluence 使用被称为 Lucene 的搜索引擎。如果你希望在你的 Confluence站点中查看更多有关索引的细节,你可以下载并且运行 Luke。Luke 是一个开发和诊断工具,这个工具针对已经存...

honeymose
2018/07/10
11
0
使用Luke Lucene进行索引

目录 luke 简介 luke下载及安装 luke 使用 打开luke Overview选项卡 Documents选项卡 search选项卡 Commits选项卡 Plugins选项卡 导出索引为XML 检查索引正确性 总结 1. luke 简介 luke### ...

㭍葉
2017/06/07
0
0
Luke 5.5.0 发布,LUCENE索引文件工具

Luke 5.5.0 发布了。Luke 是查询LUCENE索引文件的工具, 而且用 Luke 的Search可以做查询。 功能: Viewing your documents and analyzing their field contents (for stored fields) Search......

淡漠悠然
2016/03/18
3.6K
3

没有更多内容

加载失败,请刷新页面

加载更多

Git

指令 git init :创建版本库,生成.git文件夹 git add XX:上传代码到暂存区 git state:查看目前本地工作起、暂存区、分支,三者之间的文件状态 git diff demo.html:查看工作区和暂存区的代码...

Hui先生
38分钟前
6
0
绘制流程图用什么软件好?分享绘制流程图的简单方法

绘制流程图一般有两种方法,一种是手绘,另一种是利用画图工具进行绘制,更多的人们选择使用第二种方法进行绘制,方便简单。那绘制流程图用什么软件好?若是使用电脑进行绘制,可以选择迅捷画...

百因必有果
40分钟前
8
0
PHP制作的掷色子点数抽奖游戏实例

PHP制作的掷色子点数抽奖游戏实例,通过掷色子点数来达到抽奖的效果,为抽奖活动增添一些趣味性。 我们将在html页面中写下如下的html结构代码,.wrap用来放置色子和提示信息,#prize则是用来...

ymkjs1990
53分钟前
5
0
宝塔免费版部署

宝塔免费版部署 NiuSHOP安装环境及宝塔一键部署免费版 1、Niushop安装环境 操作系统:支持Windows和linux 服务器:支持Apache/Nginx/IIS服务器 PHP5.6版本及以上,最高支持PHP7.2,MySQL版本...

Geek-Chic
今天
5
0
MySQL查询优化临时表

【理论分析】 MySQL在执行SQL查询时可能会用到临时表,一般情况下,用到临时表就意味着性能较低。 临时表存储 MySQL临时表分为“内存临时表”和“磁盘临时表”,其中内存临时表使用MySQL的M...

1只特立独行的猪
今天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部