文档章节

lucene开发必备工具luke介绍

曾杰
 曾杰
发布于 2012/04/30 18:47
字数 1073
阅读 4437
收藏 27
点赞 1
评论 1

本文已经迁移到搞搜索

做lucene开发的,免不了要和索引文件打交道,但是一些二进制的文件我们怎么去看,下面就要隆重的有请luke了

根据百度百科的说法:Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改。

我们可以通过luke来进行一般的索引查看和修改操作。

就打个比方,lucene的索引文件就好像是数据库存储的数据文件,luke就是一个DBMS系统,相信都懂的^_^

首先jdk是必须地,然后直接到googlecode上把最新的luke下下来,我现在用的是3.5版本,下下来就是一个jar包,可以直接双击打开,或者到命令行:java -jar /lukeall-3.5.0.jar,界面还是不错的哈,然后上方的菜单栏上的file按钮就可以打开索引目录了,如果当前索引已经被打开了(里面有write.lock文件了),我们就可以使用强制解锁的方法来打开目录,或者是使用readonly的方法来打开索引目录,打开后就可以像DBMS一看的查看索引里面保存的数据了,如果索引改变了,可以点击overview界面上的re-open按钮重新打开。

共有5个界面:

overview是用来进行索引的一般性查看和操作的,比如索引目录民,索引文件版本。。。等等概要信息,右上角三个按钮分别可以重新打开索引,提交索引更改和关闭当前打开的索引,下面两个list就是显示词和字段的相关信息了。

documents界面是用来进行文档的操作和查看的,比如文件的删除、添加。下面一个大listview就可以用来查看文档的详细信息了,是不是和DBMS的查看表数据非常的像呢?上面有两个查找文档的方法,根据文档编号来查找和根据词来查找了,其实这个就是搜索了

search界面是我认为最有用的一个界面了,其中我们可以在这里进行索引的搜索测试,可以编写最的lucene搜索语句,然后可以看到语句解析后的query树,这样就可以知道为什么我们有些查询会查询不到我们想要的信息了,然后还可以选择进行搜索的分词器、默认字段和重复搜索次数的(可以通过多次搜索来获取平均一个搜索过程的耗时长短,这个对查询的性能测试时非常有用的),然后下面的listview中就会列出一个搜索的的文档的所有保存的(store)字段的值,下面可以看到查询花费的时间

file界面,故名思义,这个就是用来查看每个索引相关文件的一些属性的界面,具体的话,可以通过这个界面分析下索引文件的多少,是否需要优化或者合并等等。。。。

最后一个plugins界面,就是可以看到luke提供的各种插件,我认为比较有用的还是那个分词工具,提供一个分词的类,然后下面文本框输入一段文本,然后就可以让这个工具帮你分词,你可以看到详细的分词信息,相信这个对自定义分词器的调试或者测试还是很有用的。然后还有一个hadoop插件,支持从hadoop节点中获取节点中文件的相关信息,这个应该对分布式搜索引擎搭建还是有那么点用吧。。。。不过我认为如果用hadoop的话,一定会用更强大的插件的。。。这个是不是有点多余了,哈哈

 附上下载地址:http://code.google.com/p/luke/downloads/list

文笔不好,而且没有配上图片(不知道怎么上传图片 = =)希望大家多多批评指教哈,另外五一快乐!!!!IT民工们!!

© 著作权归作者所有

共有 人打赏支持
曾杰
粉丝 63
博文 29
码字总数 33133
作品 0
广州
高级程序员
加载中

评论(1)

活的自由
活的自由
这个工具不错,谢谢分享。
lucene开发序幕曲之luke神器

Lucene是一款很优秀的全文检索的开源库,目前最新的版本是Lucene4.4。 很多人知道lucene或者solr,但是却很少人知道luke,在这里笔者就对luke做一个简单的介绍,Luke是一个用于Lucene搜索引擎...

heroShane
2014/02/20
0
0
lucene开发序幕曲之luke神器

有很多人知道lucene或者solr,但是却有很少人知道luke,在这里笔者就对luke做一个简单的介绍,Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并...

一枚Sir
2014/04/10
0
0
开源中国10-4期软件推荐 Lucene索引查看工具Luke

开源中国社区10-4期(10月份第4周)推荐的开源软件是Luke,Luke是一款Lucene索引查看工具。 Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允...

老枪
2010/10/25
2.3K
1
Confluence 6 查看索引和提示

查看索引 Confluence 使用被称为 Lucene 的搜索引擎。如果你希望在你的 Confluence站点中查看更多有关索引的细节,你可以下载并且运行 Luke。Luke 是一个开发和诊断工具,这个工具针对已经存...

honeymose
07/10
0
0
Luke 5 发布,可视化 Lucene 索引查看工具

这是一个主要版本,该版本支持 Lucene 5.2.0。 它支持 elasticsearch 1.6.0(Lucene的4.10.4) 已解决的问题: #20增加支持重建索引并不会存储领域,不暴露位置的字段值。 Pull Requests: ...

oschina
2015/08/31
6.2K
7
Luke 6.0.0 发布,可视化 Lucene 索引查看工具

Luke 6.0.0 发布。 更新内容: 主要升级到新的Lucene6.0.0 API #55 下载地址: luke-6.0.0-luke-release.zip Source code (zip) Source code (tar.gz) Luke 是查询LUCENE索引文件的工具, 而...

淡漠悠然
2016/04/18
6.6K
10
Luke 5.5.0 发布,LUCENE索引文件工具

Luke 5.5.0 发布了。Luke 是查询LUCENE索引文件的工具, 而且用 Luke 的Search可以做查询。 功能: Viewing your documents and analyzing their field contents (for stored fields) Search......

淡漠悠然
2016/03/18
3K
2
Luke 7.4.0 发布,可视化 Lucene 索引查看工具

Luke 7.4.0 已发布,此前我们曾报道过,从 7.3.1 开始,新版本使用的 UI 框架已换成 JavaFX 。 本次更新内容主要是升级到 Lucene 7.4.0,详情请查看更新日志。 Luke 是用于查询 Lucene / Sol...

淡漠悠然
07/02
0
0
Luke 7.3.1 发布,UI 框架已转为使用 JavaFX

Luke 7.3.1 已发布,新版本使用的 UI 框架已换成 JavaFX 。具体更新内容如下: #97: Luke atop JavaFX (the branch is now master) #104: Fixed 'user id is too big' error when packaging......

淡漠悠然
05/16
0
0
Luke 6.6.0 发布,可视化 Lucene 索引查看工具

Luke 6.6.0 已发布,Luke 是用于查询 Lucene / Solr / Elasticsearch 索引的可视化工具。 它允许: 查看文档并分析其内容(用于存储字段) 在索引中搜索 执行索引维护:索引运行状况检查,索...

淡漠悠然
2017/07/17
1K
3

没有更多内容

加载失败,请刷新页面

加载更多

下一页

CoreText进阶(七)-添加自定义View和对其

CoreText进阶(七)-添加自定义View和对其 其它文章: CoreText 入门(一)-文本绘制 CoreText入门(二)-绘制图片 CoreText进阶(三)-事件处理 CoreText进阶(四)-文字行数限制和显示更多...

aron1992
9分钟前
0
0
Python爬虫 爬取百合网的女人们和男人们

学Python也有段时间了,目前学到了Python的类。个人感觉Python的类不应称之为类,而应称之为数据类型,只是数据类型而已!只是数据类型而已!只是数据类型而已!重要的事情说三篇。 据书上说...

p柯西
21分钟前
0
0
在Java中,你真的会日期转换吗

1.什么是SimpleDateFormat 在java doc对SimpleDateFormat的解释如下: SimpleDateFormatis a concrete class for formatting and parsing dates in a locale-sensitive manner. It allows fo......

Java小铺
29分钟前
0
0
Linux系统梳理---系统搭建(二):tomcat的安装和使用

上一章讲到JDK的安装使用,这一章主要记录下服务器tomcat的安装以及部署一个项目. 1.下载tomcat,这里下载的是apache-tomcat-8.5.32.tar.gz 2.创建文件夹,便于管理,和JDK一样,在usr目录下创建t...

勤奋的蚂蚁
40分钟前
0
0
ES15-聚合

1.Terms Aggregation 分组聚合 2.Filter Aggregation 过滤聚合

贾峰uk
41分钟前
0
0
【2018.07.19学习笔记】【linux高级知识 20.27-20.30】

20.27 分发系统介绍 20.28 expect脚本远程登录 20.29 expect脚本远程执行命令 20.30 expect脚本传递参数

lgsxp
44分钟前
0
0
10.32/10.33 rsync通过服务同步~10.35 screen工具

通过服务的方式同步要编辑配置文件:[root@linux-xl ~]# vim /etc/rsyncd.confport=873log file=/var/log/rsync.logpid file=/var/run/rsyncd.pidaddress=192.168.43.21[tes...

洗香香
47分钟前
0
0
与女儿谈商业模式 (3):沃尔玛的成功模式

分类:与女儿谈商业模式 | 标签: 经济学 沃尔玛 陈志武 2007-05-10 09:09阅读(11279)评论(30) 与女儿谈商业模式 (3):沃尔玛的成功模式 陈志武 /文 沃尔玛(Wal-Mart)是另一个有意思的财...

祖冲之
53分钟前
0
0
网页加载速度优化方法总结

1、减少请求 最大的性能漏洞就是一个页面需要发起几十个网络请求来获取诸如样式表、脚本或者图片这样的资源,这个在相对低带宽和高延迟的移动设备连接上来说影响更严重。 2、整合资源 对开发...

Jack088
59分钟前
0
0
dubbo学习

https://blog.csdn.net/houshaolin/article/details/76408399

喵五郎
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部