文档章节

初学Lucene

C
 Canaan_
发布于 2015/12/26 10:20
字数 449
阅读 69
收藏 1

1. lucene 简介

  Apache Lucene 是一个全文检索引擎,它不是一个完整的应用程序,但它提交的API可以很容易的搭建一个具有检索能力的应用。DownLoad:  http://www.apache.org/dyn/closer.lua/lucene/java/5.4.0

2.使用

    如上面所说,lucene不是一个应用程序,所以我们没有什么可安装设置的(当然这是基于jvm的,所以java运行环境还是要的),下载并解压lucene_5.4.0 下面有几个文件夹我们来看下(红色表示关键要用的):

core: Lucene 核心代码包
analyzers-common: 提供不同语种的分词解析
analyzers-icu: Analysis integration with ICU (International Components for Unicode).
analyzers-kuromoji: Japanese Morphological Analyzer
analyzers-morfologik: Analyzer for dictionary stemming, built-in Polish dictionary
analyzers-phonetic: Analyzer for indexing phonetic signatures (for sounds-alike search)
analyzers-smartcn: 简体中文的分词解析
analyzers-stempel: Analyzer for indexing Polish
analyzers-uima: Analysis integration with Apache UIMA
backward-codecs: Codecs for older versions of Lucene.
benchmark: System for benchmarking Lucene
classification: Classification module for Lucene
codecs: Lucene codecs and postings formats.
demo: 示例代码
expressions: Dynamically computed values to sort/facet/search on based on a pluggable grammar.
facet: 提供分面索引和查询能力
grouping: 得到分组查询结果集必要组件.
highlighter:  在查询结果中高亮显示关键字
join: Index-time and Query-time joins for normalized content
memory: Single-document in-memory index implementation
misc: Index tools and other miscellaneous code
queries: 查询和过滤器,搜索指定单词或词组
queryparser: 可以使用它将用户输入的查询表达式解析为 Lucene 查询对象
replicator: Files replication utility
sandbox: Various third party contributions and new ideas
spatial: Geospatial search
spatial3d: 3D spatial planar geometry APIs
suggest: Auto-suggest and Spellchecking support
test-framework: Framework for testing Lucene-based applications

在上面文件夹中找到下面jar包加入到你的项目中,你的应用就具备了luncene开发的能力了


  1. lucene-core-5.4.0.jar
  2. lucene-analyzers-smartcn-5.4.0.jar
  3. lucene-queryparser-5.4.0.jar
  4. lucene-queries-5.4.0.jar
  5. lucene-facet-5.4.0.jar
  6. lucene-highlighter-5.4.0.jar
  7. lucene-grouping-5.4.0.jar


© 著作权归作者所有

共有 人打赏支持
C
粉丝 17
博文 296
码字总数 128442
作品 0
福州
Lucene建立索引数据量大

使用Lucene建立索引的数据量大概在十万条左右的数据,用户建立索引等待时间过长问题怎么解决?怎么优化,初学Lucene

BabyMason
2014/11/10
533
2
关于Lucene的一些问题

初学Lucene,有一些疑问,希望有经验的同志们给予一些指导。 之前看了oschina公开的一些关于Lucene的代码,对俺这个初学者来说有点难了, 通过那段代码只看出来索引的更新频率及手段,但是看...

jing31
2010/11/11
596
15
lucene 增量索引问题请教

@红薯 你好,想跟你请教个问题:看了您的 OSChina 的全文搜索设计说明 —— 索引过程 这篇文章,我初学java 用lucene建增量索引的功能,每次有新的文章发表,我就触发增量索引逻辑,为避免锁...

csyangshungang
2013/03/21
432
1
Lucene内存索引与本地索引结合

初学Lucene,最近在做一个索引的web项目,要有三个地方用到三个不同的索引库,看到说用内存索引效率会提高?但是我不太会如何让本地索引与内存索引相结合 从本地索引创建内存索引我是会的 我...

水之笔记
2017/03/14
159
0
Lucene 5.1.0 发布,Java 搜索引擎

Lucene 5.1.0 发布,此版本现已提供在:http://www.apache.org/dyn/closer.cgi/lucene/java/5.1.0。 更新内容如下: 新特性 (9) LUCENE-6066: Added DiversifiedTopDocsCollector to misc f......

chaun
2015/06/03
2.9K
12

没有更多内容

加载失败,请刷新页面

加载更多

原型模式

1、原型模式-定义 用原型实例指定创建对象的种类,并且通过拷贝这些原型创建新的对象 克隆(浅度克隆->拷贝值类型或者引用,深度克隆->创建新的对象,开辟新的内存) 例如客户端知道抽象Pro...

阿元
今天
10
0
awk命令扩展使用操作

awk 中使用外部shell变量 示例1 [root@centos01 t1022]# A=888[root@centos01 t1022]# echo "" | awk -v GET_A=$A '{print GET_A}'888[root@centos01 t1022]# echo "aaaaaaaaaaaaa" | aw......

野雪球
今天
15
0
深入解析MySQL视图VIEW

Q:什么是视图?视图是干什么用的? A:视图(view)是一种虚拟存在的表,是一个逻辑表,本身并不包含数据。作为一个select语句保存在数据字典中的。   通过视图,可以展现基表的部分数据;...

IT--小哥
今天
20
0
虚拟机学习之二:垃圾收集器和内存分配策略

1.对象是否可回收 1.1引用计数算法 引用计数算法:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时候计数器值为0的对象就是不可能...

贾峰uk
今天
13
0
smart-doc功能使用介绍

smart-doc从8月份底开始开源发布到目前为止已经迭代了几个版本。在这里非常感谢那些敢于用smart-doc去做尝试并积极提出建议的社区用户。因此决定在本博客中重要说明下smart-doc的功能,包括使...

上官胡闹
昨天
24
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部