文档章节

初学Lucene

C
 Canaan_
发布于 2015/12/26 10:20
字数 449
阅读 72
收藏 1

1. lucene 简介

  Apache Lucene 是一个全文检索引擎,它不是一个完整的应用程序,但它提交的API可以很容易的搭建一个具有检索能力的应用。DownLoad:  http://www.apache.org/dyn/closer.lua/lucene/java/5.4.0

2.使用

    如上面所说,lucene不是一个应用程序,所以我们没有什么可安装设置的(当然这是基于jvm的,所以java运行环境还是要的),下载并解压lucene_5.4.0 下面有几个文件夹我们来看下(红色表示关键要用的):

core: Lucene 核心代码包
analyzers-common: 提供不同语种的分词解析
analyzers-icu: Analysis integration with ICU (International Components for Unicode).
analyzers-kuromoji: Japanese Morphological Analyzer
analyzers-morfologik: Analyzer for dictionary stemming, built-in Polish dictionary
analyzers-phonetic: Analyzer for indexing phonetic signatures (for sounds-alike search)
analyzers-smartcn: 简体中文的分词解析
analyzers-stempel: Analyzer for indexing Polish
analyzers-uima: Analysis integration with Apache UIMA
backward-codecs: Codecs for older versions of Lucene.
benchmark: System for benchmarking Lucene
classification: Classification module for Lucene
codecs: Lucene codecs and postings formats.
demo: 示例代码
expressions: Dynamically computed values to sort/facet/search on based on a pluggable grammar.
facet: 提供分面索引和查询能力
grouping: 得到分组查询结果集必要组件.
highlighter:  在查询结果中高亮显示关键字
join: Index-time and Query-time joins for normalized content
memory: Single-document in-memory index implementation
misc: Index tools and other miscellaneous code
queries: 查询和过滤器,搜索指定单词或词组
queryparser: 可以使用它将用户输入的查询表达式解析为 Lucene 查询对象
replicator: Files replication utility
sandbox: Various third party contributions and new ideas
spatial: Geospatial search
spatial3d: 3D spatial planar geometry APIs
suggest: Auto-suggest and Spellchecking support
test-framework: Framework for testing Lucene-based applications

在上面文件夹中找到下面jar包加入到你的项目中,你的应用就具备了luncene开发的能力了


  1. lucene-core-5.4.0.jar
  2. lucene-analyzers-smartcn-5.4.0.jar
  3. lucene-queryparser-5.4.0.jar
  4. lucene-queries-5.4.0.jar
  5. lucene-facet-5.4.0.jar
  6. lucene-highlighter-5.4.0.jar
  7. lucene-grouping-5.4.0.jar


© 著作权归作者所有

共有 人打赏支持
上一篇: Hello Lucene
C
粉丝 17
博文 305
码字总数 132149
作品 0
福州
私信 提问
Lucene建立索引数据量大

使用Lucene建立索引的数据量大概在十万条左右的数据,用户建立索引等待时间过长问题怎么解决?怎么优化,初学Lucene

BabyMason
2014/11/10
547
2
关于Lucene的一些问题

初学Lucene,有一些疑问,希望有经验的同志们给予一些指导。 之前看了oschina公开的一些关于Lucene的代码,对俺这个初学者来说有点难了, 通过那段代码只看出来索引的更新频率及手段,但是看...

jing31
2010/11/11
676
15
Lucene内存索引与本地索引结合

初学Lucene,最近在做一个索引的web项目,要有三个地方用到三个不同的索引库,看到说用内存索引效率会提高?但是我不太会如何让本地索引与内存索引相结合 从本地索引创建内存索引我是会的 我...

水之笔记
2017/03/14
192
0
lucene 增量索引问题请教

@红薯 你好,想跟你请教个问题:看了您的 OSChina 的全文搜索设计说明 —— 索引过程 这篇文章,我初学java 用lucene建增量索引的功能,每次有新的文章发表,我就触发增量索引逻辑,为避免锁...

csyangshungang
2013/03/21
452
1
Lucene 5.1.0 发布,Java 搜索引擎

Lucene 5.1.0 发布,此版本现已提供在:http://www.apache.org/dyn/closer.cgi/lucene/java/5.1.0。 更新内容如下: 新特性 (9) LUCENE-6066: Added DiversifiedTopDocsCollector to misc f......

chaun
2015/06/03
3K
12

没有更多内容

加载失败,请刷新页面

加载更多

iOS 官方文档

https://developer.apple.com/library/prerelease/content/navigation/#section=Platforms&topic=iOS...

walking_yxf
10分钟前
1
0
使用Mycat实现MySQL数据库的读写分离

前提准备 1.一台CentOS机器 2.Mycat安装包 (http://www.mycat.io/) 安装使用 1.解压Mycat的安装包到/user/local/下 2.设置mycat的环境变量 vi /etc/profile 3.使配置文件立即生效 source /...

吴伟祥
10分钟前
1
0
Aries数据库事务Recovery算法

背景知识 本文是一篇关于(分布式)数据库的文章,在开始阐述Aries是什么之前,需要先交代几个常识性的概念,这些概念对后文引出Aries显得尤为重要。 数据库体系结构 图1大致描述了一个(分布...

黑客画家
14分钟前
1
0
Rxjava Backpressure 32

原文:https://github.com/Froussios/Intro-To-RxJava/blob/master/Part 4 - Concurrency/4. Backpressure.md Rx将事件从管道的一端引导到另一端,在每一端发生的行动可能非常不同。当生产者...

woshixin
14分钟前
1
0
IDEA-Create Git Repository

1、概述 idea 开发完毕的项目没有及时的关联gitlab,如果整体项目关联gitlab。 2、干 2.1 gitlab 创建项目 2.2 idea 1、IDEA 点击 -> VCS -> import into version control -> create git re......

来来来来来
17分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部