文档章节

初学Lucene

C
 Canaan_
发布于 2015/12/26 10:20
字数 449
阅读 69
收藏 1

1. lucene 简介

  Apache Lucene 是一个全文检索引擎,它不是一个完整的应用程序,但它提交的API可以很容易的搭建一个具有检索能力的应用。DownLoad:  http://www.apache.org/dyn/closer.lua/lucene/java/5.4.0

2.使用

    如上面所说,lucene不是一个应用程序,所以我们没有什么可安装设置的(当然这是基于jvm的,所以java运行环境还是要的),下载并解压lucene_5.4.0 下面有几个文件夹我们来看下(红色表示关键要用的):

core: Lucene 核心代码包
analyzers-common: 提供不同语种的分词解析
analyzers-icu: Analysis integration with ICU (International Components for Unicode).
analyzers-kuromoji: Japanese Morphological Analyzer
analyzers-morfologik: Analyzer for dictionary stemming, built-in Polish dictionary
analyzers-phonetic: Analyzer for indexing phonetic signatures (for sounds-alike search)
analyzers-smartcn: 简体中文的分词解析
analyzers-stempel: Analyzer for indexing Polish
analyzers-uima: Analysis integration with Apache UIMA
backward-codecs: Codecs for older versions of Lucene.
benchmark: System for benchmarking Lucene
classification: Classification module for Lucene
codecs: Lucene codecs and postings formats.
demo: 示例代码
expressions: Dynamically computed values to sort/facet/search on based on a pluggable grammar.
facet: 提供分面索引和查询能力
grouping: 得到分组查询结果集必要组件.
highlighter:  在查询结果中高亮显示关键字
join: Index-time and Query-time joins for normalized content
memory: Single-document in-memory index implementation
misc: Index tools and other miscellaneous code
queries: 查询和过滤器,搜索指定单词或词组
queryparser: 可以使用它将用户输入的查询表达式解析为 Lucene 查询对象
replicator: Files replication utility
sandbox: Various third party contributions and new ideas
spatial: Geospatial search
spatial3d: 3D spatial planar geometry APIs
suggest: Auto-suggest and Spellchecking support
test-framework: Framework for testing Lucene-based applications

在上面文件夹中找到下面jar包加入到你的项目中,你的应用就具备了luncene开发的能力了


  1. lucene-core-5.4.0.jar
  2. lucene-analyzers-smartcn-5.4.0.jar
  3. lucene-queryparser-5.4.0.jar
  4. lucene-queries-5.4.0.jar
  5. lucene-facet-5.4.0.jar
  6. lucene-highlighter-5.4.0.jar
  7. lucene-grouping-5.4.0.jar


© 著作权归作者所有

共有 人打赏支持
C
粉丝 16
博文 265
码字总数 111702
作品 0
福州
Lucene建立索引数据量大

使用Lucene建立索引的数据量大概在十万条左右的数据,用户建立索引等待时间过长问题怎么解决?怎么优化,初学Lucene

BabyMason
2014/11/10
533
2
关于Lucene的一些问题

初学Lucene,有一些疑问,希望有经验的同志们给予一些指导。 之前看了oschina公开的一些关于Lucene的代码,对俺这个初学者来说有点难了, 通过那段代码只看出来索引的更新频率及手段,但是看...

jing31
2010/11/11
596
15
lucene 增量索引问题请教

@红薯 你好,想跟你请教个问题:看了您的 OSChina 的全文搜索设计说明 —— 索引过程 这篇文章,我初学java 用lucene建增量索引的功能,每次有新的文章发表,我就触发增量索引逻辑,为避免锁...

csyangshungang
2013/03/21
432
1
Lucene内存索引与本地索引结合

初学Lucene,最近在做一个索引的web项目,要有三个地方用到三个不同的索引库,看到说用内存索引效率会提高?但是我不太会如何让本地索引与内存索引相结合 从本地索引创建内存索引我是会的 我...

水之笔记
2017/03/14
159
0
Lucene 5.1.0 发布,Java 搜索引擎

Lucene 5.1.0 发布,此版本现已提供在:http://www.apache.org/dyn/closer.cgi/lucene/java/5.1.0。 更新内容如下: 新特性 (9) LUCENE-6066: Added DiversifiedTopDocsCollector to misc f......

chaun
2015/06/03
2.9K
12

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Spring Aop原理之切点表达式解析

在前面的文章(Spring AOP切点表达式详解)中,我们总结了Spring Aop切点表达式的用法,而在上文(Spring Aop原理之Advisor过滤)中我们讲到,切点表达式的解析主要是在PatternParser.parse...

爱宝贝丶
16分钟前
0
0
网络工程师真的也需要好好学习linux系统

作为一名刚工作半年的小网工,想总结一下工作半年来的一些感悟。由于本人是网络工程专业,毕业前找工作的目标也是网络工程师,在经过几次面试后如愿以偿的找到了网络工程师的工作。由于上学时...

linuxprobe16
22分钟前
0
0
RabbitMQ在CentOS环境安装

1.废话不多说准备一台虚拟机,系统为centos,我这里使用的系统版本如下图所示:

凌晨一点
今天
0
0
线程池相关

在java.util.concurrent包下,提供了一系列与线程池相关的类。 使用线程池的好处 降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗; 提高响应速度。当任务到达时,任务...

edwardGe
今天
0
0
学习大数据这三个关键技术是一定要掌握!

大数据时代全面来临,大数据、人工智能等技术引领科技创新潮流,获得国家政策大力支持,前景广阔。学习大数据技术的人自然是络绎不绝, 学习大数据虽然是一个趋势,但也要注意大数据培训课程...

董黎明
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部