文档章节

Lucene--FuzzyQuery与WildCardQuery(通配符)

一枚Sir
 一枚Sir
发布于 2014/10/30 16:16
字数 431
阅读 223
收藏 0

FuzzyQuery:

创建索引:

 

IndexWriter writer = new IndexWriter(path, new StandardAnalyzer(), false); 
writer.setUseCompoundFile(false);
 
Document doc1 = new Document(); 
Document doc2 = new Document(); 
Document doc3 = new Document(); 
Document doc4 = new Document(); 
Document doc5 = new Document(); 
Document doc6 = new Document();
 
Field f1 = new Field("content", "word", Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f2 = new Field("content", "work", Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f3 = new Field("content", "seed", Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f4 = new Field("content", "sword", Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f5 = new Field("content", "world", Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f6 = new Field("content", "ford", Field.Store.YES, 
Field.Index.TOKENIZED);
 
doc1.add(f1); 
doc2.add(f2); 
doc3.add(f3); 
doc4.add(f4); 
doc5.add(f5); 
doc6.add(f6);
 
writer.addDocument(doc1); 
writer.addDocument(doc2); 
writer.addDocument(doc3); 
writer.addDocument(doc4); 
writer.addDocument(doc5); 
writer.addDocument(doc6);
 
writer.close();


注:IndexWriter中的create的变量值一般设为true

搜索:

IndexSearcher searcher = new IndexSearcher(path); 
//构建一个Term,然后对其进行模糊查找 
Term t = new Term("content", "work"); 
FuzzyQuery query = new FuzzyQuery(t); 
//FuzzyQuery还有两个构造函数,来限制模糊匹配的程度 
// 在FuzzyQuery中,默认的匹配度是0.5,当这个值越小时,通过模糊查找出的文档的匹配程度就 
// 越低,查出的文档量就越多,反之亦然 
FuzzyQuery query1 = new FuzzyQuery(t, 0.1f); 
FuzzyQuery query2 = new FuzzyQuery(t, 0.1f, 1); 
Hits hits = searcher.search(query2); 
for (int i = 0; i  < hits.length(); i++) { 
    System.out.println(hits.doc(i)); 
} 
searcher.close();

模糊搜索的三种构造函数,具体讲一下参数的用法(以第三个为例);

第一个参数当然是词条对象,第二个参数指的是levenshtein算法的最小相似度,第三个参数指的是要有多少个前缀字母完全匹配:


WildCardQuery:

通配符就更简单了,只要知道“*”表示0到多个字符,而使用“?”表示一个字符就行了:

IndexSearcher searcher=new IndexSearcher(path);
Term t1=new Term("content","?o*");
WildcardQuery query=new WildcardQuery(t1);
Hits hits=searcher.search(query);
for(int i=0;i<hits.length();i++)
{
     System.out.println(hits.doc(i));
}


That“s all!

© 著作权归作者所有

一枚Sir
粉丝 119
博文 209
码字总数 350904
作品 0
朝阳
架构师
私信 提问
lucene搜索方式(query类型)

Lucene有多种搜索方式,可以根据需要选择不同的方式。 1、词条搜索(单个关键字查找) 主要对象是TermQuery 调用方式如下: Term term=new Term(字段名,搜索关键字); Query query=new TermQu...

无聊的人们啊
2012/07/12
0
0
Lucene 的检索方式

TermQuery 这个检索通常查找文档中唯一数据的字段(在更新索引时特别有用),一般这个字段使用Field.Index.NOT_ANALYZED方式保存索引(但并不意味着所有Field.Index.NOT_ANALYZED方式保存索引的字...

jing31
2010/11/25
450
0
solr:关于dismax的使用情况

首先说说 dismax这个功能,它是基于lucene的DisjunctionMaxQuery去 扩展的,就是说,实际上用到的就是DisjunctionMaxQuery的这个查询类。查询api,可以知道是 对查询的几个域中,取最大的打分...

momoHuang
2013/07/18
0
3
Lucene知识小总结8:索引查询

对于IndexReader而言,反复使用Index.open打开会有很大的开销,所以一般在整个程序的生命周期中只会打开一个IndexReader,通过这个IndexReader来创建不同的IndexSearcher,如果使用单例模式,可...

heroShane
2014/02/23
0
0
简单的lucene实例

package TestLucene; import java.io.File; import java.io.FileReader; import java.io.Reader; import java.util.Date; import org.apache.lucene.analysis.Analyzer; import org.apache.l......

村长大神
2014/03/27
182
0

没有更多内容

加载失败,请刷新页面

加载更多

gradle grovvy中的闭包

1. 无参数的闭包 //这b1就是一个闭包def b1={ println "hello b1"}//定义方法,包含闭包类型的参数def method1(Closure closure){closure()}//执行method1method1(b1) 执行结果 ...

edison_kwok
20分钟前
2
0
基于Spring Boot + Dubbo的全链路日志追踪(一)

一、 概要 当前公司后端整体架构为:Spring Boot + Dubbo。由于早期项目进度等原因,对日志这块没有统一的规范,基本上是每个项目自己管自己的日志。这也对后面的问题排查带来了很大的困难,...

明天以后
今天
7
0
安装fastdfs文件服务器步骤

1、安装libfastcommon wget https://github.com/happyfish100/libfastcommon/archive/master.zip 解压后安装 cd fastcommon-master ./make.sh ./make.sh install 2、安装 FastDFS,从sourcef......

lsjlgo
今天
3
0
MySQL 5.7 免安装版配置

下载地址:https://dev.mysql.com/downloads/mysql/ 安装步骤 1.下载zip解压到目录下 2.配置环境变量 新建系统变量:MYSQL_HOME,值:D:\DevelopmentTool\Mysql-5.7.26-winx64 修改path变量:...

华山猛男
今天
7
0
java map的遍历

//从大的角度可以分为两类Set<String> set=map.keySet();这里面还可以分为3类, 从set的角度来分 //Set<Map.Entry<String, String>> entery=map.entrySet(); public class Test { public sta......

南桥北木
今天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部