文档章节

lucene学习笔记二(基于数组的lucene检索,索引删除)

吕兵阳
 吕兵阳
发布于 2015/10/03 13:58
字数 506
阅读 871
收藏 2

构建数组:

private String[] ids = { "1", "2", "3", "4", "5", "6" };
	private String[] emails = { "aa@kkrgwbj.com", "2aa@qq.com", "3aa@bingyang.com", "4wew@qq.com", "5asdf@qq.com",
			"6adsf@qq.com	" };
	private String[] contents = { "welcome to visited the space,i like eat", "hello,my name is scc,i like foot",
			"the day is first,i like sing,i like foot", "tommorw,i like dance", "hello world,i like game",
			"i like football" };
	private Date[] dates = null;
	private Map<String, Float> scores = new HashMap<>();// 加权

	private int[] attachs = { 2, 3, 1, 4, 5, 6 };
	private String[] names = { "张三", "李四", "marry", "jetty", "mick", "divid" };
	
	public void setDates() throws ParseException {
		SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd");
		dates = new Date[] { sdf.parse("2015-04-01"), sdf.parse("2016-04-01"), sdf.parse("2017-04-01"),
				sdf.parse("2015-03-01"), sdf.parse("2015-10-01"), sdf.parse("2015-12-01") };

	}

创建Directory:

private Directory directory;
	public IndexUtil(){
		try {
			//创建Directory
			directory = FSDirectory.open(new File("D:/workspace/lucene/index02").toPath());
			scores.put("kkrgwbj.com", 2.0f);
			scores.put("bingyang.com", 1.5f);
			setDates();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}



创建文档,文档添加域:

public void index(){
		IndexWriter indexWriter = null;
		try {
			indexWriter = new IndexWriter(directory, new IndexWriterConfig(new StandardAnalyzer()));
			Document doc = null;
			for (int i = 0; i < ids.length; i++) {
				//创建文档(文档相当于数据库表中的每一条记录)
				doc = new Document();
				//为文档添加域(域相当于表中的每一个字段)
				doc.add(new TextField("id",ids[i],Field.Store.YES));
				doc.add(new TextField("email", emails[i],Field.Store.YES));
				TextField content = new TextField("content",contents[i],Field.Store.YES);
				content.tokenStream(new StandardAnalyzer(),null);
				doc.add(content);
				doc.add(new TextField("name", names[i],Field.Store.YES));
				//存储整形
				doc.add(new IntField("attach", attachs[i], Field.Store.YES));
				//存储日期
				doc.add(new LongField("date", dates[i].getTime(), Field.Store.YES));
				//将文档写到索引中
				indexWriter.addDocument(doc);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}finally{
			if(indexWriter!=null){
				try {
					indexWriter.close();
				} catch (IOException e) {
					e.printStackTrace();
				}
			}
		}
	}



查询索引:

/**
	 * 查询索引
	 */
	public void query(){
		IndexReader indexReader = null;
		try {
			indexReader = DirectoryReader.open(directory);
			//通过reader可以获取文档的数量
			System.out.println("numDosc:"+indexReader.numDocs());
			System.out.println("maxDocs:"+indexReader.maxDoc());
		} catch (IOException e) {
			e.printStackTrace();
		}finally{
			if(indexReader!=null)
				try {
					indexReader.close();
				} catch (IOException e) {
					e.printStackTrace();
				}
		}
		
	}



junit测试运行:



索引的删除:

/**
	 * 删除索引
	 */
	public void deleteIndex(){
		IndexWriter indexWriter = null;
		try {
			indexWriter = new IndexWriter(directory, new IndexWriterConfig(new StandardAnalyzer()));
			//参数是一个选项,可以是一个Query,也可以是一个Term,Term是一个精确查找的值
			indexWriter.deleteDocuments(new Term("id","1"));
			//强制删除
			//indexWriter.forceMergeDeletes();
		}catch(Exception e){
			e.printStackTrace();
		}finally{
			if(indexWriter!=null)
				try {
					indexWriter.close();
				} catch (IOException e) {
					e.printStackTrace();
				}
		}
	}



junit测试:

当执行deleteIndex方法时,再执行查询索引

 





© 著作权归作者所有

吕兵阳
粉丝 95
博文 276
码字总数 105376
作品 0
郑州
后端工程师
私信 提问
Lucene4.7 索引和检索的常用API(二)

前面几篇笔者已经把Lucene的最基本的入门,介绍完了,本篇就对Lucene基本的知识做一个总结,以便于加深对Lucene基本API组件的理解。 为了方便对比学习,下面给出表格数据 索引期间使用的API...

一枚Sir
2014/04/10
1K
0
这么说吧,Lucene很简单,其实就是个框架,用于全文检索用的

我是风月连城,喜欢用简单的语言阐述知识点 长期分享原创java文章,分享进阶架构师学习笔记及学习资料 喜欢的大屌们可以关注下,共同学习,一起进步 ps:由于工资迟迟不发,影响心情,好几天没写文章...

java进阶架构师
2017/09/28
0
0
Lucene In Action 读书笔记(一)

简介 Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和...

林俊龙
2013/09/04
502
1
全文检索:Apache Lucene框架入门实例

一 简介 Lucene属于Apache开源项目的一部分,是一个开源的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析...

pangfc
2018/06/26
0
0
Lucene原理与代码分析(高手博客备忘)

随笔 - 69 文章 - 77 评论 - 687 随笔分类 - Lucene原理与代码分析 Lucene 4.X 倒排索引原理与实现: (3) Term Dictionary和Index文件 (FST详细解析) 摘要: 我们来看最复杂的部分,就是Term ...

浮躁的码农
02/28
64
0

没有更多内容

加载失败,请刷新页面

加载更多

PostgreSQL 11.3 locking

rudi
今天
5
0
Mybatis Plus sql注入器

一、继承AbstractMethod /** * @author beth * @data 2019-10-23 20:39 */public class DeleteAllMethod extends AbstractMethod { @Override public MappedStatement injectMap......

一个yuanbeth
今天
10
1
一次写shell脚本的经历记录——特殊字符惹的祸

本文首发于微信公众号“我的小碗汤”,扫码文末二维码即可关注,欢迎一起交流! redis在容器化的过程中,涉及到纵向扩pod实例cpu、内存以及redis实例的maxmemory值,statefulset管理的pod需要...

码农实战
今天
4
0
为什么阿里巴巴Java开发手册中不建议在循环体中使用+进行字符串拼接?

之前在阅读《阿里巴巴Java开发手册》时,发现有一条是关于循环体中字符串拼接的建议,具体内容如下: 那么我们首先来用例子来看看在循环体中用 + 或者用 StringBuilder 进行字符串拼接的效率...

武培轩
今天
8
0
队列-链式(c/c++实现)

队列是在线性表功能稍作修改形成的,在生活中排队是不能插队的吧,先排队先得到对待,慢来得排在最后面,这样来就形成了”先进先出“的队列。作用就是通过伟大的程序员来实现算法解决现实生活...

白客C
今天
81
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部