文档章节

lucene学习5----Field类及辅助类说明

明舞
 明舞
发布于 2014/11/15 22:58
字数 1446
阅读 75
收藏 0

一、Eclipse中Field类的继承关系图:

二、Field类

1、  类的说明

在一般情况下为Document对象创建一个Field对象会使用它的子类,比如:

IntField,LongFieldFloatFieldDoubleFieldBinaryDocValuesField,StringField, TextField

, NumericDocValuesField, SortedDocValuesFieldStoredField。而不是使用它自己。

一个Field是Document的一部分,每一个Field有三部分组成,分别是:名称、类型和值。值可以是文本(String类型,Reader类型或者是预分享的TokenStream),二进制(byet[]),或者是数字(一个Number类型)Field是可以存储在索引中的,以便日后返回这个文档。

需要注意的是:这个Field 是一个实现了IndexableFieldType接口的类,

修改IndexableFieldType的状态将影响字段的使用。强烈建议不要在实例化

Field对象后修改它。可以通过在创建Field的配置类FieldType时调用FieldType的

方法freeze().该方法的解释是:阻止未来改变,推荐在创建FieldType对象时调用,去预防无意的状态改变。

在Field子类中设置FieldType时都调用了freeze()方法,代码如下:

        TYPE_NOT_STORED.setIndexed(true);

        TYPE_NOT_STORED.setOmitNorms(true);

        TYPE_NOT_STORED.setIndexOptions(IndexOptions.DOCS_ONLY);

        TYPE_NOT_STORED.setTokenized(false);

        TYPE_NOT_STORED.freeze();

        上面是StringField中的一段代码,代码的最后调用了freeze()方法。

2、  构造函数

    • public Field(String name, Reader reader, FieldType type)

    • public Field(String name, TokenStream tokenStream,

    • FieldType type)

    • public Field(String name, byte[] value, FieldType type)

    • public Field(String name, byte[] value, int offset, int

    • length, FieldType type)

    • public Field(String name, BytesRef bytes, FieldType type)

    • public Field(String name, String value, FieldType type)

其中传byte[]参数的构造函数需要主要的是:byte[]参数使用不是复制(也就是使用的是对象引用),所以在Field完成前,不要修改它。

Field还有一些构造函数,在4.4版本中是不赞成使用的。

在上面所列的Field构造函数的最后一个参数都是FieldType类型,这个是Field重要的辅助类,稍后会记录。

3、  内部类

Field类里面还包含三个枚举类型的内部类,分别是:Store、Index和

TermVector,其中Index和TermVector在4.4版本中也是不赞成使用的,那我们就光看Store吧,它包含两个枚举值,YES和NO,就是表示Field是否存储时使用。

三、StringField类

1、  类的概述:

StringField是Field类的一个子类,其实就是在原有Field类的基础上添加了FieldType字段,官方说明是:一个索引但不分词的Field,通过构造传过来的String值会是一个单独的Token,也就是会把这个字符串当成一个完整的词来进行索引,官方还举了一些例子,如:一个地名或ID还有path(路径)都不需要分词。你打算使用排序或访问通过字段缓存。

2、  StringField类的源码

通过看这个类的源码你会一目了然

StringField定义了两个FieldType对象

一个为索引存储但不分词。另一个是索引不存储不分词,

这两个都是通过一个静态代码块儿来完成初始化的,通过看这个FieldType对象的设置,我们以后要定义FieldType时就可以参考这个了。

最后一个构造函数来调用父类的构造函数。

四、TextField类

1、  类的概述

跟StringField一样,TextField类也是一个Field类的子类,也是包含了多个FieldType对象,官方说明是:这个Field是一个索引分词,不包含term vectors,例如将被用到“body”属性,包含大量文本的Document中。

TextField类的源码

五、StoredField类

1、  类概述

同StringField类一样,官方说明是:一个字段的值被存储,所以可以通过

IndexSearcher.doc和IndexReader.document获得这个Field的值。

2、类源码:

构造函数基本与父类一致。

六、IntField类

1、  类概述

官方说明:int类型的Field在一个有效的范围内过滤和排序,下面是一个例子:

document.add(new IntField(name, 6, Field.Store.NO));

为了获得最佳性能,使用一个IntField和Document实例来保存多个文档,例子如下:

2、源码

七、LongField类

1、  类概述

基本与IntField一样,例子也一样,就是把IntField改成LongField。

2、  源码

源码结构也一样。

八、DoubleField类

1、  类概述

与IntField和Long一样。

2、  源码

源码结构也一样。

九、FloatField类

同以上三种一样。

十、NumericDocValuesField类

1、 类概述

官方概述:这个Field用于每个Document添加一个long类型的值用于评分、排序或者索引值,例子如下:

document.add(new NumericDocValuesField(name, 22L));

如果你需要去存储这个值,你应该添加一个单独的StoredField实例。

2、  源码

从源码也可以看出它是不存储的。

十一、FieldType类

1、  类的概述

该类主要是配置Field类来使用的,例如:是否储存,是否索引,是否分词等。

还有一个重要的方法freeze(),用来阻止Field在实例化后完成前修改。

2、  内部类

FieldType类包含一个内部的枚举类型NumericType来表示数字类型,值分别是,INT,LONG,FlOAT,DOUBLE。

3、  FieldType还用到了一个IndexOptions枚举类型,他有四个值,分别是:

DOCS_ONLY

文档只包含索引,位置和词频将忽略,查询短语和位置信息将引起异常

DOCS_AND_FREQS

文档只包含索引和词频,位置将忽略,这个可以正常评分,查询短语和位置也将引发异常

DOCS_AND_FREQS_AND_POSITIONS

文档包含索引位置和词频,这是一个典型的默认为全文搜索:全部启用评分和位置查询的支持。

DOCS_AND_FREQS_AND_POSITIONS_AND_OFFSETS

文档包含索引、位置、词频和偏移量。

至此Field类的情况就基本上介绍完了。有什么不对或者不完善的地方欢迎指正。


© 著作权归作者所有

共有 人打赏支持
明舞
粉丝 227
博文 424
码字总数 516555
作品 0
程序员
私信 提问
Lucene-5.2.1学习:入门

1、Lucene的核心jar包 lucene-core-5.2.1.jar lucene-analyzers-common-5.2.1.jar lucene-queryparser-5.2.1.jar 2、主要开发包说明 org.apache.lucene.analysis:语言分析器,主要用于分词 ......

Harmel
2015/08/11
9.2K
3
Lucene4.7 索引和检索的常用API(二)

前面几篇笔者已经把Lucene的最基本的入门,介绍完了,本篇就对Lucene基本的知识做一个总结,以便于加深对Lucene基本API组件的理解。 为了方便对比学习,下面给出表格数据 索引期间使用的API...

一枚Sir
2014/04/10
0
0
Lucene 3.5和Solr 3.5:大幅降低内存用量、SearcherManager和深度分页支持

Lucene项目管理委员会宣布Apache Lucene 3.5.0和Apache Solr 3.5.0已经可以使用。Lucene是一个高性能、支持全文搜索的文本搜索开发库。Solr是一个独立的搜索服务器,其核心使用了Lucene来做索...

墙头草
2012/02/03
3.5K
7
lucene基础(1)

lucene使用步骤分为两步,一是建立索引,二是搜索索引文档; 一、建立索引 先了解必须的五个基础类; 1、Document:由过个Field组成。相当于数据库的一条记录,Field对象相当于记录的字段; ...

110hxl
2016/10/11
9
1
lucene 6.0 常用类与方法

1.目录 org.apache.lucene.store.Directory 指定索引所在目录。 org.apache.lucene.store.RAMDirectory 存放于内存中的目录。 org.apache.lucene.store.RAMDirectory.RAMDirectory(FSDirect......

OSC一霸
2016/07/12
207
0

没有更多内容

加载失败,请刷新页面

加载更多

vue 对对象的属性进行修改时,不能渲染页面 vue.$set()

我在vue里的方法里给一个对象添加某个属性时,我console.log出来的是已经更改的object ,但是页面始终没有变化 原因如下: **受现代 JavaScript 的限制 (而且 Object.observe 也已经被废弃),...

Js_Mei
今天
2
0
开始看《Java学习笔记》

虽然书买了很久,但一直没看。这其中也写过一些Java程序,但都是基于IDE的帮助和对C#的理解来写的,感觉不踏实。 林信良的书写得蛮好的,能够帮助打好基础,看得出作者是比较用心的。 第1章概...

max佩恩
昨天
12
0
Redux 三大原则

1.单一数据源 在传统的MVC架构中,我们可以根据需要创建无数个Model,而Model之间可以互相监听、触发事件甚至循环或嵌套触发事件,这些在Redux中都是不被允许的。 因为在Redux的思想里,一个...

wenxingjun
昨天
8
0
跟我学Spring Cloud(Finchley版)-12-微服务容错三板斧

至此,我们已实现服务发现、负载均衡,同时,使用Feign也实现了良好的远程调用——我们的代码是可读、可维护的。理论上,我们现在已经能构建一个不错的分布式应用了,但微服务之间是通过网络...

周立_ITMuch
昨天
5
0
XML

学习目标  能够说出XML的作用  能够编写XML文档声明  能够编写符合语法的XML  能够通过DTD约束编写XML文档  能够通过Schema约束编写XML文档  能够通过Dom4j解析XML文档 第1章 xm...

stars永恒
昨天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部