Lucene第二天

原创
2019/07/18 20:07
阅读数 36

1.field域

    Lucene根据文档中的域的属性,确定是否要分词、创建索引。

    三大属性:分词(tokenized):只有设置了分词属性为true,lucene才会对这个域进行分词处理。

                    索引(indexed):只有设置了索引属性为true,lucene才为这个域的Term词创建索引。

                    存储(stored):只有设置了存储属性为true,在查找的时候,才能从文档中获取这个域的值。

          特点:三大属性彼此独立;通常分词是为了创建索引;不存储这个域文本内容,也可以对这个域先分词、创建索引。

          域的常用类型:Field类型        是否分词        是否索引        是否存储

                                StringField      N                   Y                  Y或N

                                LongField        Y                   Y                  Y或N

                                FloatField        Y                   Y                  Y或N

                                StoredField      N                  N                  Y

                                TextField          N                  N                  Y

IKAnalyzer:IKAnalyzer继承Lucene的Analyzer抽象类,使用IKAnalyzer和Lucene自带的分析器方法一样,将Analyzer测试代码改为IKAnalyzer测试中文分词效果。

展开阅读全文
打赏
0
0 收藏
分享
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部