文档章节

Lucene获取分词后的关键字

-_-struggle
 -_-struggle
发布于 2016/11/30 19:03
字数 152
阅读 141
收藏 0

整理了一下 

String keyWord = "java是一种可以撰写跨平台应用软件的面向对象的程序设计语言。";

IKAnalyzer analyzer = new IKAnalyzer();
System.out.println("分词:"+keyWord);
try {
	TokenStream tokenStream = analyzer.tokenStream("content",new StringReader(keyWord));
    tokenStream.addAttribute(CharTermAttribute.class);


   //必须先调用reset方法,否则会报下面的错,可以参考TokenStream的API说明
   tokenStream.reset();

   /* java.lang.IllegalStateException: 
	  TokenStream contract violation: reset()/close() call missing, 
	  reset() called multiple times, or subclass does not call super.reset(). 
	  Please see Javadocs of TokenStream class for more information 
	  about the correct consuming workflow.
   */
	
  System.out.print("结果:");
  while (tokenStream.incrementToken()) {
        CharTermAttribute charTermAttribute = 
                   (CharTermAttribute)tokenStream.getAttribute(CharTermAttribute.class);
        System.out.print(charTermAttribute.toString() + " ");
   }

 tokenStream.end();
 tokenStream.close();

} catch(Exception e) {
	e.printStackTrace();
}

lucene 4.9.0

ikanalyzer 2012FF_u1

本文转载自:https://zhidao.baidu.com/question/1495688060489922859.html

-_-struggle
粉丝 3
博文 210
码字总数 50914
作品 0
苏州
后端工程师
私信 提问
Lucene5.5.2开发入门详解

一、 全文检索的概念 常见的全文检索 1) 在window系统中,可以指定磁盘中的某一个位置来搜索你想要得到的东西。这个功能是windows比较常用的功能。 2) 在eclipse中,帮助文档搜索:heltp 》h...

silence88
2016/12/22
59
0
用lucene实现在一个(或者多个)字段中查找多个关键字

  最近跟着师兄们做个项目,我的任务就是负责做个“全文检索”的小模块。用到了Lucene的索引,下面的是其中的用Lucene实现在索引的一个字段(比如文章内容字段)进行查找多个关键字的实例代码...

旭东的博客
2013/05/08
0
0
Lucene小记(入门篇),索引创建、更新、删除、查找等操作。

虽然使用Lucene已经有一段时间了,但是仍不敢妄加评论Lucene的好与坏,毕竟目前接触的全文索引技术只有Lucene。而且Lucene并不是真正意义上的引擎,只算的上是Java开发的全文索引工具包。与传...

Jialy
2014/06/26
0
9
JAVAEE——Lucene基础:什么是全文检索、Lucene实现全文检索的流程、配置开发环境、索引库创建与管理

1. 学习计划 第一天:Lucene的基础知识 1、案例分析:什么是全文检索,如何实现全文检索 2、Lucene实现全文检索的流程 a) 创建索引 b) 查询索引 3、配置开发环境 4、创建索引库 5、查询索引库...

kent鹏
2018/07/14
0
0
lucene的Compass总结1

lucene搜索引擎与数据库like查询的比较 1>在数据量比较大查询字段比较多的情况下,如果采用数据库like查询,性能比较差,而采用lucene来查询,性能相对like查询要好 2>如果采用lucene进行搜索,搜...

easonwang
2011/03/28
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Python猫荐书系列之七:Python入门书籍有哪些?

本文原创并首发于公众号【Python猫】,未经授权,请勿转载。 原文地址:https://mp.weixin.qq.com/s/ArN-6mLPzPT8Zoq0Na_tsg 最近,猫哥的 Python 技术学习群里进来了几位比较特殊的同学:一...

豌豆花下猫
8分钟前
0
0
一、容器(Containers)

在容器模型中,容器大致类似于VM。他们的主要不同之处在于,每个容器不需要自己完整的操作系统。事实上,所有单个主机上的容器共享整个操作系统。这就释放了大量的系统资源,如CPU、RAM和存储...

倪伟伟
18分钟前
0
0
Guava RateLimiter限流源码解析和实例应用

在开发高并发系统时有三把利器用来保护系统:缓存、降级和限流 缓存 缓存的目的是提升系统访问速度和增大系统处理容量 降级 降级是当服务出现问题或者影响到核心流程时,需要暂时屏蔽掉,待高...

算法之名
21分钟前
0
0
国产达梦数据库与MySQL的区别

背景 由于项目上的需要,把项目实现国产化,把底层的MySQL数据库替换为国产的达梦数据库,花了一周的时间研究了国产的数据库-达梦数据库,它和MySQL有一定的区别,SQL的写法也有一些区别。 ...

TSMYK
30分钟前
0
0
老也有错?35岁程序员是一道坎,横亘在每个技术职场人的心中

随着互联网的高速发展变革,大龄恐惧症越来越多地在技术圈被人讨论。很多程序员在工作5-10年以后,都会开始思考5年、10年甚至更久以后的自己,会是怎样一种生活工作状态,以及是否会被时代抛...

我最喜欢三大框架
36分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部