文档章节

ElasticSearch2.3.4之Java Api调用例子

九劫散仙
 九劫散仙
发布于 2016/08/11 19:22
字数 1522
阅读 642
收藏 6

ElasticSearch2.3.4

序号覆盖功能例子
1客户端链接初始化
2filte无评分查询用法
3query有评分查询用法
4单字段分组用法
5多字段分组用法
6读取有索引无存储数据的用法
7设置指定字段返回

代码如下:

package com.curd.es;

import org.elasticsearch.action.search.SearchRequestBuilder;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.Client;
import org.elasticsearch.client.transport.TransportClient;
import org.elasticsearch.common.settings.Settings;
import org.elasticsearch.common.transport.InetSocketTransportAddress;
import org.elasticsearch.index.query.BoolQueryBuilder;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.index.query.QueryStringQueryBuilder.Operator;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.aggregations.AggregationBuilders;
import org.elasticsearch.search.aggregations.Aggregations;
import org.elasticsearch.search.aggregations.bucket.histogram.DateHistogramBuilder;
import org.elasticsearch.search.aggregations.bucket.histogram.DateHistogramInterval;
import org.elasticsearch.search.aggregations.bucket.histogram.Histogram;
import org.elasticsearch.search.aggregations.bucket.terms.StringTerms;
import org.elasticsearch.search.aggregations.bucket.terms.Terms;
import org.elasticsearch.search.aggregations.bucket.terms.TermsBuilder;
import org.joda.time.DateTime;

import java.net.InetSocketAddress;
import java.util.List;
import java.util.Map;

public class ElasticSearchToolsTest {


	//elasticsearch2.3的客户端实例
	static Client client=null;
	static {
		//设置集群名字
		Settings settings = Settings.settingsBuilder()
		        .put("cluster.name", "search")
		        .put("client.transport.sniff", true)
		       . build();
		try {
			//初始化连接客户端
			client = new TransportClient.Builder().settings(settings).build()
					.addTransportAddress(new InetSocketTransportAddress(new InetSocketAddress("192.168.201.5",9300)))
					.addTransportAddress(new InetSocketTransportAddress(new InetSocketAddress("192.168.201.6",9300)))
					.addTransportAddress(new InetSocketTransportAddress(new InetSocketAddress("192.168.201.7",9300)));
		}catch (Exception e){
			e.printStackTrace();
		}

	}


	/****
	 * 测试读取仅仅索引没有存储的字段,从倒排里面加载数据
	 * 过滤数据
	 */
	public static void filterQueryString(){
		//构建查询请求
		SearchRequestBuilder search=client.prepareSearch("monitor").setTypes("monitor");
		BoolQueryBuilder boolQuery = QueryBuilders.boolQuery()
				.must(QueryBuilders.queryStringQuery("*:*"))
				.filter(QueryBuilders.queryStringQuery("+mtitle:北京奇虎科技     +dtime:[1443196800000 TO 1451059200000] ").defaultOperator(Operator.AND));
				search.setQuery(boolQuery);
		search.addFieldDataField("t1");//索引,没有存储的域,从field data里面加载数据
		search.addFieldDataField("t2");//索引,没有存储的域,从field data里面加载数据
		search.addFieldDataField("t3");//索引,没有存储的域,从field data里面加载数据
		search.addFieldDataField("dtime");//索引,没有存储的域,从field data里面加载数据
		SearchResponse r = search.get();
		for(SearchHit hit:r.getHits()){
			String id=hit.getId();
			String index=hit.getIndex();
			String type=hit.getType();
			String t1=hit.getFields().get("t1").getValue();
			String t2=hit.getFields().get("t2").getValue();
			String t3=hit.getFields().get("t3").getValue();
			Long time=hit.getFields().get("dtime").getValue();
			Float score=hit.getScore();
			System.out.println(id+"\t"+t1+"\t"+t2+"\t"+t3+"\t"+time+"\t"+score);
		}
		System.out.println("总数量:"+r.getHits().getTotalHits());
		System.out.println("耗时:"+r.getTookInMillis());
	}


	public static void main(String[] args) throws Exception {

		//单个聚合字段,支持.写法
		String aggField="data.subjectId";
//		testOneAggString(aggField);
		testFilter();
		client.close();

	}


	/***
	 * 每一天的select count(distinct(actid)) from talbe group by date
     */
	public static void countDistinctByField(){


		//构造search请求
		SearchRequestBuilder search=client.prepareSearch("userlog*").setTypes("logs");
		search.setQuery(QueryBuilders.queryStringQuery("@timestamp:[ "+new DateTime(2016, 8, 8, 0, 0, 0).getMillis()
				+" TO "+new DateTime(2016, 8, 15, 0, 0, 0).getMillis()+"}"
		));
		search.setSize(0);
		//一级分组字段
		DateHistogramBuilder dateagg = AggregationBuilders.dateHistogram("dateagg");
		dateagg.field("@timestamp");//聚合时间字段
//		dateagg.interval(DateHistogramInterval.HOUR);//按小时聚合
		dateagg.interval(DateHistogramInterval.DAY);//按天聚合
//		dateagg.format("yyyy-MM-dd HH"); //格式化时间
		dateagg.format("yyyy-MM-dd"); //格式化时间
		dateagg.timeZone("Asia/Shanghai");//设置时区,注意如果程序部署在其他国家使用时,使用Joda-Time来动态获取时区 new DateTime().getZone()

		//二级分组字段
//		TermsBuilder twoAgg = AggregationBuilders.terms("stragg").field("actId");
		MetricsAggregationBuilder twoAgg = AggregationBuilders.cardinality("stragg").field("actId");

		//组装聚合字段
		dateagg.subAggregation(twoAgg);
		//向search请求添加
		search.addAggregation(dateagg);
		//获取结果
		SearchResponse r = search.get();
		Histogram h = r.getAggregations().get("dateagg");
		//得到一级聚合结果里面的分桶集合
		List<Histogram.Bucket> buckets = (List<Histogram.Bucket>) h.getBuckets();
		//遍历分桶集
		for(Histogram.Bucket b:buckets){
			//读取二级聚合数据集引用
			Aggregations sub = b.getAggregations();
			//获取二级聚合集合
			Cardinality agg = sub.get("stragg");
			//获取去重后的值
			long value = agg.getValue();
			//如果设置日期的format的时候,需要使用keyAsString取出,否则获取的是UTC的标准时间
			System.out.println(b.getKeyAsString() +"  " +b.getDocCount()+" "+value);
		}
	}


	/***
	 *  获取search请求的结果,并输出打印结果信息
	 * @param search
	 * @throws Exception
     */
	public  static void showResult(SearchRequestBuilder search) throws Exception{
		SearchResponse r = search.get();//得到查询结果
		for(SearchHit hits:r.getHits()){
			//只能获取addFields里面添加的字段
//			System.out.println(hits.getFields().get("userId").getValue());
			//默认可会source里面获取所需字段
			System.out.println(hits.getSource().get("actId"));
			//注意不支持data.subjectName这样的访问方式
			//System.out.println(hits.getId()+"  "+hits.score()+"  "+data.get("subjectName"));
			//如果是个嵌套json,需要转成map后,访问其属性
//			Map data=(Map) hits.getSource().get("data");
//			System.out.println(hits.getId()+"  "+hits.score()+"  "+data.get("subjectName"));


		}
		long hits=r.getHits().getTotalHits();//读取命中数量
		System.out.println(hits);
	}

	/***
	 * 最新版elasticsearch2.3的query测试,结果会评分
	 * @throws Exception
     */
	public static void testQuery() throws Exception{
		SearchRequestBuilder search=client.prepareSearch("userlog*").setTypes("logs");
		String subjectName="语文";
		//注意查询的时候,支持嵌套的json查询,通过点符号访问下层字段,读取结果时不支持这种方式
 		search.setQuery(QueryBuilders.queryStringQuery("+data.subjectName:* -data.subjectName:"+subjectName+"  "));
		showResult(search);
	}

	/***
	 * 最新版的elasticsearch2.3的filterquery测试,结果不会评分
	 * @throws Exception
     */
	public static void testFilter() throws Exception{
		SearchRequestBuilder search=client.prepareSearch("userlog*").setTypes("logs");
		//第一个参数包含的字段数组,第二个字段排除的字段数组
//		search.setFetchSource(new String[]{"userId","actId"},null);
//		search.addFields("actId","userId"); //另一种写法
		String schoolName="沙河市第三小学";
		BoolQueryBuilder boolQuery = QueryBuilders.boolQuery()
				.must(QueryBuilders.queryStringQuery("*:*"))
				.filter(QueryBuilders.queryStringQuery("+data.subjectName:* +schoolName:"+schoolName).defaultOperator(Operator.AND));
		//设置query
		search.setQuery(boolQuery);
		//打印结果数据
		showResult(search);
	}

	/***
	 *  两个字段分组测试,在时间的维度上加上任意其他的字段聚合,类似group by field1,field2
	 * @throws Exception
     */
	public static void testTwoAggString() throws Exception{
		//构造search请求
		SearchRequestBuilder search=client.prepareSearch("userlog*").setTypes("logs");
		search.setQuery(QueryBuilders.queryStringQuery("@timestamp:[ "+new DateTime(2016, 8, 10, 0, 0, 0).getMillis()
		+" TO "+new DateTime(2016, 8, 11, 0, 0, 0).getMillis()+"}"
		));
		//一级分组字段
		DateHistogramBuilder dateagg = AggregationBuilders.dateHistogram("dateagg");
		dateagg.field("@timestamp");//聚合时间字段
		dateagg.interval(DateHistogramInterval.HOUR);//按小时聚合
		dateagg.format("yyyy-MM-dd HH"); //格式化时间
		dateagg.timeZone("Asia/Shanghai");//设置时区,注意如果程序部署在其他国家使用时,使用Joda-Time来动态获取时区 new DateTime().getZone()

		//二级分组字段
		TermsBuilder twoAgg = AggregationBuilders.terms("stragg").field("module");
		//组装聚合字段
		dateagg.subAggregation(twoAgg);
		//向search请求添加
		search.addAggregation(dateagg);
		//获取结果
		SearchResponse r = search.get();
		Histogram h = r.getAggregations().get("dateagg");
		//得到一级聚合结果里面的分桶集合
		List<Histogram.Bucket> buckets = (List<Histogram.Bucket>) h.getBuckets();
		//遍历分桶集
		for(Histogram.Bucket b:buckets){
			//读取二级聚合数据集引用
			Aggregations sub = b.getAggregations();
			//获取二级聚合集合
			StringTerms count = sub.get("stragg");
			//如果设置日期的format的时候,需要使用keyAsString取出,否则获取的是UTC的标准时间
			System.out.println(b.getKeyAsString() +"  " +b.getDocCount());
			System.out.println("=============================================");
			for(Terms.Bucket bket:(List<Terms.Bucket>)count.getBuckets()){

				System.out.println(bket.getKeyAsString() +"  "+bket.getDocCount());
			}
			System.out.println("************************************************");

		}

	}


	/***
	 *  一个字段聚合,类似数据库的group by field1
	 * @param field 测试聚合的字段
	 * @throws Exception
     */
	public static  void testOneAggString(String field)throws Exception{
		//构造search请求
		SearchRequestBuilder search=client.prepareSearch("userlog*").setTypes("logs");
		//查询昨天的数据
		search.setQuery(QueryBuilders.queryStringQuery("@timestamp:[ "+new DateTime(2016, 8, 10, 0, 0, 0).getMillis()
				+" TO "+new DateTime(2016, 8, 11, 0, 0, 0).getMillis()+"}"
		));
		//聚合构造
		TermsBuilder termsBuilder = AggregationBuilders.terms("agg").field(field);
		//添加到search请求
		search.addAggregation(termsBuilder);
		//获取结果
		SearchResponse searchResponse = search.get();
		//获取agg标识下面的结果
		Terms agg1 = searchResponse.getAggregations().get("agg");
		//获取bucket
		List<Terms.Bucket> buckets = (List<Terms.Bucket>) agg1.getBuckets();
		long sum=0;
		for(Terms.Bucket b:buckets){
			Aggregations sub = b.getAggregations();
			System.out.println(b.getKeyAsString()+"  "+b.getDocCount());
			sum+=b.getDocCount();
		}
		System.out.println("总数:"+sum);
	}

}

有什么问题可以扫码关注微信公众号:我是攻城师(woshigcs),在后台留言咨询。 技术债不能欠,健康债更不能欠, 求道之路,与君同行。 image

ElasticSearch2.x API变化官网链接

https://www.elastic.co/guide/en/elasticsearch/reference/2.3/breaking-changes-2.0.html

© 著作权归作者所有

共有 人打赏支持
上一篇: Storm组件介绍
九劫散仙
粉丝 266
博文 175
码字总数 189625
作品 0
海淀
私信 提问
加载中

评论(3)

码上中国博客
码上中国博客
我自己翻译了elasticsearch的官方文档,欢迎大家查阅:
https://www.blog-china.cn/template/documentHtml/1484101683485.html
九劫散仙
九劫散仙

引用来自“苏城”的评论

这个东东是干哈的?
全文检索框架
苏城
这个东东是干哈的?
clojure 新手指南(10):与java交互

clojure是基于jvm的语言,就是说clojure会被编译成字节码被jvm执行。但是clojure能做的可不仅仅是被编译成字节码,它提供了一套API让用户与java交互。因此clojure可以直接调用java世界中那些...

凯奥斯
2013/07/07
0
1
Java 8 彻底改变数据库访问

Java 8终于到来了! 经过几年的等待, java程序员终于能在java中得到函数式编程的支持了. 函数式编程的支持能流程化现有的代码并且为java提供强大的能力.在这些新特性中最瞩目的是java程序员对...

oschina
2014/03/26
19.4K
111
Java 8时间和日期API 20例

伴随lambda表达式、streams以及一系列小优化,Java 8 推出了全新的日期时间API,在教程中我们将通过一些简单的实例来学习如何使用新API。Java处理日期、日历和时间的方式一直为社区所诟病,将...

黄梦巍
2015/06/19
0
0
JAVA线程8 - ThreadLocal

一、ThreadLocal简介 ThreadLocal并不是一个Thread,而是Thread的局部变量。 当使用ThreadLocal维护变量时,ThreadLocal为每个使用该变量的线程提供独立的变量副本,所以每一个线程都可以独立...

小米米儿小
2014/02/26
0
0
JNA调用window api中的MessageBox

用JNA调用C/C++,很方便,写了个很简单的例子。 例子是使用Eclipse CDT + MinGW开发的: C代码,hello.c #include <windows.h> #include "stdio.h" void say(){ MessageBox (NULL, TEXT ("你......

penngo
2011/01/17
0
0

没有更多内容

加载失败,请刷新页面

加载更多

特斯拉车主成功破解了自己Model 3汽车

据汽车博客Electrek消息,一位特斯拉车主成功破解了自己Model 3汽车,还在此基础上运行了Ubuntu。 这位叫trsohmers的网友表示,“功劳大多要归到Ingineerix的头上,他花了数月才找到初始的那...

linuxCool
18分钟前
0
0
Gitbook : random errors when using gitbook plugin on running "gitbook serve"

在执行gitbook serve时,会有不定的失败错误 参考问题 :#1309 解决方案: 更新gitbook版本,这个问题似乎是3版本的问题 , 官方也不打算在这个版本解决了。 更新 到最新版本后, 不再出现问...

ol_O_O_lo
32分钟前
1
0
提灯照暗,向内自省——《中国文化的深层结构》读书笔记3800字

提灯照暗,向内自省——《中国文化的深层结构》读书笔记3800字: 作者:王健茜;断断续续一个多月才读完了《中国文化的深层结构》,这并不是一本难懂的书,之所以读得慢,源于对书中观点的思...

原创小博客
34分钟前
1
0
高德地图-行政区域接口

1、获取全国各省信息 https://restapi.amap.com/v3/config/district?extensions=all&key=应用Key&s=rsv3&output=json 2、获取下级行政区域信息 https://restapi.amap.com/v3/config/distric......

voole
46分钟前
4
0
集群介绍 ..

12月19日任务 18.1 集群介绍 18.2 keepalived介绍 18.3/18.4/18.5 用keepalived配置高可用集群 一.集群介绍 根据功能划分为两大类:高可用和负载均衡 高可用集群通常为两台服务器,一台工作,...

hhpuppy
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部