背景
注:ElasticSearch
版本为5.4
。
在我们的日志系统里需要一些系统索引,这些系统索引在应用初始化的时候就会被添加到ElasticSearch
中去,这些在ElasticSearch
中的系统索引在没有索引数据的时候,只有索引名和一些配置信息,没有mapping
信息。当用户去根据时间区间排序搜索日志信息的时候,ElasticSearch
就会产生all shards failed
异常。具体异常信息如下:
Caused by: [.alert/NXa3zq5WSb-wGBKgyZibzw] QueryShardException[No mapping found for [timestamp] in order to sort on]
at org.ElasticSearch.search.sort.FieldSortBuilder.build(FieldSortBuilder.java:262)
at org.ElasticSearch.search.sort.SortBuilder.buildSort(SortBuilder.java:156)
at org.ElasticSearch.search.SearchService.parseSource(SearchService.java:617)
at org.ElasticSearch.search.SearchService.createContext(SearchService.java:468)
at org.ElasticSearch.search.SearchService.createAndPutContext(SearchService.java:444)
at org.ElasticSearch.search.SearchService.executeQueryPhase(SearchService.java:252)
at org.ElasticSearch.action.search.SearchTransportService$6.messageReceived(SearchTransportService.java:331)
at org.ElasticSearch.action.search.SearchTransportService$6.messageReceived(SearchTransportService.java:328)
at org.ElasticSearch.transport.RequestHandlerRegistry.processMessageReceived(RequestHandlerRegistry.java:69)
at org.ElasticSearch.transport.TransportService$7.doRun(TransportService.java:627)
at org.ElasticSearch.common.util.concurrent.ThreadContext$ContextPreservingAbstractRunnable.doRun(ThreadContext.java:638)
at org.ElasticSearch.common.util.concurrent.AbstractRunnable.run(AbstractRunnable.java:37)
... 3 more
查看了.alert
的索引数据再结合ElasticSearch
的异常信息判断,我怀疑是由于.alert
系统索引没有timestamp mapping
信息引起的,.alert
索引初始化没有任何数据时,ElasticSearch
中的信息如下:
http://dev:9200/.alert
{
".alert": {
"aliases": {
"alert": {}
},
"mappings": {
"alert": {}
},
"settings": {
"index": {
"refresh_interval": "-1",
"number_of_shards": "5",
"provided_name": ".alert",
"creation_date": "1533613744728",
"store": {
"type": "fs"
},
"number_of_replicas": "1",
"uuid": "YuPjsObOTMO6u3fEdG6hVw",
"version": {
"created": "5040099"
}
}
}
}
}
看到这些信息之后,我开始了用以下方法尝试解决。
解决方法
以下方法1和方法2都以失败而告终,只有方法3可以成功解决该问题。但在解决问题中我查找了很多资料,让我对ElasticSearch
的mapping
有了更深地理解,因此我将解决该问题的过程记录了下来。
方法1:添加索引模板
首先,由于是没有timestamp
这个mapping
信息,因此我想到创建索引模板,将.alert
这个索引的mappings
信息用模板来设置,以便在索引创建的时候就有相应的mapping
信息。模板信息如下:
{
"alert": {
"order": 0,
"template": "alert",
"settings": {
"index": {
"number_of_shards": "5",
"number_of_replicas": "1",
"refresh_interval": "2s"
}
},
"mappings": {
"alert": {
"properties": {
"timestamp": {
"type": "date"
}
}
}
},
"aliases": {}
}
}
但是,经过测试后发现,all shards failed
的问题还是会产生。究其原因是由于:
索引模板只会在插入新索引数据的时候生效,如果没有索引数据,索引模板定义的
mappings
信息不会生效,而且对模板的改变不会影响到已存在的索引。
此时,.alert
这个索引为空,还没有新数据插入,因此,模板不会生效,也就致使该方法不会解决all shards failed
的问题。
方法2:创建索引时添加mapping
由于ElasticSearch
允许在创建索引时就创建mapping
信息,于是我想到了这个方法,经过测试后,可以解决all shards failed
的问题。但是,产生了一个严重的后果,我们用.alert
索引来记录服务器报警信息,当我往.alert
这个索引里添加数据时,只有timestamp
这个字段的数据添加进去了,其他数据像产生报警的主机、报警内容等信息添加失败。
查询官方文档发现:
mapping
信息一旦被创建,就不允许被修改。改变已有的mapping
就意味着使已经存在的索引数据无效,解决的办法就是使用正确的mappings
信息来创建新的索引,然后重新把数据添加到新索引中。虽然官方提供了reindex
方法来解决这个问题,但是,在大数据量的情况下,reindex
代价比较高,因此,创建索引时添加mapping
这个方法也行不通。
方法3:给排序条件加unmapped_type
ElasticSearch
的search api
可以设置排序时忽略字段的哪些映射。默认情况下,如果没有与排序字段关联的映射,则搜索请求将失败。unmapped_type
选项允许设置忽略没有映射的字段,从而不对该字段排序。由于timestamp
的mapping
为date
类型,因此,在搜索排序条件中增加{"timestamp":{"unmapped_type":"date"}}
成功解决由于排序字段没有date
映射引起的all shards failed
问题。
参考资料
索引模板官方文档:Index Templates
索引排序官方文档:Sort
更新已存在的mapping
信息官方文档:updating_existing_mappings
stackoverflow
问题链接:No mapping found for field in order to sort on in ElasticSearch