使用Redis解决“树”形数据的复杂查询

原创
2017/08/08 23:03
阅读数 2.7W

使用Redis解决“树”形数据的复杂查询

最近因业务需要,研究了一下树数据结果的存储及查询解决方案。 最初的想法是使用neo4j,可是在网上看了一下开源的不支持集群,感觉用的人不多。

网上也查了一些 树形结构数据存储方案 但每种实现方案都有它的一定局限性。

想了一短时间后,想出了下面的方案:

一、 因为复杂的查询都由Redis来处理,所以数据库表的设计就变得非常简单:tree 表

字段名称 数据类型 备注说明
id int 主键
parent_id int 上级节点ID

二、Redis的数据存储方案:

把表的数据存储到一个Hash表中,使用表中的id值做为此hash表的key, value值为:

{
   id: 10,
   parentId: 9,
   childIds: [11]
}

代码实现

为了简化测试,这里只演示Redis相关的操作

  1. Tree 类定义

     public class Tree {
         private Integer id;
         private String name;
         private Integer parentId;
         private List<Integer> childIds;
     }
    
  2. 往Redis中添加测试数据:

     [@Test](https://my.oschina.net/azibug)
     public void addTestData() throws Exception {
         String key = "tree-test-key";
         Tree tree = new Tree();
         List<Integer> childIds = new ArrayList<>();
         int max = 100000
         tree.setChildIds(childIds);
         for (int i = 0; i < max; i++) {
             tree.setId(i);
             tree.setName("tree" + i);
             if (i > 0) {
                 tree.setParentId(i - 1);
             }
             childIds.clear();
             if(i < (max - 1)){
                 childIds.add(i + 1);
             }
             redis.setHash(key, "" + i, JsonUtil.toJson(tree));
         }
     }
    
  3. Lua 代码的实现

在Lua中使用递归时,需要使用“尾调用”来优化代码。关于尾调用的知识,大家可以上网去搜索。

获取所有子节点 get-tree-childs.lua

local treeKey = KEYS[1]
local fnodeId  = ARGV[1]

local function getTreeChild(currentnode, t, res)
  if currentnode == nil or t == nil  then
    return res
  end

  local nextNode = nil
  local nextType = nil
  if t == "id" and (type(currentnode) == "number" or type(currentnode) == "string") then
    local treeNode = redis.call("HGET", treeKey, currentnode)
    if treeNode then
      local node = cjson.decode(treeNode)
      table.insert(res, treeNode)
      if node and node.childIds then
        nextNode = node.childIds
        nextType = "childIds"
      end
    end
  elseif t == "childIds" then
    nextNode = {}
    nextType = "childIds"
    local treeNode  = nil
    local node = nil
    local cnt = 0
    for _, val in ipairs(currentnode) do
      treeNode = redis.call("HGET", treeKey, tostring(val))
      if treeNode then
        node = cjson.decode(treeNode)
        table.insert(res, treeNode)
        if node and node.childIds then
          for _, val2 in ipairs(node.childIds) do
            table.insert(nextNode, val2)
            cnt = cnt + 1
          end
        end
      end
    end
    if cnt == 0 then
      nextNode = nil
      nextType = nil
    end
  end
  return getTreeChild(nextNode, nextType, res)
end


if treeKey and fnodeId then
  return getTreeChild(fnodeId, "id", {})
end

return {}

获取所有子节点数目 get-tree-childs-cnt.lua

local treeKey = KEYS[1]
local fnodeId  = ARGV[1]

local function getTreeChildCnt(currentnode, t, res)
  if currentnode == nil or t == nil  then
    return res
  end

  local nextNode = nil
  local nextType = nil
  if t == "id" and (type(currentnode) == "number" or type(currentnode) == "string") then
    local treeNode = redis.call("HGET", treeKey, currentnode)
    if treeNode then
      local node = cjson.decode(treeNode)
      res = res + 1
      if node and node.childIds then
        nextNode = node.childIds
        nextType = "childIds"
      end
    end
  elseif t == "childIds" then
    nextNode = {}
    nextType = "childIds"
    local treeNode  = nil
    local cnt = 0
    for _, val in ipairs(currentnode) do
      treeNode = redis.call("HGET", treeKey, tostring(val))
      if treeNode then
        local node = cjson.decode(treeNode)
        res = res + 1
        if node and node.childIds then
          for _, val2 in ipairs(node.childIds) do
            table.insert(nextNode, val2)
            cnt = cnt + 1
          end
        end
      end
    end
    if cnt == 0 then
      nextNode = nil
      nextType = nil
    end
  end
  return getTreeChildCnt(nextNode, nextType, res)
end


if treeKey and fnodeId then
  return getTreeChildCnt(fnodeId, "id", 0)
end

return 0

获取所有子节点数目 get-tree-parent.lua

local treeKey = KEYS[1]
local nodeId  = ARGV[1]

local function getTreeParent(treeKey, res, nodeId)
  if nodeId == nil or not (type(nodeId) == "number" or type(nodeId) == "string") then
    return res
  end
  local treeNode = redis.call("HGET", treeKey, nodeId)
  local nextNodeId = nil
  if treeNode then
    local node = cjson.decode(treeNode)
    table.insert(res, treeNode)
    if node then
      nextNodeId = node.parentId
    end
  end
  return getTreeParent(treeKey, res, nextNodeId)
end


if treeKey and nodeId then
  return getTreeParent(treeKey, {}, nodeId)
end

return {}

获取所有子节点数目 get-tree-parent-cnt.lua

local treeKey = KEYS[1]
local nodeId  = ARGV[1]

local function getTreeParentCnt(treeKey, nodeId, res)
  if nodeId == nil or not (type(nodeId) == "number" or type(nodeId) == "string") then
    return res
  end
  local treeNode = redis.call("HGET", treeKey, nodeId)
  local nextNodeId = nil
  if treeNode then
    local node = cjson.decode(treeNode)
    res = res + 1
    if node then
      nextNodeId = node.parentId
    end
  end
  return getTreeParentCnt(treeKey, nextNodeId, res)
end


if treeKey and nodeId then
  return getTreeParentCnt(treeKey, nodeId, 0)
end

return 0

以上代码因为使用了“尾调用”,所以变得相对比较复杂

总结

此方案相对比较灵活,能支持相对比较大量的数据。

缺点:过于依赖Redis。数据同步会麻烦些,好在操作不是很复杂。

展开阅读全文
打赏
0
41 收藏
分享
加载中
你好,想跟你请教个问题:《使用Redis解决“树”形数据的复杂查询》这篇文章中提到使用lua,我使用这段脚本,发现性能没有hscan 和 hgetall好。如下是我的代码:

初始化:

@Test
public void shouldTreeInit() {
String key = "tree-test-key";
Tree tree = new Tree();
List<Integer> childIds = new ArrayList<>();
int max = 1000;
// tree.setChildIds(childIds);
for (int i = 1; i < max; i++) {

tree.setId(Integer.valueOf(1008611+""+i));
tree.setName("tree" + i);
// if (i > 0) {
tree.setParentId(1008611);
// }
// childIds.clear();
childIds.add(Integer.valueOf(1008611+""+i));
jedis.hset(key, "1008611" + i, JSON.toJSONString(tree));
}

Tree tree2 = new Tree();
tree2.setChildIds(childIds);
tree2.setId(1008611);
tree2.setName("tree"+1008611);
// tree2.setParentId(0);
jedis.hset(key, "1008611" , JSON.toJSONString(tree2));

}
开启slowlog为超过10微秒,打印使用脚本和使用hscan的耗时,如下:

hscan 2000多微秒 ;脚本 6000多微秒(详细https://www.oschina.net/question/3249998_2

测试机是mac pro,麻烦帮忙看下这是什么原因呢,或者你的脚本有没有生产验证可用性呢
2019/01/10 15:07
回复
举报
瞎折腾,对比和数据库性能和可用性
2018/02/04 09:33
回复
举报
用嵌套集合模型。
2017/08/20 22:26
回复
举报
没觉得有什么优化的地方
2017/08/17 09:49
回复
举报
存两套,up_{id} = {parent_id}, down_{id} = {child_id} 最底层的 child_id = 0 最上层的 parent_id = 0。 另外应该避免递归吧。
2017/08/11 10:07
回复
举报
这要是树的节点比较多,取一棵树得访问很多次redis吧
2017/08/11 10:00
回复
举报

引用来自“夜辰”的评论

我们在mysql里面用路径法存的,路径存的也有一定规律。前几天我解决了树形的问题,最后用like解决的,最后distinct一下:trollface:

科普一下
2017/08/10 19:17
回复
举报
我们在mysql里面用路径法存的,路径存的也有一定规律。前几天我解决了树形的问题,最后用like解决的,最后distinct一下:trollface:
2017/08/10 15:23
回复
举报
qiujiayu博主

引用来自“BoXuan”的评论

就不能把父节点ID作为key,value为其下的所有直接子节点ID?
不行的,这样没办法获取 父节点之上的节点。
2017/08/10 09:15
回复
举报
就不能把父节点ID作为key,value为其下的所有直接子节点ID?
2017/08/09 18:38
回复
举报
更多评论
打赏
11 评论
41 收藏
0
分享
返回顶部
顶部