文档章节

Mongodb 索引

橙子666
 橙子666
发布于 2017/07/27 18:56
字数 1382
阅读 6
收藏 0

一、索引基础:


    MongoDB的索引几乎与传统的关系型数据库一模一样,这其中也包括一些基本的优化技巧。下面是创建索引的命令:

> db.test.ensureIndex({"username":1})

    可以通过下面的名称查看索引是否已经成功建立

> db.test.getIndexes()

    删除索引的命令是:

> db.test.dropIndex({"username":1})

    在MongoDB中,我们同样可以创建复合索引,如:
    -- 数字1表示username键的索引按升序存储,-1表示age键的索引按照降序方式存储。

> db.test.ensureIndex({"username":1, "age":-1})

    该索引被创建后,基于username和age的查询将会用到该索引,或者是基于username的查询也会用到该索引,但是只是基于age的查询将不会用到该复合索引。因此可以说,如果想用到复合索引,必须在查询条件中包含复合索引中的前N个索引列。然而如果查询条件中的键值顺序和复合索引中的创建顺序不一致的话,MongoDB可以智能的帮助我们调整该顺序,以便使复合索引可以为查询所用。如:

> db.test.find({"age": 30, "username": "stephen"})


    对于上面示例中的查询条件,MongoDB在检索之前将会动态的调整查询条件文档的顺序,以使该查询可以用到刚刚创建的复合索引。
    我们可以为内嵌文档创建索引,其规则和普通文档没有任何差别,如:

> db.test.ensureIndex({"comments.date":1})


    对于上面创建的索引,MongoDB都会根据索引的keyname和索引方向为新创建的索引自动分配一个索引名,下面的命令可以在创建索引时为其指定索引名,如:

> db.test.ensureIndex({"username":1},{"name":"testindex"})   

 
    随着集合的增长,需要针对查询中大量的排序做索引。如果没有对索引的键调用sort,MongoDB需要将所有数据提取到内存并排序。因此在做无索引排序时,如果数据量过大以致无法在内存中进行排序,此时MongoDB将会报错。

 

二、唯一索引:


    在缺省情况下创建的索引均不是唯一索引。下面的示例将创建唯一索引,如:

> db.test.ensureIndex({"userid":1},{"unique":true})


    如果再次插入userid重复的文档时,MongoDB将报错,以提示插入重复键,如:

> db.test.insert({"userid":5})
> db.test.insert({"userid":5})
E11000 duplicate key error index: test.test.$userid_1  dup key: { : 5.0 }   

 
    如果插入的文档中不包含userid键,那么该文档中该键的值为null,如果多次插入类似的文档,MongoDB将会报出同样的错误,如:

> db.test.insert({"userid1":5})
> db.test.insert({"userid1":5})
E11000 duplicate key error index: test.test.$userid_1  dup key: { : null }    

    
    如果在创建唯一索引时已经存在了重复项,我们可以通过下面的命令帮助我们在创建唯一索引时消除重复文档,仅保留发现的第一个文档,如:
    --先删除刚刚创建的唯一索引。

> db.test.dropIndex({"userid":1}) 


    --插入测试数据,以保证集合中有重复键存在。

> db.test.remove()
> db.test.insert({"userid":5})
> db.test.insert({"userid":5})  

 
    --创建唯一索引,并消除重复数据。

> db.test.ensureIndex({"userid":1},{"unique":true,"dropDups":true})

    
    --查询结果确认,重复的键确实在创建索引时已经被删除。 

> db.test.find()

{ "_id" : ObjectId("4fe823c180144abd15acd52e"), "userid" : 5 }   


    我们同样可以创建复合唯一索引,即保证复合键值唯一即可。如:

> db.test.ensureIndex({"userid":1,"age":1},{"unique":true}) 

 


三、使用explain:


    explain是非常有用的工具,会帮助你获得查询方面诸多有用的信息。只要对游标调用该方法,就可以得到查询细节。explain会返回一个文档,而不是游标本身。如:

> db.test.find().explain()
    {
        "cursor" : "BasicCursor",
        "nscanned" : 1,
        "nscannedObjects" : 1,
        "n" : 1,
        "millis" : 0,
        "nYields" : 0,
        "nChunkSkips" : 0,
        "isMultiKey" : false,
        "indexOnly" : false,
        "indexBounds" : {

        }    
    }


    explain会返回查询使用的索引情况,耗时和扫描文档数的统计信息。
    "cursor":"BasicCursor"表示没有使用索引。
    "nscanned":1 表示查询了多少个文档。
    "n":1 表示返回的文档数量。
    "millis":0 表示整个查询的耗时。
   


四、索引管理:


    system.indexes集合中包含了每个索引的详细信息,因此可以通过下面的命令查询已经存在的索引,如:

> db.system.indexes.find()


    如果在为已有数据的文档创建索引时,可以执行下面的命令,以使MongoDB在后台创建索引,这样的创建时就不会阻塞其他操作。但是相比而言,以阻塞方式创建索引,会使整个创建过程效率更高,但是在创建时MongoDB将无法接收其他的操作。

> db.test.ensureIndex({"username":1},{"background":true})

 

五、spring data mongodb index索引实践 

在spring data mongodb中创建索引也是非常方便的。

直接在对应的实体类中用注解标识即可。

要给某个字段加索引就在字段上面加上@Indexed注解,里面可以填写对应的参数

像唯一索引的参数就是unique=true,以后台方式创建索引的参数是background=true。

然后是组合索引的创建,是要在类的上面定义@CompoundIndexes注解,参数是@CompoundIndex注解数组,可以传多个。

name表示索引的名称,def表示组合索引的字段和索引存储升序(1)或者降序(-1)。

@Document
@CompoundIndexes({
    @CompoundIndex(name = "city_region_idx", def = "{'city': 1, 'region': 1}")
})
public class Person {
    private String id;

    @Indexed(unique=true)
    private String name;

    @Indexed(background=true)
    private int age;

    private String city;

    private String region;
}

也可以直接用代码查看索引信息

mongoTemplate.getCollection("person").getIndexInfo().forEach( index -> {
    System.out.println(index);
});

 

本文转载自:http://www.cnblogs.com/stephen-liu74/archive/2012/08/01/2561557.html

共有 人打赏支持
上一篇: 消息中间件
下一篇: Mongodb 基础
橙子666
粉丝 1
博文 72
码字总数 46552
作品 0
杭州
程序员
私信 提问

暂无文章

Ugly Number(leetcode263)

Write a program to check whether a given number is an ugly number. Ugly numbers are positive numbers whose prime factors only include 2, 3, 5. Example 1: Input: 6Output: true......

woshixin
11分钟前
0
0
深度模型从研者 眼里的 似然估计 & Hessain 海森矩阵 & Fisher Information (费雪信息)

深度模型的训练的基本依据是最小化模型拟合数据的误差。旨在不仅知其然(如何构建和训练一个深度模型),还应知其所以然(为什么这样训练,可以做哪些优化)。我们就会发现,有很多研究者,在...

刘小米_思聪
16分钟前
0
0
阿里巴巴智能监控新场景的探索

摘要: 智能监控是智能运维的子领域,详细分析。 作者简介 王肇刚 阿里巴巴全球运行指挥中心高级技术专家 智能监控是智能运维的子领域,我们说的监控,探讨的更多是在监控策略,因为可能从数...

阿里云官方博客
18分钟前
1
0
【双十二】12 月 12 日 12 点 12 分限量抢福利,云计算不剁手!

活动详情 1.首充豪礼 双十二当日,新用户首充 200 元送 200 元代金券!仅限前 88 名!先到先得!拼手速!(新用户指 12 月 12 日前已完成注册但从未充值过的用户)
 2.超值返券 双十二当日,...

七牛云
44分钟前
3
0
Calculate Linux 发布 18 LXQt是基于Gentoo的发行版

导读 Calculate Linux 是一个基于 Gentoo 并与 Gentoo 完全兼容的滚动更新发行版家族,专为企业环境下的快速部署而优化。其提供多个不同的分支版本,分别适用于桌面、服务器等应用场景。该项...

问题终结者
46分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部