MongoDB索引的种类与使用

一:索引的种类

1:_id索引:是绝大多数集合默认建立的索引,对于每个插入的数据,MongoDB都会自动生成一条唯一的_id字段
2:单键索引

1.单键索引是最普通的索引
2.与_id索引不同,单键索引不会自动创建 如:一条记录,形式为:{x:1,y:2,z:3}
db.imooc_2.getIndexes()//查看索引
db.imooc_2.ensureIndex({x:1})//创建索引,索引可以重复创建,若创建已经存在的索引,则会直接返回成功。
db.imooc_2.find()//查看数据

3:多键索引
多键索引与单键索引创建形式相同,区别在于字段的值。
1)单键索引:值为一个单一的值,如字符串,数字或日期。
2)多键索引:值具有多个记录,如数组。

db.imooc_2.insert({x:[1,2,3,4,5]})//插入一条数组数据

4:复合索引:查询多个条件时,建立复合索引
例如{x:1,y:2,z:3}这样一条数据,要按照x与y的值进行查询,就需要创建复合索引。

db.imooc_2.ensureIndex({x:1,y:1}) #1升序,-1降序
db.imooc_2.find({x:1,y:2}) #使用复合索引查询

5:过期索引
在一段时间后会过期的索引
在索引过期后,相应的数据会被删除
适合存储在一段时间之后会失效的数据,比如用户的登录信息、存储的日志等。
db.imooc_2.ensureIndex({time:1},{expireAfterSeconds:10}) #创建过期索引,time-字段,expireAfterSeconds在多少秒后过期,单位:秒

db.imooc_2.ensureIndex({time:1},{expireAfterSeconds:30}) #time索引30秒后失效
db.imooc_2.insert({time:new Date()}) #new Date()自动获取当前时间,ISODate
db.imooc_2.find() #可看到刚才insert的值

过30秒后再find,刚才的数据就已经不存在了。

过期索引的限制:
1.存储在过期索引字段的值必须是指定的时间类型,必须是ISODate或者ISODate数组,不能使用时间戳,否则不能自动删除。
例如 >db.imooc_2.insert({time:1}),这种是不能被自动删除的
2.如果指定了ISODate数组,则按照最小的时间进行删除。
3.过期索引不能是复合索引。因为不能指定两个过期时间。
4.删除时间是不精确的。删除过程是由MongoDB的后台进程每60s跑一次的,而且删除也需要一定时间,所以存在误差

6:全文索引:对字符串与字符串数组创建全文课搜索的索引
不适用全文索引:查找困难,效率低下,需要正则匹配,逐条扫描。
使用全文索引:简单查询即可查询需要的结果

创建方式

db.articles.ensureIndex({key:"text"}) #key-字段名,value-固定字符串text
上述指令表示,在articles这个集合的key字段上创建了一个全文索引

db.articles.ensureIndex({key1:"text",key2:"text"}) #在多个字段上创建全文索引

对于nosql数据库,每个记录存储的key可能都是不同的,如果要在所有的key上建立全文索引,一个一个写很麻烦,mongodb可以通过下面指令完成:
db.articles.ensureIndex({"$**":"text"}) #给所有字段建立全文索引

全文索引的创建:
1:可以为一个字段创建全文索引
2:可以为多个字段创建全文索引
3:可以为集合中所有的字段创建全文索引
注意:上面三种创建全文索引的方式,前两个方式类似,第三个需要一个特殊的字符串来表示——”$**”,我想如果集合中就两三个字段,也可以使用2来创建这样的全文索引,如果这个集合总就一个字段使用1也是可以的,3仅仅是为了统一化而已。

全文索引的查找:
1:使用全文索引查询不需要指定全文索引的字段名字——直接使用$text,$search即可
2:在MongoDB中每个数据集合只允许创建一个全文索引,不过这个全文索引可以针对一个、多个、全部的数据集合的字段来创建。
3:查询多个关键词,可以使用空格将多个关键词分开——空格——或的关系
4:指定不包含的字段使用-来表示—— -:非的关系
5:引号包括起来代表与的关系—— \”\”:与的关系

db.articles.find({$text:{$search:"coffee"}})
db.articles.find({$text:{$search:"aa bb cc"}}) #空格代表或操作,aa或bb或cc
db.articles.find({$text:{$search:"aa bb -cc"}}) #-号为非操作,即不包含cc的
db.articles.find({$text:{$search: "\"aa\" \"bb\" \"cc\""}}) #加双引号可以提供与关系操作

相似度查询:

搜索排序,查询结果与你查询条件越相关的越排在前面。
MongoDB中可以使用$meta操作符完成,格式:

{score:{$meta: "textScore"}}

在全文搜索的格式中加入这样一个条件,如下:

db.imooc_2.find({$text:{$search:"aa bb"}},{score:{$meta:"textScore"}})

搜索出的结果会多出一个score字段,这个得分越高,相关度越高。
还可以对查询出的结果根据得分进行排序:

db.imooc_2.find({$text:{$search:"aa bb"}},{score:{$meta:"textScore"}}).sort({score:{$meta:"textScore"}})

加上.sort方法即可。

全局索引的限制:
1.每次查询,只能指定一个$text查询
2.$text查询不能出现在$nor查询中
3. 查询中如果包含了$text, hint不再起作用(强制指定索引hint)
4. MongoDB全文索引还不支持中文

7:地理位置索引
将一些点的位置存储在MongoDB中,创建索引后,可以按照位置来查找其他点。

地理位置索引分为两类:
1.2D索引,用于存储和查找平面上的点。
2.2Dsphere索引,用于存储和查找球面上的点。
例如:
查找距离某个点一定距离内的点。
查找包含在某区域内的点。

分为2种:2D平面地理位置索引 和 2D sphere 2D球面地里位置索引 2者的区别在于计算距离时使用的计算方式不同(平面距离还是球面距离)

2D地理位置索引创建方式

db.collection.ensureIndex({w:”2d”})

2D地理位置索引的取值范围以及表示方法 经纬度[经度,纬度]
经纬度取值范围 经度[-180,180] 纬度[-90,90]

db.collection.insert({w:[180,90]})

2D地理位置查询有2种
1.使用$near 查询距离某个点最近的点 ,默认返回最近的100个点

db.collection.find({w:{$near:[x,y]}})

可以使用$maxDistance:x 限制返回的最远距离

db.collection.find({w:{$near:[x,y],$maxDistance:z}})

2.使用$geoWithin 查询某个形状内的点
形状的表示方式:

1. $box 矩形,使用{$box:[[x1,y1],[x2,y2]]}
2. $center 圆形,使用 {$center:[[x,y],r]}
3. $polygon 多边形,使用 {$polygon:[[x1,y1],[x2,y2],[x3,y3]]}

mongodb geoWithin 查询

查询矩形中的点
db.collection.find({w:{$geoWithin:{$box:[[0,0],[3,3]]}}})
查询圆中的点
db.collection.find({w:{$geoWithin:{$center:[[0,0],5]}}})
查询多边形中的点
db.collection.find({w:{$geoWithin:{$polygon:[[0,0],[0,1],[2,5],[6,1]]}}})

mongodb geoNear 查询

geoNear 使用 runCommand命令操作
db.runCommand({
geoNear:"collection名称",
near:[x, y],
minDistance:10(对2d索引无效,对2Dsphere有效‘)
maxDistance:10
num:1 返回数量
})

可返回最大距离和平均距离等数据.

返回的数据:
results:查询到的数据;dis:距离,obj:数据记录
stats:查询参数,maxDistance最大距离和avgDistance平均距离
ok:1,查询成功

mongodb 2Dsphere索引详解

2Dsphere index create method
use command:

db.collection.ensureindex({key: ‘2dsphere‘})

2Dsphere位置表示方式:
GeoJSON:描述一个点,一条直线,多边形等形状。
格式:

{type:‘‘, coordinates:[list]}

GeoJSON查询可支持多边形交叉点等,支持MaxDistance 和 MinDistance

索引属性

创建索引的格式:

db.collection.ensureIndex({indexValue},{indexProperty})

其中:indexProperty比较重要的有
1:名字

db.collection.ensureIndex({indexValue},{name:})

MongoDB会自动的创建,规则是key_1 或者 key_-1 1或者-1代表排序方向,一般影响不大,长度一般有限制125字节
为了见名知意我们可以自己来命名

自定义索引名称方式:

db.imooc_2.ensureIndex({x:1,y:1,z:1,m:1},{name:"normal_index"})

删除索引

db.imooc_dropIndex(indexName)

删除索引时,可以通过我们定义的名字来删除索引

db.imooc_2.dropIndex("normal_index")

2:唯一性:不允许在同一个集合上插入具有同一唯一性的数据。

db.imooc_2.ensureIndex({x:1,y:1,z:1,m:1},{unigue:true)

3:稀疏性

db.collection.ensureIndex({},{sparse:true/false}) #指定索引是否稀疏

MongoDB索引默认是不稀疏的。
稀疏性的不同代表了MongoDB在处理索引中存在但是文档中不存在的字段的两种不同的方法。
例如,我们为一个collection的x字段指定了索引,但这个collection中可以插入如{y:1,z:1}这种不存在x字段的数据,
如果索引为不稀疏的,mongodb依然会为这个数据创建索引,如果在创建索引时指定为稀疏索引,那么就可以避免这件事情发生了。

db.imooc_2.insert({"m":1})
db.imooc_2.insert({"n":1})

通过$exists可以判断字段是否存在,如

db.imooc_2.find({m:{$exists:true}}) #筛选出有m字段的文档

给这个文档的m字段创建一个稀疏索引:

db.imooc_2.ensureIndex({m:1},{sparse:true})

第二条文档不存在m字段,所以不会创建这个索引
如果使用稀疏索引查找不存在稀疏索引字段的文档,mongodb则不会使用这个索引查找
例如:

db.imooc_2.find({m:{$exists:false}}) #可以查到数据

但如果我们通过hint强制使用索引,就不会查到数据了

db.imooc_2.find({m:{$exists:false}}).hint("m_1") #查不出数据,因为n上并没有m字段的索引

4:是否定时删除(过期索引TTL)

--------------------- 本文来自 DoNotStop 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/u013725455/article/details/52037897?utm_source=copy

原文地址:https://www.cnblogs.com/andy6/p/9705414.html

时间: 2024-10-12 15:24:24

MongoDB索引的种类与使用的相关文章

MongoDB 索引的使用, 管理 和优化

MongoDB 索引的使用, 管理 和优化 2014-03-25 17:12 6479人阅读 评论(0) 收藏 举报  分类: MongoDB(9)  [使用explain和hint] 前面讲高级查询选项时,提到过"$explain" 和 ”$hint“可以作为包装查询的选项关键字使用,其实这两个本身就可以作为操作游标的函数调用!游标调用explain函数会返回一个文档,用于描述当前查询的一些细节信息.这也不同于我们前面介绍的游标函数,前面提到的游标处理函数都是返回游标,可组成方法链调

菜鸟的mongoDB学习---(六)MongoDB 索引

MongoDB 索引 ps:大概有半个月木有更新了,因为前一阶段的出差和这几天突然来的项目.导致上网时间急剧降低,实在是sorry,以后预计会好一点. 索引通常可以极大的提高查询的效率.假设没有索引.MongoDB在读取数据时必须扫描集合中的每一个文件并选取那些符合查询条件的记录. 这样的扫描全集合的查询效率是很低的,特别在处理大量的数据时,查询能够要花费几十秒甚至几分钟,这对站点的性能是很致命的. 索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中.索引是对数据库表中一列或多列的值进

Atitit.数据索引 的种类以及原理实现机制 索引常用的存储结构

1. 索引的分类1 1.1. 按照存储结构划分btree,hash,bitmap,fulltext1 1.2. 索引的类型  按查找方式分,两种,分块索引 vs编号索引1 1.3. 顺序索引  vs 散列索引2 1.4. 按索引与数据的查找顺序可分为 正排与倒排索引2 1.5. 单列索引与多列索引 复合索引2 1.6. 分区索引和全局索引 2 1.7.  Trie树一般指字典树 又称单词查找树,Trie树2 1.8. 稠密索引 vs 稀疏索引3 1.9. 多级索引 vs 单击索引3 1.10.

Atitit.数据索引 的种类以及原理实现机制 索引常用的存储结构

Atitit.数据索引 的种类以及原理实现机制 索引常用的存储结构 1. 索引的分类1 1.1. 索引的类型  按查找方式分,两种,分块索引 vs编号索引1 1.2. 按索引与数据的查找顺序可分为 正排与倒排索引1 1.3. 单列索引与多列索引2 1.4. 分区索引和全局索引 2 2. 索引建立,更新的流程使用触发更新索引的事件2 3. 索引常用的存储结构 B树文件 叫做“索引顺序存取方法”(Indexed Sequential Access Method),缩写为ISAM.2 4.  Trie

MongoDB(索引及C#如何操作MongoDB)(转载)

MongoDB(索引及C如何操作MongoDB) 索引总概况 db.test.ensureIndex({"username":1})//创建索引 db.test.ensureIndex({"username":1, "age":-1})//创建复合索引 数字1表示username键的索引按升序存储,-1表示age键的索引按照降序方式存储. // 该索引被创建后,基于username和age的查询将会用到该索引,或者是基于username的查询也会

MongoDB索引管理

虽然MongoDB的索引在存储结构上都是一样的,但是根据不同的应用层需求,还是分成了唯一索引(unique).稀疏索引(sparse).多值索引(multikey)等几种类型. 唯一索引 唯一索引在创建时加上 unique:true 的选项即可,创建命令如下: db.users.ensureIndex({username: 1}, {unique: true}) 上面的唯一索引创建后,如果insert一条username已经存在的数据,则会报如下的错误: E11000 duplicate key

MongoDB索引文件破坏后导致查询错误的问题

问题描述: MongoDB在非正常情况下关闭时,可能会导致索引文件破坏,造成数据在更新时没有反映到索引上. 解决方案: 使用脚本,重建MongoDB所有表的索引. var names  = db.getCollectionNames(); for( var i in names ){     var name = names[i];     print(name);          var coll = db.getCollection(name);     coll.reIndex(); }

MongoDB · 引擎特性 · MongoDB索引原理

MongoDB · 引擎特性 · MongoDB索引原理数据库内核月报原文链接 http://mysql.taobao.org/monthly/2018/09/06/ 为什么需要索引?当你抱怨MongoDB集合查询效率低的时候,可能你就需要考虑使用索引了,为了方便后续介绍,先科普下MongoDB里的索引机制(同样适用于其他的数据库比如mysql). mongo-9552:PRIMARY> db.person.find(){ "_id" : ObjectId("571b5

005.MongoDB索引及聚合

一 MongoDB 索引 索引通常能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录. 这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非常致命的. 索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构. 1.1 createIndex() 方法 MongoDB使用 createIndex() 方法来创建索引.