MongoDB查询、索引和聚合

初始化mongodb数据库

> use deng
switched to db deng
> db.createCollection("jingdong")            #无參数
{"ok":1}
> show collections
jingdong
system.indexes
> userdoc1=({"user_id":1,"name":"cloud","state":"active","actor":"user","e-mail":"[email protected]","VM_num":2,"time":[{"date":"2014-08-12","hour":"10:53 PM"}] })
> userdoc2=({"user_id":2,"name":"testadmin","state":"active","actor":"admin","e-mail":"[email protected]","VM_num":2,"time":[{"date":"2014-08-11","hour":"06:34 AM"}] })
> doc=({"name":"peter","position":"teacher"})
> db.jingdong.insert(userdoc1)
WriteResult({"nInserted":1})
> db.jingdong.insert(userdoc2)
WriteResult({"nInserted":1})
> db.jingdong.insert(doc1)
WriteResult({"nInserted":1})

查询语句

db.jingdong.find() #相当于select * from jingdong；

条件操作符

mongodb中的条件操作符有：
(>) 大于 - \$gt #greate
(<) 小于 - \$lt #low
(>=) 大于等于 - \$gte #equal
(<= ) 小于等于 - \$lte

样例：

> db.jingdong.find({user_id:{$gt:1}})
> db.jingdong.find({user_id:{$lte:2,$gt:1}})

#type的值

双精度型-1
字符串-2
对象-3
数组-4
二进制数据-5
对象ID-7
布尔类型-8
数据-9
空-10
正則表達式-11
JS代码-13
符号-14
有作用域的JS代码-15
32位整型数-16
时间戳-17
64位整型数-18
Min key-255
Max key-127

db.jingdong.find({"name":{$type:2}}) #查找name是字符串的文档记录

limit和skip

读取指定数量的数据记录 limit
db.shiyanlou.find().limit(1) #读取一条记录，默认是排在最前面的那一条被读取

读取时跳过指定数量的数据记录 skip
db.shiyanlou.find().limit(1).skip(1)

MongoDB排序 -sort()

与sqlite中的排序一样有升序和降序，当中升序用1表示，降序用-1表示
db.jingdong.find().sort({"time":1})

索引 - ensureIndex()

索引通常可以极大的提高查询的效率，假设没有索引，MongoDB在读取数据时必须扫描集合中的每一个文件并选取那些符合查询条件的记录。这样的扫描全集合的查询效率是很低的，特别在处理大量的数据时。查询可以要花费几十秒甚至几分钟。无疑对站点的性能是很致命的。

索引是特殊的数据结构。索引存储在一个易于遍历读取的数据集合中。索引是对数据库集合中一个文档或多个文档的值进行排序的一种结构。

db.COLLECTION_NAME.ensureIndex({KEY:1|-1})
> db.shiyanlou.ensureIndex({"name":1}) #1代表升序 -1代表降序
> db.shiyanlou.ensureIndex({"user_id":1,"name":1},{background:1})

ensureIndex參数表格例如以下：

參数	类型	描写叙述
background	Boolean	建立索引要不要堵塞其它数据库操作，默觉得false
unique	Boolean	建立的索引是否唯一，默认false
name	string	索引的名称。若未指定。系统自己主动生成
dropDups	Boolean	建立唯一索引时。是否删除反复记录。默认flase
sparse	Boolean	对文档不存在的字段数据不启用索引。默认false
expireAfterSeconds	integer	设置集合的生存时间，单位为秒
v	index version	索引的版本
weights	document	索引权重值，范围为1到99999
default-language	string	默觉得英语
language_override	string	默认值为 language

聚合 -aggregate()

db.COLLECTION_NAME.aggregate({
$match:{x:1},
{limit:NUM},
$group:{_id:$age}
})

$match:查询。跟find一样；
$limit：限制显示结果数量；
$skip：忽略结果数量。
$sort：排序；
$group：依照给定表达式组合结果。

> db.jingdong.aggregate([{$group:{_id:"$name", user:{$sum:"$user_id"}}}])

名称	描写叙述
$sum	计算总和
$avg	计算平均值
\$min和$max	计算最小和最大值
$push	在结果文档中插入值到一个数组
$addToSet	在结果文档中插入值到一个数组，但不创建副本
$first	依据资源文档的排序获取第一个文档数据
$last	依据资源文档的排序获取最后一个文档数据

管道

MongoDB的聚合管道将MongoDB文档在一个管道处理完成后将结果传递给下一个管道处理。

管道操作是能够反复的。

表达式：处理输入文档并输出。

表达式是无状态的。仅仅能用于计算当前聚合管道的文档，不能处理其他的文档。聚合框架中经常使用的几个操作：

$project：改动输入文档的结构。能够用来重命名、添加或删除域，也能够用于创建计算结果以及嵌套文档。
$match：用于过滤数据，仅仅输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit：用来限制MongoDB聚合管道返回的文档数。
$skip：在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind：将文档中的某一个数组类型字段拆分成多条，每条包括数组中的一个值。

$group：将集合中的文档分组，可用于统计结果。
$sort：将输入文档排序后输出。
$geoNear：输出接近某一地理位置的有序文档。

> db.shiyanlou.aggregate([{$match:{user_id:{$gt:0,$lte:2}}},{$group:{_id:"user",count:{$sum:1}}}])
{"_id":"user","count":2}

时间： 2024-07-28 15:44:57

MongoDB查询、索引和聚合的相关文章

spring Mongodb查询索引报错 java.lang.NumberFormatException: empty String

笔者在mongo3.4/4.0环境下使用以下命令创建索引, db.getCollection("xxx.com").createIndex({ mobile: "" }, { name: "mobile_mac" }) 执行以下demo查询索引 mongoTemplate.indexOps(collection).getIndexInfo(); #笔者正式环境不是这么写的,这里方便大家理解,使用语法糖方式的代码 ;p 每次走到xxx.com表的时

【mongoDB查询进阶】聚合管道(二) -- 阶段操作符

https://segmentfault.com/a/1190000010826809 什么是管道操作符(Aggregation Pipeline Operators) mongoDB有4类操作符用于文档的操作,例如find查询里面会用到的$gte,$in等.操作符以$开头,分为查询操作符,更新操作符,管道操作符,查询修饰符4大类.其中管道操作符是用于聚合管道中的操作符. 管道操作符的分类管道操作符可以分为三类: 阶段操作符(Stage Operators) 表达式操作符(Expression

【mongoDB查询进阶】聚合管道(三)--表达式操作符

https://segmentfault.com/a/1190000010910985 管道操作符的分类管道操作符可以分为三类: 阶段操作符(Stage Operators) 表达式操作符(Expression Operators)--主要用于$project 累加器(Accumulators)--主要用于$group分组表达式操作符(Expression Operators) 表达式操作符主要用于在管道中构建表达式时使用,使用类似于函数那样需要参数,主要用于$project操作符中,用于构

mongoDB常见的查询索引（三）

1. _id索引 _id索引是绝大多数集合默认建立的索引对于每个插入的数据,MongoDB会自动生成一条唯一的_id字段. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 > db.jerome_2.collection.insert({x:2}) WriteResult({ "nInserted" : 1 }) > db.jerome_2.collection.getIndexes() [ { "v&quo

SQL Server之 (二) SQL语句模糊查询空值处理聚合函数

(二) SQL语句模糊查询空值处理聚合函数自己学习笔记,转载请注明出处,谢谢!---酸菜 SQL :结构化查询语言(Structured Query Language),关系数据库管理系统的标准语言. Sybase与Mircosoft对标准SQL做了扩展:T-SQL (Transact-SQL); 注:①SQL对大小写的敏感取决于排序规则,一般不敏感; ②SQL对单引号的转义,用两个单引号来表示一个单引号; ③SQL执行顺序: 1→2→3→4 select * ---------

MongoDB数据库索引

前面的话索引通常能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录.这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非常致命的.本文将详细介绍MongoDB数据库索引引入索引能够提高查询效率,如何体现呢?接下来使用性能分析函数explain()来进行分析说明首先,插入10万条数据接着,不创建索引,来寻找time范围在100和200之间的文档由图中所知,tot

mongodb的索引问题

索引的定义和原理数据库的索引,是一种将数据库中的特定数据进行排序化的数据结构,用以提高数据库的查询和变更效率.索引的实现通常使用B树或B+树. 比如,当前有一个表有100w条数据,表结构为如下 create table person ( name char(15) not null, age int not null, city varchar(20) not null, primary key(name) ) 主键是用户的name.假设用户居住的城市有限(比如100个),现在,如果要查询在c

Mongodb的索引

1. 简单介绍索引是为了加速查询. 假设没有索引,mongodb在查询时会做表扫描,假设集合非常大时,这个查询会非常慢. 一般对创建查询时的键都建立索引. 为排序字段建立索引,假设对未建立索引的字段sort,mongodb会将全部的数据取到内存中来排序, 假设集合大到不能在内存中排序,则mongodb会报错. 2. mongodb创建索引创建索引使用ensureIndex命令. > db.people.ensureIndex({"username" : 1}); 上面语句对p

【MongoDB学习笔记20】MongoDB的索引

MongoDB的索引和关系型数据库的索引概念和功能是相同的: (1)不使用索引的搜索可以称为全表扫面,也就是说,服务器必须找完整个表才能查询整个结果: (2)建立索引后搜索,查询在索引中搜索,在索引的条目中找到条目以后,就可以直接跳转到目标文档的位置:这样的搜索比全表的搜索的速度要提高好几个数量级: 先向集合blog中添加1000000个文档: > for (i=0;i<1000000;i++){ ... db.users.insert( ... {"i":i

MongoDB中索引的创建和使用详解

索引通常能够极大的提高查询的效率.在系统中使用查询时,应该考虑建立相关的索引.在MongoDB中创建索引相对比较容易. mongodb中的索引在概念上和大多数关系型数据库如MySQL是一样的.当你在某种情况下需要在MySQL中建立索引,这样的情景同样适合于MongoDB. 基本操作索引是一种数据结构,他搜集一个集合中文档特定字段的值.MongoDB的查询优化器能够使用这种数据结构来快速的对集合(collection)中的文档(collection)进行寻找和排序.准确来说,这些索引是通过B-T