mongodb固定集合(Capped Collection)和大文件管理(GridFS)
Capped Collection
固定集合(Capped Collection)是性能出色的有着固定大小的集合,以LRU(Least Recently Used最近最少使用)规则和插入顺序进行age-out(老化移出)处理,自动维护集合中对象的插入顺序,在创建时要预先制定大小,如果空间用完,新添 加的对象将会取代集合中最旧的对象,永远保持最新的数据。
查看集合的状态信息
db.cot1.stats(); //查看集合cot1的状态信息
删掉指定集合
db.collection1.drop(); //删除collection1集合
mongoDB中集合创建默认是隐式创建的,可以使用createCollection显示创建集合
db.createCollection("collect");
删掉指定数据库
db.dropDatabase(); //删除当前数据库
查询所有数据库
show dbs //查询所有数据库
显示当前库中所有集合
show tables; 或者 show collections;
固定集合的功能特点
可以插入及更新,但更新不能超出collection的大小,否则更新失败,不允许删除,但是可以调用drop()删除集合中的所有行,但是drop后需
要显式地重建集合.在32位机子上一个cappped collection的最大值约为482.5M,64位上只受系统文件大小的限制.
固定集合属性及用法:
属性1:对固定集合进行插入速度极快
属性2:按照插入顺序的查询输出速度极快
属性3:能够在插入最新数据时,淘汰最早的数据
用法1:储存日志信息
用法2:缓存一些少量的文档
创建固定集合
不像普通集合,固定集合需要显示的创建使用createCollection命令
eg. db.createCollection("collect",{capped:true, size:10000});
创建一个集合为collect的固定集合,大小为10000字节,还可以指定文档个数,加上Max:100属性.
注意:指定文档上限,必须指定大小,文档限制是在容量没满时进行淘汰,要是满了,就根据容量限制来进行淘汰.
可以再创建capped
collection时指定collection中能够存放的最大文档数目,但这是要指定size,因为总是先检查size后检查
maxRowNumber.可以使用validate()查看一个collection已经使用了多少空间,从而决定size设为多大.
> db.createCollection("mycappedcoll",{capped:true,size:10000,max:100})
{ "ok" : 1 }
> db.mycappedcoll.validate();
创建collection时还有一个参数”autoIndexID”,值可以为”true”和”false”,决定是否需要在”_id”上创建索引,例如
> db.createCollection("mycappedcoll",{capped:true,size:10000,max:100,autoIndexId:false})
默认情况下对一般的collection是创建索引的,但不会对capped collection创建.capped collection不能被Shard,这也是有道理的,一个经常被刷新且大小固定的表,做Sharding(分片)也没太大意义.
www.2cto.com
转换集合
把普通的集合转换成固定集合需要使用convertTocapped命令
db.runCommand( { convertTocapped:"test",size:10000 } );
把test普遍集合转换为固定集合,大小为10000字节.
自然排序
固定集合文档按照插入顺序储存的,默认情况下查询就是按照插入顺序返回的,也可以使用$natural调整返回顺序.
db.mycappedcolt.find().sort( {"$natural":1} );
参数1表示默认顺序,-1则相反.
判断集合是否为固定集合
db.colt.isCapped();
查看集合状态信息
db.colt.stats();
GridFS
GridFS是一种在MongoDB中存储大二进制文件的机制,使用GridFS原因有以下几种:
储存巨大的文件,比如视频、高清图片等.利用GridFS可以简化需求.
GridFS会直接利用已经建立的复制或分片机制,故障恢复和扩展都很容易.
GridFS可以避免用户上传内容的文件系统出现问题.
GridFS不产生磁盘碎片
www.2cto.com
GridFS存储数据
GrdiFS使用两个表来存储数据:
files 包含元数据对象
chunks 包含其他一些相关信息的二进制块.
为了使多个GridFS命名为一个单一的数据库,文件和块都有一个前缀,默认情况下,前缀是fs,所以任何默认的GridFS存储将包括命名空间fs.files和fs.chunks。
各种第三方语言可以更改其前缀
使用GridFS mongofiles
mongofiles是从命令行操作GridFS的一种工具
四个命令:put(存储)、get(取得/下载)、list(列表)、delete(删除)
eg. ./mongofiles put testfile.zip
./mongofiles list
./mongofiles get testfile.zip
./mongofiles delete testfile.zip
验证md5
mg5sum testfiles.zip
此时登录mongo,show tables可以看到新增2个文件fs.files和fs.chunks.
查看fs.files中的内容 www.2cto.com
db.fs.files.find();
fs.files 中存储的是一些基础的元数据信息.
db.fs.chunks.find();
fs.chunks 中存储的是一些实际的内容数据信息.