MongoDB 使用记录

一、为什么使用mangodb
1、Highperformance - 对数据库高并发读写的需求
web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQL写数据请求,硬盘IO就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求。
2、HugeStorage - 对海量数据的高效率存储和访问的需求
对于大型的SNS网站,每天用户产生海量的用户动态,以国外的Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型web网站的用户登录系统,
3、HighScalability && High Availability- 对数据库的高可扩展性和高可用性的需求
4、MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。它的特点是高性能、易部署、易使用,存储数据非常方便。
MongoDB服务端可运行在Linux、Windows或OS X平台,支持32位和64位应用,默认端口为27017。推荐运行在64位平台,因为MongoDB在32位模式运行时支持的最大文件尺寸为2GB。

二、安装使用
http://dl.mongodb.org/dl/win32/i386  下载安装
http://www.mongovue.com/downloads/ mangodb客户端

输入指令E:\projectTest\MangoDB\mongodb-win32-i386-2.5.0\bin\mongod.exe 进行安装,如下图

再设置db位置,命令为E:\projectTest\MangoDB\mongodb-win32-i386-2.5.0\bin\mongod.exe-dbpath E:\projectTest\MangoDB\myDB  (文件夹路径需提前建立)
查看安装情况,命令为E:\projectTest\MangoDB\mongodb-win32-i386-2.5.0\bin\mongod.exe -dbpathE:\projectTest\MangoDB\myDB

三、注意事项

1、MongoDB分成32位版本和64位版本,由于MongoDB使用内存映射文件,所以32位版本只能存储2GB左右的数据。建议存储更多数据的用户使用64位版本。

2、MongoDB是文档型数据库,数据以BSON形式存储在文档中。最新版本的MongoDB能够支持最大16 MB的文档大小。建议用户尽量不要存储大型对象,将文档控制在16 MB以内。

3、MongoDB的写入和更新速度非常快,所以错误提示并不明确。要确保写入正确,建议用户使用getLastError或者使用安全写入。

4、关系型数据库往往会有预定义的schema,你想添加额外的列就需要在整个表上添加。MongoDB没有这个约束,这使得开发和管理变得更简单。但这并不意味着你就可以完全忽视MongoDB的schema设计,一个设计良好的schema能够让MongoDB的性能达到最佳。

5、MongoDB的更新在默认情况下会使用类似于传统数据库的LIMIT语句,即LIMIT 1。因此更新不会影响到所有的文档,如果你想要一次更新许多文档,那么请把multi设为true。

6、MongoDB默认情况下是区分大小写的,例如db.people.find({name:‘Russell‘}) 和db.people.find({name:‘russell‘})就是不一样的。所以用户需要知道MongoDB的大小写限制。

7、传统数据库中,如果插入错误的数据类型,通常会提示错误或者强制转换成预定义的数据值。MongoDB中没有这种限制,所以输入错误数据类型不会出现提示。建议用户确保输入正确的数据类型。

8、全局锁是一直被MongoDB用户诟病的特性,MongoDB2.2中增加了数据库级锁,这是一个很大的改进。建议用户使用稳定版的MongoDB2.2数据库,避免全局锁限制。

9、过期版本MongoDB用户在下载程序包时会出问题,建议用户使用10gen最新版本的官方程序包。

10、Replica Set是MongoDB中受关注最多的功能,它能为MongoDB集群增加冗余并提供良好的读性能。但由于ReplicaSet的选举机制,必须保证ReplicaSet成员数目为奇数。如果是偶数的话,主节点宕机就会导致其他节点变为只读。解决方法也可以使用一个仲裁节点(arbiter),它也是一个Replica Set的成员,但并不存储用户数据。所以请记住设置ReplicaSet成员时要定为奇数。

11、MongoDB中不存在join,你要针对多个集合进行数据检索的时候,必须使用多个查询。所以当你遇到这个问题时,可以考虑重新设计MongoDB的schema。

12、Journaling日志是MongoDB中非常好的功能,能够增强节点的可用性。在2.0版本之后,MongoDB默认是开启Journaling日志功能的。虽然Journaling日志会对数据库性能造成一定的影响,但这部分影响是可以忽略的。因此建议用户开启Journaling功能,特别是对于可用性要求较高的用户。

13、MongoDB默认情况下是没有认证功能的,因此建议用户使用防火墙对MongoDB进行保护。

14、Replica Set的工作是通过传送oplog来完成的,主节点发生故障后,新的数据将会存放在数据目录下的一个特定文件夹内,即rollback文件夹。你可以用来手动完成数据恢复。所以在每次故障发生之后,你一定要看看这个文件夹,MongoDB自带的工具就能够帮助你轻松地完成手动数据恢复。

15、跨服务器的数据拆分中,Sharding是一个有效的方法。MongoDB中支持自动化Sharding,但是对数据库性能会造成很大影响。因此建议用户尽早进行Sharding,使用MMS、Munin (+ Mongo plugin)和CloudWatch等工具对MongoDB进行监控,确保系统资源使用达到80%之前就完成Sharding工作。

16、MongoDB使用shard key来决定特定的文档在哪个分片上,当插入一个文档之后,你是无法更新shardkey的。这里建议用户删除文档并重新插入,这样就能够将其分配到合适的分片上。

17、MongoDB对分片的限制还包括集合的大小,当超过256 GB的时候,MongoDB将不允许进行分片。相信10gen公司会在未来放弃这一限制,但在此之前用户需要留意。

18、MongoDB中跨分片并没有强制要求唯一性,MongoDB只针对独立的分片进行强制而非全局性。当然除shardkey之外。

19、进行拆分的时候,MongoDB会要求你选择一个键。用户需要注意选择正确的键,否则会造成不必要的麻烦。如何进行选择并无定式,主要取决于你的应用,比如针对newsfeed使用时间戳就是错的。在下一版本中,MongoDB将对此进行改进。

20、MongoDB连接默认情况下是不加密的,也就是说你的数据是能够被第三方记录和使用的。所以你在公共网中访问MongoDB的话,就一定要进行加密。

21、MongoDB只支持单一文档的原子性,这一点与传统的数据库有所不同,如MySQL。因此MongoDB中跨多个文档是不提供内置的transaction支持的。

22、当MongoDB显示ready的时候,其实内部还在进行journal的配置。因此针对速度较慢的文件系统,MongoDB的journal配置也会很慢。

23、不建议尝试NUMA + Linux + MongoDB的组合,如果你的MongoDB跑在NUMA服务器上,建议将它关掉。

24、在Linux上运行MongoDB遭遇segfault错误时,这主要是因为openfiles / process限制过低。建议用户将限制设定为4K+。

时间: 2024-11-19 07:35:31

MongoDB 使用记录的相关文章

MongoDB使用记录

最近爬虫项目在做主题分类的时候需要将爬去规则存到MongoDB中.后台需要集成MongoDB.这里记录一下使用MongoDB的过程. Spring Data MongoDB - Reference Documentation地址: http://docs.spring.io/spring-data/data-mongodb/docs/current/reference/html/ 1.项目集成MongoDB <dependency> <groupId>org.springframe

【Mongodb教程 第十五课 】MongoDB 限制记录

Limit() 方法 要限制 MongoDB 中的记录,需要使用 limit() 方法. limit() 方法接受一个数字型的参数,这是要显示的文档数. 语法: limit() 方法的基本语法如下 >db.COLLECTION_NAME.find().limit(NUMBER) 示例 考虑集合myycol具有以下的数据 { "_id" : ObjectId(5983548781331adf45ec5), "title":"MongoDB Overvi

MongoDB学习记录一

本博客说明:最开始部分是一个运维部署案例模板,给开发安装MongoDB都可以按照这个模板来进行基本部署,中间部分是自己研究其他博客记录部署和授权相关内容,最后部分是网上视频学习相关内容:www.mongodb.org 下载地址案例安装一个完整MongoDB所做操作:1.上传解压tar -zxvf mongodb-linux-x86_64-3.0.6.tgz -C /home/cd /home && mv mongodb-linux-x86_64-3.0.6 mongodb2.创建所需目录c

mongodb操作记录

[User]1.db.addUser("name","pwd","true/false")2.db.auth("name","pwd")3.show users4.db.removeUser("name") [Collection]1:db.createCollection("name")2:db.getCollectionNames() [Document]1:db

MongoDB学习记录

一.操作符 "$lt" :"<""$lte" :"<=""$gt" :">""$gte" :">=""$ne" :"!=""$in" :查询匹配指定条件值的文档:"$nin" :查询不匹配指定条件值的文档:"$or" :或查询

MongoDB学习记录(一)

1.MongoDB简介 2.MongoDB特点 3.MongoDB功能 4.MongoDB部署 4.1 MongoDB单机部署 4.2 MongoDB主从部署 4.3 MongoDB分片部署 附录一:MongoDB工具介绍 附录二:MongoDB报错 附录三:MongoDB命令详解

mongoDB学习记录---PHP扩展的find返回值

最近的一个项目中用到了MongoDB,主要是使用MongoDB的PHP扩展.MongoDB的扩展中用于一个用于查询的方法是find().下面针对在理解MongoDB扩展的find()方法中做的实验做个简单的笔记,同时希望能够帮助别人. MongoDB的PHP扩展中,可以使用MongoColletion的find($query,$fileds)进行查询,其中find()根据$query的条件进行匹配查询,$query中说明需要返回的字段.使find()的时候,需要注意的事项是,所有待查询的变量都必

关于mongodb的mapReduce

由于nodejs本身的限制,在程序中使用js进行大批量计算效率不高.而V8引擎自身对内存大小的限制(64位系统下1.4G),同样限制了数据规模. 因此,相对于从mongodb中抽出数据进行计算,在mongodb中利用聚合函数或者其他方法完成计算,避开nodejs自身限制的方案在可靠性和扩展性上都相对较为令人满意. mongodb支持类似SQL中的聚合函数,虽然语法不通,不过基本原理类似. mongodb自带的接口中,aggregate被用来实现聚合查询: rec = db.LIBRARY.agg

MongoDB性能优化指南

一.索引 MongoDB 提供了多样性的索引支持,索引信息被保存在system.indexes 中,且默认总是为_id创建索引,它的索引使用基本和MySQL 等关系型数据库一样.其实可以这样说说,索引是凌驾于数据存储系统之上的另一层系统,所以各种结构迥异的存储都有相同或相似的索引实现及使用接口并不足为 奇. 1.基础索引 在字段age 上创建索引,1(升序);-1(降序): db.users.ensureIndex({age:1}) _id 是创建表的时候自动创建的索引,此索引是不能够删除的.当