mongodb清理collection中大量数据的2种办法

1 shell中for循环清理

每次去连接一下mongo, 进行数据的remove操作

echo "Begin ..." >> /root/time.log;
echo $(date +%Y-%m-%d-%H:%M:%S) >>/root/time.log;

for((i=1;i<=100000000;i++));
do
        objectid=`/usr/local/mongodb/bin/mongo 127.0.0.1:37017/test -uadmin -padmin --quiet --eval "printjson(db.tickets.findOne({"date":{\\$lt:ISODate(\"2013-01-10T01
:16:33.303Z\")}},{"_id":1}))"`;
         /usr/local/mongodb/bin/mongo 127.0.0.1:37017/test -uadmin -padmin --quiet --eval "db.tickets.remove($objectid)";
         echo " done " $objectid "  " >> /root/tickets.log
done
echo $(date +%Y-%m-%d-%H:%M:%S) >>/root/time.log;
echo "End ..." >> /root/time.log;
echo " " >> /root/time.log

2 mongo shell中 for循环 清理

只连接一次mongo, 在mongo shell中for循环清理

[[email protected] ~]# more t.sh

echo "Begin ..." >> /root/t.log;
echo $(date +%Y-%m-%d-%H:%M:%S) >>/root/t.log;

/usr/local/mongodb/bin/mongo 127.0.0.1:37017/test -uadmin -padmin t.js;

echo $(date +%Y-%m-%d-%H:%M:%S) >>/root/t.log;
echo "End ..." >> /root/t.log;
echo " " >> /root/t.log
[[email protected] ~]#
[[email protected] ~]#
[[email protected] ~]# more t.js
for( var i=1 ; i<=100000000; i++ ) {
        var objectid = db.tickets.findOne({date:{$lt:ISODate("2013-01-10T01:16:33.303Z")}},{_id:1});
        db.tickets.remove(objectid);
}

[[email protected] ~]#

实际测试, 第一种安全保险的多,但是毕竟慢,清理100G的数据 大概要3天 ,第二种快捷的多(据说有风险,但是我测试没有碰到过),清理100G的数据,用了6个小时.

时间: 2024-10-05 04:58:38

mongodb清理collection中大量数据的2种办法的相关文章

MySQL中删除数据的两种方法

转自:http://blog.csdn.net/apache6/article/details/2778878 在MySQL中有两种方法可以删除数据,一种是DELETE语句,另一种是TRUNCATE TABLE语句. DELETE语句可以通过WHERE对要删除的记录进行选择.而使用TRUNCATE TABLE将删除表中的所有记录.因此,DELETE语句更灵活. 如果要清空表中的所有记录,可以使用下面的两种方法: DELETE FROM table1 TRUNCATE TABLE table1 其

关于iOS去除数组中重复数据的几种方法

关于iOS去除数组中重复数据的几种方法 在工作工程中我们不必要会遇到,在数组中有重复数据的时候,如何去除重复的数据呢? 第一种:利用NSDictionary的AllKeys(AllValues)方法 可以将NSArray中的元素存入一个字典,然后利用AllKeys或者AllValues取得字典的所有键或值,这些键或值都是去重的.代码: NSArray *dataArray = @[@"2014-04-01",@"2014-04-02",@"2014-04-

MFC中关闭窗口的几种办法+MFC中MessageBox的用法

MFC中关闭窗口的几种办法: 退出程序用AfxGetMainWnd()->SendMessage(WM_CLOSE); 关闭当前窗口用DestroyWindow( ); 关闭模式对话框用EndDialog(0); MFC中MessageBox的用法 消息框是个很常用的控件,属性比较多,本文列出了它的一些常用方法,及指出了它的一些应用场合.1.MessageBox("这是一个最简单的消息框!");2.MessageBox("这是一个有标题的消息框!","

使用Django来清理数据库中的数据

数据库中的数据清理 问题描述:在我所使用的系统中,由于历史和各种原因,导致数据库中表里面记录的数据,是有问题的,有重复的和不完整的数据 解决方案:首先,由于这些数据的量还是挺大的,手工的清理肯定不行, 然后,我就想写SQL脚本来按照约定的规则进行更新,可以利用游标 来完成表中的记录的遍历,但是SQL是面向结构化的查询语言,不是面向过程的,所以虽然可以但是没有C和python这样的面向过程的使用方便, 后来,我想直接在我的项目中新建一个方法,然后通过浏览器的地址栏来调用,就可以了. PS:虽然说D

从列表中提取数据的两种方法

从列表中提取数据除了循环外还有两种方法:过滤,列表解析式: #!/usr/bin/env python #coding:utf-8 #@Author:Andy # 生成一个随机列表:并选出其中的两大于零的数 from random import randint data = [randint(-10, 10) for i in range(1, 10)] print(data) # method 1 print("filter method:", list(filter(lambda

读取硬盘上被覆盖数据的两种办法

文件管理的真谛在于方便保存和迅速提取,所有的文件将通过文件夹分类被很好地组织起来,放在你最能方便找到的地方.解决这个问题目前最理想的方法就是分类管理,从硬盘分区开始到每一个文件夹的建立,我们都要按照自己的工作和生活需要,分为大大小小.多个层级的文件夹,建立合理的文件保存架构. 此外所有的文件.文件夹,都要规范化地命名,并放入最合适的文件夹中.这样,当我们需要什么文件时,就知道到哪里去寻找.这种方法,对于相当数量的人来说,并不是一件轻松的事,因为他们习惯了随手存放文件和辛苦.茫无头绪地查找文件.下

使用Django清理数据库中的数据

数据库,数据清洗 问题叙述性说明:在系统我用在,因为历史和由于各种原因,原因记录的数据内的数据库表,有一个问题,有反复和不完整的数据 解:首先.由于数据量还是挺大的,工的清理肯定不行, 然后,我就想写SQL脚本来依照约定的规则进行更新,能够利用游标 来完毕表中的记录的遍历,可是SQL是面向结构化的查询语言,不是面向过程的.所以尽管能够可是没有C和python这种面向过程的使用方便, 后来.我想直接在我的项目中新建一个方法.然后通过浏览器的地址栏来调用.就能够了. PS:尽管说Django的orm

SQL Server中迁移数据的几种方法

1.通过工具"DTS"的设计器进行导入或者导出 DTS的设计器功能强大,支持多任务,也是可视化界面,容易操作,但知道的人一般不 多,如果只是进行SQL Server数据库中部分表的移动,用这种方法最好,当然,也可以进行全部表的移动.在SQL Server Enterprise Manager中,展开服务器左边的+,选择数据库,右击,选择All tasks/Import Data...(或All tasks/Export Data...),进入向导模式,按提示一步一步走就行了,里面分得很

关于MySQL中添加数据的两种方法

下面介绍两种执行SQL命令的方法,并作出相应地总结,第一种介绍一种常规用法,下面进行做简要地分析,首先我们需要执行打开数据库操作首先创建一个MySqlConnection对象,在其构造函数中传入一个连接字符串,然后执行Open操作打开数据库,在正确打开数据库之后我们才能进行相关的动作,在ExecuteSQL这个函数中, 我们执行MySqlCommand myCmd = new MySqlCommand(CmdString, conn),从而创建MySqlCommand对象,其中传入的两个参数分别