mongodb运维碰到的一些故障笔记

版本:tokumx-1.5.0

错误一

"errmsg" : "loading local.system.replset config (LOADINGCONFIG)"

存在local.oplog.rs和local.system.repset表,

错误二

"errmsg" : "local.oplog.rs is not empty on the initiating member.  cannot initiate."

进行rs.initiate(config)时,已经存在oplog.rs表

错误三

"errmsg" : "all members and seeds must be reachable to initiate set"

local.oplog.rses中存储的集群信息与待初始化的不同,删除即可

错误四

replSet can‘t get local.system.replset config from self or any seed (EMPTYCONFIG)

表system.replset为空

错误五

No replica set primary available for query with ReadPreference PRIMARY

添加新节点时,前端感知到的repset集群信息都会有变化,当未指定ReadPreference为Secondary时,且在添加时secondary不可用,就会导致primary持续处于等待新secondary节点的状态,从而导致这个报错,当前secodnary节点的状态为down

错误六

"info" : "Config now saved locally.  Should come online in about a minute.",

提示保存正常,但实际可能并未正常保存,可通过查看Local.system.repset或者log来判断

错误七

"errmsg" : "took a long time to get write lock, so not initiating.  Initiate when server less busy?"

可能存在一个比较大的Oplog.rs表

时间: 2024-07-31 04:59:06

mongodb运维碰到的一些故障笔记的相关文章

运维人员处理服务器故障的方法总结

运维人员处理服务器故障的方法总结 一.尽可能搞清楚问题的前因后果 二.查看有谁在线 who last 三.查看之前执行了什么命令  history 四.查看现在在运行的进程是什么 pstree -a ps aux 五.查看监听的网络服务 netstat -nxlp netstat -ntlp netstat -nulp 六.查看CPU 和内存 free -m uptime top htop 七.查看硬件 lspci dmidecode ethtool 八.查看IO 性能 iostat -kx 2

MongoDB 运维常用操作

MongoDB 运维常用操作     分析方法:    1. 通过top.free.iostat.iftop等工具查看Linux服务器平均负载.CPU利用率.IO.内存.swap.网络流量等,先定位到压力源头. 2. 通过mongostat.mongotop等分析MongoDB读写压力.观察Page Faults.Connections.Queues等性能指标. 3. 日志中默认记录超过100ms的请求,过滤出Overflow查询,再使用Mtools跟踪分析MongoDB日志文件中的慢查询语句.

tornado+ansible+twisted+mongodb运维自动化系统开发(三)

又到周末啦~~楼上在装修!!睡不着了.....你懂得! 索性整理一下思路做一个改进版的运维自动化个工具,希望能够实现: 控制主机的初始化:如添加ssh密钥\存储资料库的设置\操作用户和密码 受管主机管理:添加\修改\删除 添加主机的用户名\密码\端口 在后台完成ssh密钥登陆,添加受管主机到存储资料库 playbooks管理:添加\修改\删除 添加一个标准的playbook,方便添加修改 ansible模块管理:添加\修改\删除 模块操作:包含ping\setup\shell\copy4个模块,

tornado+ansible+twisted+mongodb运维自动化系统开发(四)

这周好忙,根据之前的写了个简陋的demo,放在腾讯的云主机上了,大家多交流哈 demo地址 http://203.195.193.251/tornado+ansible+twisted+mongodb运维自动化系统开发(四)

mongodb运维之副本集实践

忽然发现芋头好鸡贼 正式环境,4台机器+一台定时任务的机器.服务器是阿里云的ECS,负载均衡用的是阿里云的SLB,mysql用阿里云的RDS,缓存用阿里云的OCS,运维基本上是都不需要担心了,现在的云服务已经非常完善了,其实我们用阿里云的服务非常多,大概有20多个类型的服务,感谢阿里云. 而我的技术栈是nodejs + mongodb,而阿里云有k-v兼容redis协议的nosql,无mongodb,所以就要悲剧的自己运维mongodb了. 阿里的ots是非结构化存储,没有nodejs的sdk,

Linux运维架构师学习开篇——笔记

从毕业从事硬件失效分析方面工作近三年, 偏冷门的行业,一直在工厂产线,吸着产品线散发出的一道道气息,闲暇之余我也在思考难道我今后只能在工厂待一辈子吗?我的职业只能在生产线处理不良产品,我的未来就是作为一个硬件高级维修工吗?我想走出产品线,对未来的职业发展充满迷茫,内心思想一直在挣扎.马上奔三后该做什么,能做什么? 以前接触过Linux,但仅仅是复制粘贴指令,配置IP,最基本操作而已,没有接触到真正的技术,为了今后能有一技之长,有个明确的发展方向(云端),也为了能拿到一份不错的薪水,提高生活质量,

运维自动化工具ansible学习笔记

利用五一假期的时间学习了下ansible,看了一天的官方文档,对其中需要注意的地方,做下笔记整理下思绪. 一.简介 Ansible是与puppet.saltstack类似的集群管理工具,其优点是仅需要ssh和Python即可使用,而不像puppet.saltstack那样都需要客户端.puppet与saltstack这2个软件都需要安装客户端,而saltstack与ansible很相似,都是属于python流的,但saltstack不是很稳定:puppet虽然稳定,但命令执行的时候,需要配置模块

tornado+ansible+twisted+mongodb运维自动化系统开发(二)

源码: #!/usr/bin/env python #coding:utf-8 import os.path import tornado.locale import tornado.httpserver import tornado.ioloop import tornado.options import tornado.web from tornado.options import define, options import pymongo define("port", defa

tornado+ansible+twisted+mongodb运维自动化系统开发(一)

前段时间学习了一下ansible的配置管理(http://blog.csdn.net/column/details/ansible.html   anisble配置工具翻译专栏),感觉很强大,就想着把最近看的tornado和twisted和它结合一下做一个webUI 今天动手做了一个demo,目前大概实现的功能是:添加ansible主机,然后单台运行脚本(后续会把playbook和批量运行加上)在这里做一下记录. 用freemind总结了下思路 下面是demo的截图 添加主机,后台完成清单目录的