ansible故障

故障:管理端连接172.16.1.8的受控端不能管理

[[email protected] ansible]# ansible 172.16.1.8 -m command -a "w"

172.16.1.8 | UNREACHABLE! => {

"changed": false,

"msg": "Failed to connect to the host via ssh: ",

"unreachable": true

}

第一步:查询排错:查询详细连接过程发现受控端连接头部异常

[[email protected] ansible]# ansible 172.16.1.8 -m ping -vvvv

Using /etc/ansible/ansible.cfg as config file

Loading callback plugin minimal of type stdout, v2.0 from /usr/lib/python2.6/site-packages/ansible/plugins/callback/__init__.pyc

META: ran handlers

Using module file /usr/lib/python2.6/site-packages/ansible/modules/system/ping.py

<172.16.1.8> ESTABLISH SSH CONNECTION FOR USER: None

<172.16.1.8> SSH: EXEC ssh -vvv -C -o ControlMaster=auto -o ControlPersist=60s -o KbdInteractiveAuthentication=no -o PreferredAuthentications=gssapi-with-mic,gssapi-keyex,hostbased,publickey -o PasswordAuthentication=no -o ConnectTimeout=10 -o ControlPath=/root/.ansible/cp/923ebeb605 172.16.1.8 ‘/bin/sh -c ‘"‘"‘echo ~ && sleep 0‘"‘"‘‘

<172.16.1.8> (255, ‘‘, ‘OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013\ndebug1: Reading configuration data /etc/ssh/ssh_config\r\ndebug1: Applying options for *\r\ndebug1: auto-mux: Trying existing master\r\ndebug2: fd 3 setting O_NONBLOCK\r\ndebug2: mux_client_hello_exchange: master version 4\r\ndebug3: mux_client_request_forwards: requesting forwardings: 0 local, 0 remote\r\ndebug3: mux_client_request_session: entering\r\ndebug3: mux_client_request_alive: entering\r\ndebug3: mux_client_request_alive: done pid = 22508\r\ndebug3: mux_client_request_session: session request sent\r\ndebug1: mux_client_request_session: master session id: 12\r\ndebug3: mux_client_read_packet: read header failed: Broken pipe\r\ndebug2: Control master terminated unexpectedly\r\n‘)

172.16.1.8 | UNREACHABLE! => {

"changed": false,

"msg": "Failed to connect to the host via ssh: OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013\ndebug1: Reading configuration data /etc/ssh/ssh_config\r\ndebug1: Applying options for *\r\ndebug1: auto-mux: Trying existing master\r\ndebug2: fd 3 setting O_NONBLOCK\r\ndebug2: mux_client_hello_exchange: master version 4\r\ndebug3: mux_client_request_forwards: requesting forwardings: 0 local, 0 remote\r\ndebug3: mux_client_request_session: entering\r\ndebug3: mux_client_request_alive: entering\r\ndebug3: mux_client_request_alive: done pid = 22508\r\ndebug3: mux_client_request_session: session request sent\r\ndebug1: mux_client_request_session: master session id: 12\r\ndebug3: mux_client_read_packet: read header failed: Broken pipe\r\ndebug2: Control master terminated unexpectedly\r\n",

"unreachable": true

}Reading configuration data /etc/ssh/ssh_config\r\ndebug1: Applying options for *\r\ndebug1: auto-mux: Trying existing master\r\ndebug2: fd 3 setting O_NONBLOCK\r\ndebug2: mux_client_hello_exchange: master version 4\r\ndebug3: mux_client_request_forwards: requesting forwardings: 0 local, 0 remote\r\ndebug3: mux_client_request_session: entering\r\ndebug3: mux_client_request_alive: entering\r\ndebug3: mux_client_request_alive: done pid = 22508\r\ndebug3: mux_client_request_session: session request sent\r\ndebug1: mux_client_request_session: master session id: 12\r\ndebug3: mux_client_read_packet: read header failed: Broken pipe\r\ndebug2: Control master terminated unexpectedly\r\n",

"unreachable": true》这个错误大=大致的意思就是连接的时候读取ssh头部异常。

第二步:在172.16.1.8主机上进行进程检查:

[[email protected] ssh]# ps -ef|grep ssh

root      21204      1  0 15:08 ?        00:00:00 sshd: [email protected]/1

root      21272      1  0 15:14 ?        00:00:00 sshd: [email protected]

root      21818      1  0 15:43 ?        00:00:00 /usr/sbin/sshd

root      21845  21206  0 15:46 pts/1    00:00:00 grep ssh

[[email protected] ssh]# kill 21272

[[email protected] ssh]# kill 21272

-bash: kill: (21272) - No such process

[[email protected] ssh]# kill 21272

-bash: kill: (21272) - No such process

[[email protected] ssh]# kill 21272

-bash: kill: (21272) - No such process

解决说明:root      21272      1  0 15:14 ?        00:00:00 sshd: [email protected] 这一条进程卡死了连接请求,需要杀掉这一条进程然后到管理端重新建立管理测试。

第三步:查看管理端:连通性过程详细过程

[[email protected] ansible]# ansible 172.16.1.8 -m ping

172.16.1.8 | SUCCESS => {

"changed": false,

"ping": "pong"

}

说明:pong表示连通正常

第四步:再来管理端测试一下:

[[email protected] ansible]# ansible oldboy -m command -a "w"

172.16.1.8 | SUCCESS | rc=0 >>

15:47:04 up  7:28,  3 users,  load average: 0.00, 0.00, 0.00

USER     TTY      FROM              [email protected]   IDLE   JCPU   PCPU WHAT

root     tty1     -                31Aug17  8:45   0.00s  0.00s -bash

root     pts/0    m01              15:47    0.00s  0.11s  0.00s /bin/sh -c /usr

root     pts/1    10.0.0.253       31Aug17 23.00s  0.06s  0.06s -bash

172.16.1.31 | SUCCESS | rc=0 >>

15:47:05 up 3 days,  4:14,  2 users,  load average: 0.00, 0.00, 0.00

USER     TTY      FROM              [email protected]   IDLE   JCPU   PCPU WHAT

root     pts/0    10.0.0.253       08:08   15:37   0.02s  0.02s -bash

root     pts/2    m01              15:47    1.00s  0.09s  0.00s /bin/sh -c /usr

172.16.1.41 | SUCCESS | rc=0 >>

15:47:05 up 2 days, 22:58,  3 users,  load average: 0.00, 0.00, 0.00

USER     TTY      FROM              [email protected]   IDLE   JCPU   PCPU WHAT

root     tty1     -                09:21    6:24m  0.00s  0.00s -bash

root     pts/0    10.0.0.253       09:23   10:11   0.02s  0.02s -bash

root     pts/1    m01              15:47    1.00s  0.18s  0.00s /bin/sh -c /usr

说明:此时已经管理端显示正常,故障解决

时间: 2024-08-02 11:05:24

ansible故障的相关文章

一次ansible故障排除

运行ansbile时候报错:[[email protected] pyhook-2014-06-09-17:47:17-2454]# ansibleTraceback (most recent call last):  File "/usr/bin/ansible", line 25, in <module>    from ansible.runner import Runner  File "/usr/lib/python2.6/site-packages/a

ansible 故障解决

Ansible 服务器无法链接到客户端! [[email protected] ansible]# ansible 192.168.10.13  -m ping -k SSH password: 192.168.10.13 | FAILED! => {     "changed": false,     "failed": true,     "module_stderr": "",     "module_s

使用ansible快速部署一个主流的Web架构

拓扑: 拓扑说明: 两台服务器配置Keepalived+Nginx做双主模型的Load Balance,主机名为lb1和lb2 两台服务器配置lamp,用于处理动态资源请求,主机名为lamp1和lamp2 两台服务器配置varnish作为静态资源缓存服务器,主机名为varnish1和varnish2 两台服务器配置Nginx用于处理静态资源请求 额外需要一台服务器安装ansible,使用ansible批量管理所有服务器 关键技术点: 1. Keepalived配置了邮件报警脚本,当节点的状态发生

使用ansible快速配置RHCS 集群 实现WEB站负载均衡高可用(手记)

什么是RHCS RHCS是Red Hat Cluster Suite的缩写,也就是红帽子集群套件,RHCS是一个能够提供高可用性.高可靠性.负载均衡.存储共享且经济廉价的集群工具集合,它将集群系统中三大集群架构融合一体,可以给web应用.数据库应用等提供安全.稳定的运行环境. 更确切的说,RHCS是一个功能完备的集群应用解决方案,它从应用的前端访问到后端的数据存储都提供了一个行之有效的集群架构实现,通过RHCS提供的这种解决方案,不但能保证前端应用持久.稳定的提供服务,同时也保证了后端数据存储的

MariaDB数据库介绍三、MHA(Master HA)实现主节点故障转移

一.MHA MHA是开源的MySQL的高可用程序,它为MySQL的主从复制架构提供了主节点故障自动转移的功能,它会监控master节点故障的时候,会提升其中的拥有最新数据的slave节点称为新的master节点,同时它还提供了master节点的在线切换的功能,按需切换master/slave节点. MHA服务有两种角色,MHA Manager和MHA Node: MHA Manager(管理节点):单独部署在一台独立机器上管理多个master/slave主从复制集群, 每个master/slav

Ansible自动化部署corosync+pacemaker高可用实现httpd

一.ansible简介 ansible是2012年出现的自动运维工具,基于python开发,集合了众多工具的优点,可以实现批量系统配置.批量程序部署.批量运行命令.批量配置文件修改等功能.最主要的是ansible是基于多模块工作的,而且ansible是无需客户端安装就可以基于ssh实现管理节点的,是轻量级的自动化运维工具,ansible是个框架,主要包括以下几个组件: (1).连接插件connection plugins:负责和被监控端实现通信: (2).host inventory:设置管理的

Fbric、Ansible、Docker、Chaos Monkey:DevOps工具的年中回顾

Fbric.Ansible.Docker.Chaos Monkey:DevOps工具的年中回顾 [编者按]近日,Cyber Engineering Solutions Group 技术经理 Hasan Yasar 在 SEI 攥文盘点了当下流行的 DevOps 思想和工具,其中包括Fabric.Ansible.Docker.Chaos Monkey等.本文系 OneAPM 联合高效运维联合编译整理: 在2014年年底,SEI 博客发表了一系列有关 DevOps 的博客文章,提供指南,实用的建议和

Keepalive VIP 故障

前端环境如下: Nginx + Keepalived ( MASTER ) --> node * 12 | | Cisco ASA --> VIP 1.18 | | Nginx + Keepalived ( BACKUP ) 问题描述: 客户端访问域名指向 Cisco ASA 外网端口,通过 NAT 地址转换到内网的 VIP 1.18,到达 Nginx 负载均衡器,之后将请求转向节点服务器. 故障时,客户端打开页面直接返回失败. 解决方法: 1.通过 Zabbix 监控发现 Cisco ASA

ansible安装tomcat_msm

ansible管理机:192.168.8.35 名称:kick tomcat主机: 192.168.8.247,192.168.8.246 memcache  : 192.168.8.243,192.168.8.242 系统版本: Centos7.2 MSM--memcached session manager是一个高可用的Tomcat session共享解决方案,除了可以从本机内存快速读取Session信息(仅针对黏性Session)外,同时可使用memcached存取Session,以实现高