常用自动化运维工具
Ansible:python,Agentless,中小型应用环境 基于Python开发出来工具
Saltstack:python,一般需部署agent,执行效率更高
Puppet:ruby, 功能强大,配置复杂,重型,适合大型环境
Fabric:python,agentless
Chef: ruby,国内应用少
Cfengine
func
Ansible发展史
Ansible
创始人,Michael DeHaan( Cobbler 与 Func 的作者)
2012-03-09,发布0.0.1版,红帽收购
2015-10-17,Red Hat宣布收购
同类自动化工具GitHub关注程度(2016-07-10)
ansible特性
模块化:调用特定的模块,完成特定任务
有Paramiko,PyYAML,Jinja2(模板语言)三个关键模块
支持自定义模块
基于Python语言实现
部署简单,基于python和SSH(默认已安装),agentless
安全,基于OpenSSH
支持playbook编排任务
幂等性:一个任务执行1遍和执行n遍效果一样,不因重复执行带来意外情况
无需代理不依赖PKI(无需ssl)
可使用任何编程语言写模块
YAML格式,编排任务,支持丰富的数据结构
较强大的多层解决方案
Ansible主要组成部分
ANSIBLE PLAYBOOKS:任务剧本(任务集),编排定义Ansible任务集的配置文件,由Ansible顺序依次执行,通常是JSON格式的YML文件
INVENTORY:Ansible管理主机的清单/etc/anaible/hosts
MODULES:Ansible执行命令的功能模块,多数为内置核心模块,也可自定义
PLUGINS:模块功能的补充,如连接类型插件、循环插件、变量插件、过滤插件等,该功能不常用
API:供第三方程序调用的应用程序编程接口
ANSIBLE:组合INVENTORY、API、MODULES、PLUGINS的绿框,可以理解为是ansible命令工具,其为核心执行工具
Ansible命令执行来源:
USER,普通用户,即SYSTEM ADMINISTRATOR
CMDB(配置管理数据库) API 调用
PUBLIC/PRIVATE CLOUD API调用
USER-> Ansible Playbook -> Ansibile
利用ansible实现管理的方式:
Ad-Hoc 即ansible命令,主要用于临时命令使用场景
Ansible-playbook 主要用于长期规划好的,大型项目的场景,需要有前提的规划
Ansible-playbook(剧本)执行过程:
将已有编排好的任务集写入Ansible-Playbook
通过ansible-playbook命令分拆任务集至逐条ansible命令,按预定规则逐条执行
Ansible主要操作对象:
HOSTS主机
NETWORKING网络设备
注意事项
执行ansible的主机一般称为主控端,中控,master或堡垒机
主控端Python版本需要2.6或以上
被控端Python版本小于2.4需要安装python-simplejson
被控端如开启SELinux需要安装libselinux-python
windows不能做为主控端
主机清单inventory
Inventory 主机清单
ansible的主要功用在于批量主机操作,为了便捷地使用其中的部分主机,可以在inventory file中将其分组命名
默认的inventory file为/etc/ansible/hosts
inventory file可以有多个,且也可以通过Dynamic Inventory来动态生成
/etc/ansible/hosts文件格式
inventory文件遵循INI文件风格,中括号中的字符为组名。可以将同一个主机同时归并到多个不同的组中;此外,当如若目标主机使用了非默认的SSH端口,还可以在主机名称之后使用冒号加端口号来标明
ntp.magedu.com
[webservers]
www1.magedu.com:2222
www2.magedu.com
[dbservers]
db1.magedu.com
db2.magedu.com
db3.magedu.com
安装:
ansible官方网站:www.ansible.com 已被红帽收购
rpm包安装:EPLE源
yum install ansible
编译安装:
yum -y install python-jinja2 PyYAML python-paramiko python-babel python-crypto
tar xf ansible-1.5.4.tar.gz
cd ansible-1.5.4
python setup.py build
python setup.py install
mkdir /etc/ansible
cp -r examples/* /etc/ansible
Git方式:
git clone git://github.com/ansible/ansible.git --recursive
cd ./ansible
source ./hacking/env-setup
pip安装: pip是安装Python包的管理器,类似yum
yum install python-pip python-devel
yum install gcc glibc-devel zibl-devel rpm-bulid openssl-devel
pip install --upgrade pip
pip install ansible --upgrade
确认安装: ansible --version
相关文件
配置文件
/etc/ansible/ansible.cfg 主配置文件,配置ansible工作特性
/etc/ansible/hosts 主机清单
/etc/ansible/roles/ 存放角色的目录
程序
/usr/bin/ansible 主程序,临时命令执行工具
/usr/bin/ansible-doc 查看配置文档,模块功能查看工具
/usr/bin/ansible-galaxy 下载/上传优秀代码或Roles模块的官网平台
/usr/bin/ansible-playbook 定制自动化任务,编排剧本工具/usr/bin/ansible-pull 远程执行命令的工具
/usr/bin/ansible-vault 文件加密工具
/usr/bin/ansible-console 基于Console界面与用户交互的执行工具
如果主机名称遵循相似的命名模式,还可以使用列表的方式标识各主机
示例:
[websrvs]
www[01:100].example.com
[dbsrvs]
db-[a:f].example.com
ansible 配置文件
Ansible 配置文件/etc/ansible/ansible.cfg (一般保持默认)
[defaults]
#inventory = /etc/ansible/hosts # 主机列表配置文件
#library = /usr/share/my_modules/ # 库文件存放目录
#remote_tmp = $HOME/.ansible/tmp #临时py命令文件存放在远程主机目录
#local_tmp = $HOME/.ansible/tmp # 本机的临时命令执行目录
#forks = 5 # 默认并发数
#sudo_user = root # 默认sudo 用户
#ask_sudo_pass = True #每次执行ansible命令是否询问ssh密码
#ask_pass = True
#remote_port = 22
#host_key_checking = False # 检查对应服务器的host_key,建议取消注释
#log_path=/var/log/ansible.log #日志文件
ansible系列命令
Ansible系列命令
ansible ansible-doc ansible-playbook ansible-vault
ansible-console ansible-galaxy ansible-pull
ansible-doc: 显示模块帮助
ansible-doc [options] [module...]
-a 显示所有模块的文档
-l, --list 列出可用模块
-s, --snippet显示指定模块的playbook片段
实例:五台主机:一台主机安装ansible控制其他四台主机:
一主机:安装ansible:
yum -y install ansible
安装完之后添加清单控制其他四台机器:
vim /etc/ansible/hosts
172.20.102.70
172.20.102.71
172.20.113.166
172.20.113.167
添加其他主机的IP地址
可以将其分组控制:
vim /etc/ansible/hosts
[Webservers]
172.20.102.70
172.20.102.71
[mariaservers]
172.20.113.166
172.20.113.167
[ddservers]
172.20.102.7[0:1] 是172.20.102.70和172.20.102.71两台机器
172.20.113.167
注意:以为ansible是基于ssh:22端口服务用来控制其他主机的,如果端口改变可直接在主机ip地址后面跟上端口号即可 如:192.168.1.1:2222
测试ping一下主机:
ansible all -m ping -k 是ping一下所有主机
all:是ping添加到清单中的所有主机
-m ping:是基于ssh协议22端口测试一下主机
-k 访问时添加密码
测试ddservers组中的主机
ansible ddservers -m ping -k
SSH password:
172.20.113.167 | SUCCESS => {
"changed": false,
"ping": "pong"
}
172.20.102.70 | SUCCESS => {
"changed": false,
"ping": "pong"
}
172.20.102.71 | SUCCESS => {
"changed": false,
"ping": "pong"
}
注意:有事会出现错误无法ping通无法连接到指定的主机时和不小心输错密码时一下用ansible连接时会报错解决方法如下:
1、查看cat .ssh/known_hosts 是否有想要连接的主机,有将其rm -rf
2、cat .ssh/known_hosts之后仍然无法使用时 用在安装主机控制其他主机的机器用ssh服务登录此机器之后exit退出后可访问
3、可直接改配置文件将:默认是不启用的 将#去掉即可:
vim /etc/ansible/ansible.cfg
host_key_checking = False
rm -rf .ssh/known_hosts 删除
启用日志功能:
vim /etc/ansible/ansible.conf
log_path = /var/log/ansible.log
问题:ansible的是怎么控制其他的机器:
首先在执行命令时它会转化成一个Python脚本放荡当前目录的/ansible/tmp目录下。无需自己创建它会自动生成是.ansible隐藏目录下,会复制到被控制机器的.ansible隐藏目录下,它会自动删除的,是临时创建的
帮助:
ansible-dos -l
示例:
ansible-doc –l 列出所有模块
ansible-doc ping 查看指定模块帮助用法
ansible-doc –s ping 查看指定模块帮助用法
ansible选项:
ansible通过ssh实现配置管理、应用部署、任务执行等功能,建议配置ansible端能基于密钥认证的方式联系各被管理节点
ansible <host-pattern> [-m module_name] [-a args]
-a:指定的参数 跟命令
--version 显示版本
-m module 指定模块,默认为command
-v 详细过程 –vv -vvv更详细
--list-hosts 显示主机列表,可简写—list 查看所控制的机器
-k, --ask-pass 提示输入ssh连接密码,控制机器的root密码
-K, --ask-become-pass 提示输入sudo时的口令
-C, --check 检查,并不执行
-T, --timeout=TIMEOUT 执行命令的超时时间,默认10s
-u, --user=REMOTE_USER 执行远程执行的用户
-b, --become 代替旧版的sudo 切换
ansible的Host-pattern
ansible的Host-pattern
匹配主机的列表
All :表示所有Inventory中的所有主机
ansible all –m ping
- :通配符
ansible “” -m ping
ansible 192.168.1. -m ping
ansible “srvs” -m ping
或关系
ansible “websrvs:appsrvs” -m ping
ansible “192.168.1.10:192.168.1.20” -m ping
逻辑与
ansible “websrvs:&dbsrvs” –m ping
在websrvs组并且在dbsrvs组中的主机
逻辑非
ansible ‘websrvs:!dbsrvs’ –m ping
在websrvs组,但不在dbsrvs组中的主机
注意:此处为单引号
综合逻辑
ansible ‘websrvs:dbsrvs:&appsrvs:!ftpsrvs’ –m ping
正则表达式
ansible “websrvs:&dbsrvs” –m ping
ansible “~(web|db)..magedu.com” –m ping
ansible命令执行过程
ansible命令执行过程
- 加载自己的配置文件 默认/etc/ansible/ansible.cfg
- 加载自己对应的模块文件,如command
- 通过ansible将模块或命令生成对应的临时py文件,并将该 文件传输至远程服务器的对应执行用户$HOME/.ansible/tmp/ansible-tmp-数字/XXX.PY文件
- 给文件+x执行
- 执行并返回结果
- 删除临时py文件,sleep 0退出
执行状态:
绿色:执行成功并且不需要做改变的操作
×××:执行成功并且对目标主机做变更
红色:执行失败
问题:用ansible如何查看webservers组中机器的/etc/fstab文件如实现:
ansible webservers -u root -k -m command -a ‘cat /etc/fstab‘
ansible实现无需密码登录的方式管理机器:
ssh-keyge 建议加一个秘钥
ssh-copy-id 172.20.xxx.xxx 跟上ip地址后输入密码之后 可实现无需密码登录
ansible all -m ping 即可
ansible使用示例
以wang用户执行ping存活检测
ansible all -m ping -u wang -k
以wang sudo至root执行ping存活检测
ansible all -m ping -u wang –b -k
以wang sudo至mage用户执行ping存活检测
ansible all -m ping -u wang –b -k --become-user mage
以wang sudo至root用户执行ls
ansible all -m command -u wang --become-user=root -a ‘ls /root‘ -b –k -K
ansible常用模块
Command:在远程主机执行命令,默认模块,可忽略-m选项
ansible srvs -m command -a ‘service vsftpd start’
ansible srvs -m command -a ‘echo magedu |passwd --stdin wang’ 不成功
此命令不支持 $VARNAME < > | ; & 等,用shell模块实现
Shell:和command相似,用shell执行命令
ansible srv -m shell -a ‘echo magedu |passwd –stdin wang’
调用bash执行命令 类似 cat /tmp/stanley.md | awk -F‘|’ ‘{print $1,$2}’ &> /tmp/example.txt 这些复杂命令,即使使用shell也可能会失败,解决办法:写到脚本时,copy到远程,执行,再把需要的结果拉回执行命令的机器
测试在控制的所有主机中创建/data/ff文件:
ansible all -m shell -a ‘mkdir /data/ff‘
也可以查看文件等:
ansible all -a ‘cat /etc/passwd‘
也可以删除文件等:
ansible all -m shell -a ‘rm -rf /data/*‘ 可使用file模块
Script:运行脚本
-a "/PATH/TO/SCRIPT_FILE“
snsible websrvs -m script -a f1.sh
测试:在所有主机执行/data/haha.sh这个脚本???
vim /data/haha.sh
echo "Hello word"
chmod +x /data/haha.sh
ansible all -m script -a ‘/data/haha.sh‘
Copy:从服务器复制文件到客户端,
ansible srv -m copy -a “src=/root/f1.sh dest=/tmp/f2.sh owner=wang mode=600 backup=yes”
如目标存在,默认覆盖,此处指定先备份
ansible srv -m copy -a “content=‘test content\n’ dest=/tmp/f1.txt” 利用内容,直接生成目标文件
问题:将所有主机selinux全部关闭:
vim /etc/sysconfig/selinux
SELINUX=disabled
cp /etc/sysconfig/selinux /data
ansible all -a ‘getenforce‘ 先查看seliunux是否启动
ansible all -m copy -a ‘src=/data/selinux dest=/etc/selinux/config backup=yes‘
src:传送的起始的文件当前所在地
dest:传送的文件目标
backup=yes:是否备份
ansibel all -a ‘reboot‘ 重启生效
ansible all -a ‘getenforce‘ 查看是否更改
172.20.102.70 | SUCCESS | rc=0 >>
Disabled
172.20.113.166 | SUCCESS | rc=0 >>
Disabled
172.20.113.167 | SUCCESS | rc=0 >>
Disabled
172.20.102.71 | SUCCESS | rc=0 >>
Disabled
问题:将所有主机/etc/shadow复制到/data文件下将属性改成000 所有者改成chen:
ansible all -m copy -a ‘src=/etc/shadow dest=/data mode=000 owner=chen‘
mode=000:修改权限
owner=chen:修改属主
ansible all -a ‘ls -l /data‘
Fetch:从客户端取文件至服务器端,copy相反,目录可先tar
ansible srv -m fetch -a ‘src=/root/a.sh dest=/data/scripts’
问题:如何将所有主机的日志文件抓过来到/data下:
ansible all -m fetch -a ‘scr=/var/log/messages dest=/data‘
File:设置文件属性
ansible srv -m file -a "path=/root/a.sh owner=wang mode=755“
ansible web -m file -a ‘src=/app/testfile dest=/app/testfile-link state=link
问题:在/data/下创建新的文件:
ansible all -m file -a ‘name=/data/gg state=touch‘
或者比较的简单的方式:
ansible all -a ‘mkdir /data/gg‘
创建一个软连接/etc/fstab到/data目录下:
ansible all -m file -a ‘src=/etc/fstab dest=/data/fstab.link stest=link‘
那么如何删除软连接:
ansible all -m file -a ‘dest=/data/fstab.link state=absent‘
Hostname:管理主机名
ansible node1 -m hostname -a “name=websrv”
问题:将172.20.113.168的机器名字改成note1:
ansible 172.20.113.168 -m hostname -a ‘name=note1‘
注意:改机器名字是直接写入配置文件中的
centos7:/etc/hostname
centos6:/etc/sysconfig/network
Cron:计划任务
支持时间:minute,hour,day,month,weekday
ansible srv -m cron -a “minute=*/5 job=‘/usr/sbin/ntpdate 172.16.0.1 &>/dev/null’ name=Synctime” 创建任务
ansible srv -m cron -a ‘state=absent name=Synctime’ 删除任务
问题:让所有机器报警:
ansible all -m cron -a ‘minute=* weekday=1,3,5 job="/usr/bin/wall FBI" name=FBI‘
删除计划任务:
ansible all -m cron -a ‘disabled=true job="/usr/bin/wall FBI" name=FBI
Yum:管理包
ansible srv -m yum -a ‘name=httpd state=latest’ 安装
ansible srv -m yum -a ‘name=httpd state=absent’ 删除
问题:给所有主机安装vsftpd:
ansible all -m yum -a ‘name=vsftpd‘
把vsftpd全部卸载:
ansible all -m yum -a ‘name=vsftpd state=removed‘
验证:是否取消安装
ansible all -m shell -a ‘rpm -q vsftpd‘
Service:管理服务
ansible srv -m service -a ‘name=httpd state=stopped‘
ansible srv -m service -a ‘name=httpd state=started‘
ansible srv –m service –a ‘name=httpd state=reloaded’
ansible srv -m service -a ‘name=httpd state=restarted‘
问题:将所有vsftpd服务启用:
ansible all -m service -a ‘name=vsftpd state=started enabled=yes‘
User:管理用户
ansible srv -m user -a ‘name=user1 comment=“test user” uid=2048 home=/app/user1 group=root‘
ansible srv -m user -a ‘name=sysuser1 system=yes home=/app/sysuser1 ’
ansible srv -m user -a ‘name=user1 state=absent remove=yes‘ 删除用户及家目录等数据
问题:在所有主机创建一个用户ss,并指定shell为/sbin/nologin
ansible all -m user -a ‘name=ss shell=/sbin/nologin system=yes
验证:
ansible all -a ‘getent passwd ss‘
那么又如何删除用户呢:
ansible all -m user -a ‘name=ss state=absent remove=yes‘
Group:管理组
ansible srv -m group -a "name=testgroup system=yes“
ansible srv -m group -a "name=testgroup state=absent
问题:创建一个gg的组:
ansible all -m group -a ‘name=gg system=yes gid=80‘
验证:
ansible all -a ‘getent group gg‘
ansible系列命令
ansible-galaxy
连接 https://galaxy.ansible.com 下载相应的roles
列出所有已安装的galaxy
ansible-galaxy list
安装galaxy
ansible-galaxy install geerlingguy.redis
删除galaxy
ansible-galaxy remove geerlingguy.redis
也可在创建一个:
cd .ansible/roles
cp -rp geerlingguy.nginx/chen.nginx
ansible-galaxy list
ansible-pull
推送命令至远程,效率无限提升,对运维要求较高
Ansible-playbook
ansible-playbook hello.yml
cat hello.yml
#hello world yml file
- hosts: websrvs
remote_user: root
tasks:
- name: hello world
command: /usr/bin/wall hello world
实例:
vim ansible/play.yml
- hosts: mariadbservers
remote_user: root
#运行的用户
tasks:
- name: play
command: hostname
ansible-playbook play.yml
Ansible-vault
功能:管理加密解密yml文件
ansible-vault [create|decrypt|edit|encrypt|rekey|view]
ansible-vault encrypt hello.yml 加密
ansible-vault decrypt hello.yml 解密
ansible-vault view hello.yml 查看
ansible-vault edit hello.yml 编辑加密文件
ansible-vault rekey hello.yml 修改口令
ansible-vault create new.yml 创建新文件
问题:那么如何给ansible/play.yml文件加密呢:
ansible-vault encrypt play.yml
解密为:
ansible-vault decrypt play.yml
Ansible-console:2.0+新增,可交互执行命令,支持tab
[email protected] (2)[f:10] $
执行用户@当前操作的主机组 (当前组的主机数量)[f:并发数]$
设置并发数: forks n 例如: forks 10
切换组: cd 主机组 例如: cd web
列出当前组主机列表: list
列出所有的内置命令: ?或help
示例:
[email protected] (2)[f:5]$ list
[email protected] (2)[f:5]$ cd appsrvs
[email protected] (2)[f:5]$ list
[email protected] (2)[f:5]$ yum name=httpd state=present
[email protected] (2)[f:5]$ service name=httpd state=started
原文地址:http://blog.51cto.com/001230/2128382