自动化运维的范畴

1.运维标准化

物理设备层面:

1.服务器标签化、设备负责人、设备采购详情、设备摆放标准。

2.网络划分、远程控制卡、网卡端口

3.服务器机型、硬盘、内存统一。根据业务分类。

4.资产命名规范、编号规范、类型规范

5.监控标准

操作系统层面:

1.操作系统版本

2.系统初始化(DNS、NTP、内核参数调优、rsyslog、主机名规范)

3.基础Agent配备(Zabbix Agent、Logstash Agent、Saltstack minion)

4.系统监控标准(CPU、内存、硬盘、网络、进程)

应用服务层面:

1.Web服务器选型(Apache、Nginx)

2.进程启动用户、端口监听规范、日志收集规范(访问日志、错误日志、运行日志)

3.配置管理(配置文件规范、脚本规范)

4.架构规范(Nginx+Keepalived、LVS+Keepalived等等)

5.部署规范(位置、包命名等)

运维操作层面:

1.机房巡检流程(周期、内容、报修流程)

2.业务部署流程(先测试、后生产。回滚)

3.故障处理流程(紧急处理、故障升级、重大故障管理)

4.工作日志标准(如何编写工作日志)

5.业务上线流程(1.项目发起 2.系统安装  3.部署Nginx 4.解析域名     5.测试 6.加监控 7.备份)

6.业务下线流程(谁发起,数据如何处理。)

7.运维安全规范(密码复杂度、更改周期、VPN使用规范、服务登录规范)

标准化  (规范化  流程化  文档化)  目标:文档化

工具化:

1.SHELL脚本(功能性(流程)脚本、检查性、报表性、)

2.开源工具:Zabbix  ELKStack  SaltStack  Cobbler

目标:1.促进标准化的实施

2.将重复的操作,简单化

3.将多次操作,流程化

4.减少人为操作的低效和降低故障率

工具化和标准化是好基友!

痛点:

1.你至少要ssh到服务器执行。可能犯错

2.多个脚本有执行顺序的时候,可能犯错。

3.权限不好管理,日志没法统计。

4.无法避免手工操作。

例子:比如某天我们要对一台数据库从库进行版本停机升级。那么要求进行评估:

停机影响:3:00 晚上有定时任务连接该数据库,做数据报表统计。

1.凌晨3:00 我们所有系统的定时任务有哪些 crontab

2.这些crontab哪些连接我们要停止的从库。

3.哪些可以停,哪些不能停(修改到主库),哪些可以后补。

4.这些需要后补的脚本哪个业务、谁加的、什么时候加的。

运维操作平台

例子:Job管理平台

1.做成Web界面

2.权限控制

3.日志记录

4.弱化流程

5.不用ssh到服务器,减少人为操作造成的故障  Web ssh

DNS Web管理  bind-DLZ

负载均衡Web管理

Job管理平台

监控平台 Zabbix

操作系统安装平台

时间: 2024-08-29 12:04:19

自动化运维的范畴的相关文章

关于自动化运维的实践×××

谈起自动化运维,现在已经成为运维工作最热门的词语,关于运维自动化本人早在2012年就已经接触了BMC的ITSM系统,将ITIL运维管理体系和自动化运维工具的有效的结合大幅度的提高了运维工作效率.下图为HP提的统一运维自动化理念和运维手册,从目前企业基础架构层来看,运维人员无关乎关心的如下几个方面的自动化. 要了解运维自动化在企业当中应用场景和是否真正能够解决运维团队工作的问题.那我们则需要站到企业运维人员的角度去考虑问题.那么我首先要知道一个企业或者运维团队在规划运维的时候所需要考虑的问题及面临

自动化运维工具介绍

运维目标有三个阶段,第一是追求稳定性,第二是追求标准化,第三是追求自动化.对于第三阶段来说,什么是运维自动化呢?简单地讲,运维自动化就是将日常重复性工作按照事先设定好的规则,在一定时间范围内自动化运行,而不需要人工参与.接下来简单介绍运维自动化工具,要了解运维平时用到的自动化工具,就需要了解运维人员的日常工作有哪些. 一.运维的日常工作 运维的日常工作可以总结为以下四个部分,分别是: (1) 系统安装 (2) 应用程序配置(Configuration) (3) 命令执行与控制(Command a

Python自动化运维课程学习--Day3

本文为参加老男孩Python自动化运维课程第三天学习内容的总结. 大致内容如下: 1.文件操作 2.字符编码转码相关操作 3.函数 0.关于本文中所有运行Python代码的环境: --操作系统:Ubuntu 16.10 (Linux 4.8.0) --Python版本:3.5.2 python2.7.12 --Python IDE: PyCharm 2016.3.2 一.文件操作: 1.文件操作流程:以只读.写(覆盖写).追加写.读写.追加读写.二进制读写等模式打开文件 ==> 得到文件句柄,并

linux 自动化运维之Cobbler

一.Cobbler 简介 1.Cobbler 概述 Cobbler由python语言开发,是对PXE和Kickstart以及DHCP的封装.融合很多特性,提供了CLI和Web的管理形式.更加方便的实行网络安装.同时,Cobbler也提供了API接口,使用其它语言也很容易做扩展.它不紧可以安装物理机,同时也支持kvm.xen虚拟化.Guest OS的安装.更多的是它还能结合Puppet等集中化管理软件,实现自动化的管理. 2.新旧对比 以前自动化安装系统得先设置一个网络环境,可是设置网络环境涉及到

自动化运维工具之ansible

ansible ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet.cfengine.chef.func.fabric)的优点,实现了批量系统配置.批量程序部署.批量运行命令等功能. ansible是基于模块工作的,本身没有批量部署的能力.真正具有批量部署的是ansible所运行的模块,ansible只是提供一种框架. 主要包括: (1).连接插件connection plugins:负责和被监控端实现通信: (2).host inventory:指定

自动化运维—tomcat服务起停(mysql+shell+django+bootstrap+jquery)

项目简介: 项目介绍:自动化运维是未来的趋势,最近学了不少东西,正好通过这个小项目把这些学的东西串起来,练练手. 基础架构: 服务器端:web框架-Django 前端:html css jQuery bootstrap 脚本:shell 适用系统:redhat5.8/redhat6.6 平台已实现功能: 中间件和数据库软件的启停和状态检查 (tomcat,nginx,apache,oracle,mysql) 完整功能设计图: 效果图: 架构图(简要): 项目源码:https://github.c

ansible自动化运维必备工具详解

第2章 ansible简单介绍: 2.1 ansible是什么? ansible是新出现的 自动化 运维工具 , 基于Python研发 . 糅合了众多老牌运维工具的优点实现了批量操作系统配置.批量程序的部署.批量运行命令等功能. 仅需在管理工作站上安装 ansible 程序配置被管控主机的 IP 信息,被管控的主机无客户端. ansible 应用程序存在于 epel( 第三方社区 ) 源,依赖于很多 python 组件 python语言是运维人员必会的语言!ansible是一个基于Python开

Python自动化运维课程学习--Day2

本文为参加老男孩Python自动化运维课程第二天学习内容的总结. 大致内容如下: 1.python模块初识 2.python程序运行流程 3.python数据类型(只讲了numbers, bool, strings, bytes, list, tuple, dict, set) 4.python数据运算 0.关于本文中所有运行Python代码的环境: --操作系统:Ubuntu 16.10 (Linux 4.8.0) --Python版本:3.5.2 --Python IDE: PyCharm

cheungssh自动化运维

CheungSSH自动化运维部署 1.安装包 CheungSSH.tar.gz # tar zxf CheungSSH.tar.gz # cd bin/ # sh install-CheungSSH.sh 注: 服务器ip填写本地ip:192.168.36.129 选择yum安装 若提示数据库错误,要安装musql进行mysql_secure_installtion进行root密码设置 再执行sh install-CheungSSH.sh输入mysql的root密码,mysql服务器选择127.