数据中心的自动运维之路

自动化运维其实也算是老生常谈,一谈谈了十几年,但却一直没有质的提升。数据中心的运维工作反而变得越来越繁重与复杂,当然这和这些年数据中心巨大的变化紧密相关,数据中心承载的各种应用越来越多,运维工作也变得异常复杂,简单的自动化运维已经不能彻底解决数据中心运维工作效率低下的问题。以前,数据中心运维人员就像流水线上的一名工人,不断重复地做着同样的工作,枯燥又容易出错,自动化运维就是要引入一些工具,通过这些工具来替代运维人员来工作,从而减少人力成本,同时提升数据中心的运维水平。

那么自动化运维,其实就是向数据中心引入一批工具,这批工具是“可编程”的,你只需要为这批工具写上几行“代码”,它便会帮你自动完成所有的工作,而这批工具就是实现自动化运维的手段。这些工具可以分为三大类:预备、配置管理和监控,从这三大方面代替人力工作。预备自动化工具常见的有Cobbler、Kickstart、OpenQRM、Spacewalk。在早期,Linux管理员整理出一个软件包列表,通过rpm进行批量软件安装。

后来,我们用Kickstart来执行无人值守的Linux安装。现在,Cobbler把这个功能提升到了一个新的高度:它实现了物理机与虚拟机的并行系统构建,并且可以进行DHCP和DNS的配置。OpenQRM是开源系统管理解决方案,用来管理企业数据中心业务,同时包括虚拟环境管理、数据中心自动化,是一个基于Web的开源云计算和数据中心管理平台。Spacewalk是一个Linux和Solaris的系统管理解决方案,它是Red Hat网络卫星项目衍生出来的上游社区项目。这些预备管理工具多是针对服务器的,对服务器进行自动化管理,如果不是自己亲身使用和体验,很难说这些工具软件孰好孰坏,每种工具都有其适合的应用场合,这些工具尤其在互联网企业的数据中心运维中使用极为广泛,这些工具需要操作者具有较高的计算机编程能力,对运维人员的要求较高。

?       配置管理工具用来设置参数或者开启一个新服务器上的服务。配置管理可以用于服务器自动构建。服务器自动构建工具可以加速部署速度,并可以在短时间内大规模部署服务器,同时也可以让构建过程更容易复制。在发生严重故障时,还可以重建架构。配置管理工具常见的有Chef、ControlTier、Func、Puppet。比如Chef是一款自动化服务器配置管理工具,可以对管理的对象实行自动化配置,Chef由三大组件组成:Chef Server、Chef Workstation和 Chef Node。Chef Server 是核心服务器,维护了一套配置脚本,与每个被管节点交互并给出配置指令,Chef Workstation提供了我们与 Chef Server交互的接口:我们在Workstation上创建定义Cookbook,并将 Cookbook上传到Chef Server上以保证被管机器能从Chef Server 上取得最新的配置指令。Chef Node是安装了chef-client并注册了的被管理节点,可以是物理机或者虚拟机或者其他对象。Chef Node每次运行chef-client时都会从Chef Server端取得最新的配置指令并按照指令配置自己。ControlTier是一个完全开放源码系统的自动化服务管理活动的多个服务器和多个应用层的工具,它可以对数据中心里的各种设备进行自动配置下发和管理。

这些大部分工具都是实时的,可以用来进行变动并执行某些任务。它们却缺乏关于当前系统状况的信息,于是监控工具就有了用武之地。对于传统的系统管理员而言,监控无非是在发生错误的时候通过一个页面或者一封邮件提醒他们。监控工具常见的有SugarNMS、Nagios、OpenNMS、Zabbix、Zenoss Core等等。智和网管平台SugarNMS是一款开源的网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等,当发现监控设备运行异常时,自动发出告警,还可以将告警消息发给运维人员,以便可以得到及时处理,避免异常对业务造成严重影响。SugarNMS是一个企业级基于Java的分布式网络和系统监控管理平台,兼容主流/国产系统及数据库,提供C/S和B/S两种客户端界面,能够显示你网络中各中终端和服务器的状态和配置,可以监控各个网络设备运行的状态,互通情况,一旦出现异常立即可以上报异常告警。

网络是数据中心里最封闭的一个系统,对网络进行管理的软件也无法完全做到完全开源,所以那些免费的、网络上的软件都不是很好用,不得不使用网络设备厂家提供的网络管理软件,才能达到很好的适配效果。但是网络中不可能全都是一个厂家的设备,因此为网络管理带来了更大的难度。针对这一情况,智和信通公司(http://www.zhtelecom.com)推出了智和网管平台SugarNMS,可以应用在管理网络设备、计算机、服务器、智能设备、物联网、工业设备等所有联网设备;适用于国防、电信、政府、金融、交通、能源、企业、工业、制造等多种领域。能够全面监控网络设备、主机/服务器、中间件应用、Web服务。Cisco、Juniper、Foundry、Avaya、3COM、Intel、Fore、Marconi、Motorola、华为、中兴、华三、联想、锐捷、港湾、迈普、烽火、天融信、深信服等厂家的设备都能都支持。

这些工具的出现,为数据中心运维提供了极大方便,是自动化运维的具体表现。数据中心要走自动化运维的路,就需要大批地使用这些工具,通过这些工具逐渐代替运维人员的工作。运维人员通过自动化运维,将规范、常规的操作固定化,减少重复的手工操作,避免误操作。通过模板化,根据模块信息智能化分析,实现快速发单,同时串并行控制,提升模块更新效率,这就是数据中心自动化运维的时代,只有坚持走自动化运维的路,数据中心的运维效能才会有质的提升,让我们沿着数据中心自动化运维的道路坚持走下去。

时间: 2024-10-29 19:12:00

数据中心的自动运维之路的相关文章

数据中心的智能运维与节能

无人化数据中心难以实现? 如图所示,大部分运维人员理想中的数据中心是这样一种干净整洁,极少人员进出的熄灯状态.作为运维人员,减少无关人员进入机房的次数对于数据中心的信息安全非常重要. 然而,理想很丰满,现实却很骨感.现实中的数据中心往往是布线混乱,电灯长明,一出问题不管紧急不紧急就有人员进出的状况. 这种情况下,一是设备数据安全得不到有力的保障,二是一旦设备出现故障又是看设备运行提示灯状态又是查看运行日志来确定故障信息以及故障位置,耗时费力.因此,很多运维人员体会过其中的辛酸之后都在默默祈祷自己

Linux运维之路 基础篇:Linux基础命令(一)

Linux运维之路 基础篇:Linux基础命令(一) Linux哲学宗旨: 一切皆文件:把几乎所有的资源,包括硬件设备都组织为文件 有众多单一的小程序组成,一个程序制实现一个功能,组成小程序完成复杂操作 尽量避免和用户交互:实现脚本编程,以自动完成某些功能 使用纯文本文件保存配置信息 终端:用户和主机交互时用到的设备 物理终端:直接接入的设备也叫控制台/dev/console 虚拟终端:附加在物理终端上虚拟出的,默认启动六个,Ctrl+Alt(F1~F6),系统启动时,默认启动虚拟终端1,启动终

C语言 运维之路

C语言 运维之路 1.C语言 介绍 2.C语言 HelloWorld 模板 3.C语言 gcc 编译程序 4.C语言 多文件编程 5.C语言 进制 6.C语言 数据存储方式 7.C语言 数据类型 8.C语言 有符号.无符号 9.C语言 汇编了解 10.C语言 字符串  11.C语言 strcpy  功能:把src所指向的字符串复制到dest所指向的空间中 12.C语言 strncpy   功能:把src指向字符串的前n个字符复制到dest所指向的空间中 13.C语言 strcat   功能:将s

python自动化运维之路~DAY7

python自动化运维之路~DAY7 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.客户端/服务器架构 C/S 架构是一种典型的两层架构,其全称是Client/Server,即客户端服务器端架构,其客户端包含一个或多个在用户的电脑上运行的程序,而服务器端有两种,一种是数据库服务器端,客户端通过数据库连接访问服务器端的数据:另一种是Socket服务器端,服务器端的程序通过Socket与客户端的程序通信. C/S 架构也可以看做是胖客户端架构.因为客户端需要实现绝大多数的业务

基于开源打造智能云上自动运维

自动化能自动化的一切 然后介绍了使用Terraform和Packer开源工具完成云上自动运维的具体实现过程 云上自动化资源架构和变更实践 https://yq.aliyun.com/articles/218891?spm=5176.100239.blogcont159008.36.Vzs09S 如何用开源工具进行Multi-Cloud的自动化资源架构和变更? DevOps和基础设施自动化 据数据统计,在2015年DevOps的被采纳率是66%,而到了2016年就达到了74%,在这短短的一年间增加

计算机网络管理基础服务安装+大数据时代的网络运维

使用yum方式完成服务安装 ___By Nemo(仅供参考) Notice:Apache 安装好之后,我又改回桥接模式用rpm安装了. 首先,让你的虚拟机上个网,所以需要把网卡设置成nat模式,在宿主机上先拨个号,设好后重启linux系统. 重启后,打开firefox,看是不是能上网.Ok,但nat模式默认的ip是动态分配的,咱们得按照老师的要求把设成你静态的学生牌号.所以咱们得这么设一下!应该通过vmware虚拟机中-->Edit(编 缉)-->Virtual Net Editor(虚拟网络

运维之路篇---开篇心得说明

博文前言: ######################################################################### 1. 所有博文内容属于本人实践操作步骤,可能因部署环境.软件版本等因素,出现各种问题,如遇到问题     如遇到问题,可以联系下面的qq(如果有时间,希望一起研究解决) 2. 所有博文都不是最终完整版,会随着个人技术的不断提升,以及工作中研究方向的因素,不断进行完善     因此如果有内容描述错误,望给与批评建议 3. 所有博文在未标识情

python自动化运维之路~DAY10

python自动化运维之路~DAY10 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.

写了一款自动运维监控工具

AisinGioro 是一款自动运维监控工具,用于监控主机性能参数(心跳.CPU.内存.硬盘.网站连接数).网络连通性(Ping.Port.Http).监控异常通知,基于B/S架构,主要技术 .Net/C#, SignalR, OWIN, AngularJs, Bootstrap,欢迎下载使用,或进行二次开发. 开发环境 Visual Studio 2015, .Net Framework 4.6.1 项目分支介绍 AisinGiroro.Core 基础库 C# Library AisinGio