筑一座五军集结的长城:保障运维世界

张艺谋导演执导的电影《长城》,且不说电影中的故事设定和剧情如何,屹立于山巅上的万里长城和觊觎于长城外的无餍饕餮却着实令人震撼。笔者不禁思考:在我们运维领域,不也存在这样一群“饕餮”吗?它们时而神出鬼没,导致系统故障,却又难以定位;时而无影无形,在平静下暗藏隐患;时而兵临城下,集中式爆发,导致业务崩溃。

运维,我们也需要这样一座“长城”,集结“鹤、鹰、虎、熊、鹿”五军,共同抵御和消灭随时到来的“饕餮”。Automation正是这样一道不断完善的大型“工事”,集结各方军队,共同为运维世界筑起坚实的长城,快捷自动地解决运维工作中出现的问题,让运维世界里的我们过上幸福祥和的日子。

鹤军——信息总览界面

鹤军,如鹤般优雅灵动,俯视全局。Automation的总览界面能够让我们轻松地了解全局,能查看所有被管主机、服务和编排的数量,可了解最近24小时作业执行汇总、最近30天的作业执行情况等,能够直观了解运维全局。拥有“鹤军”,我们就能够统领全局。

我们可以点击具体的状态分类(如“执行成功”),或者某次具体的作业,了解作业的详细执行过程和结果,从而做进一步的判断和处理。

鹰军——巡检和故障自愈

鹰军,目光如鹰般敏锐,时刻提防远处的敌人。Automation内置系统巡检和故障自愈功能,恰如苍鹰一般时时刻刻扫描可能出现的指标异常、运行崩溃、未按预期工作等突发状况,进行预定策略自动修复。

在巡检方面,Automation内置了常见的巡检项,也可以根据需求编写更多巡检操作。然后将这些操作任意组合,形成一个巡检编排,就可以对大批量的主机进行定期检查。每当巡检完成后,可以自动生成一份报告,发送给指定人员。

故障自愈方面,可以定期监控某对象(比如MySQL数据库)运行状态、指标的脚本,当发现结果异常的时候调用对应的操作进行处理,从而达到故障自愈的目的。

拥有“鹰军”,我们就能够及时发现并处理突发情况。

虎军——强大的操作和编排

虎军,如猛虎一般,掌握长城内务的重型机关。Automation内置种类丰富的操作和编排,并提供包括Python、Shell、VBS、Bat在内的多种脚本语言支持,可利用这些脚本语言自由扩展运维操作。

内置丰富的操作:

自定义扩展操作:

每位运维工程师都可能会有“独家脚本”,正是依靠着它们实现了日常运维的需求,比如说软件的装卸、服务启停、系统检查等。然而这些脚本可能只能解决某个单一的问题,无法适用于复杂的运维场景,没能发挥出这些“士兵”的最大价值。Automation提供可视化的编辑能力,能将这些“士兵”编排起来形成强大的阵法,真正发挥出“虎军”的强大威力。拥有“虎军”,我们就能够游刃有余地应对各类需求。

熊军——开放简洁的API

熊军,短兵相见,以身相搏。Automation的OpenAPI体系提供非常便捷的集成能力,OpenAPI基于RESTful协议提供,支持任意技术集成。这样我们可以在特定的主机上运行其他业务程序,当需要实现自动操作时,比如创建虚拟机、部署应用、创建账号等,便可利用我们的利刃—OpenAPI来完成使命。拥有“熊军”,我们不再惧怕强大的“怪兽”可以联合起具有各种特殊能力的友军,勇往直前。

鹿军——底层通信和消息通知

鹿军,禁军中的骑兵,速度是其利刃。Automation底层基于高效的消息队列实现,能够在数秒内完成单台Proxy与数千台Agent的即时通信(比如说指令的下发、结果的返回等),从而保证操作任务和文件的即时执行或下发,让管理成千上万台主机变得像管理单台主机一样轻松方便。

在作业执行失败,异或巡检或监控指标异常的时候,能够通过站内信、邮件、短信、社交工具等多种方式及时地通知相关负责人,从而使得及时处理成为可能。拥有“鹿军”,我们便能够快速执行,并能及时发现问题,及时处理。

在运维的世界中,有了Automation,即便一波又一波凶猛的“饕餮”来袭,我们也能够集结“五军”之力将之消灭。借助“鹤军”了解概况、综合分析,借助“鹰军”全面巡检、防患未然;借助“虎军”快速操作、批量作业;借助“熊军”灵活调度;借助“鹿军”提高效率、及时获取最新消息。未来Automation也会加入更多的军种,比如灵活便捷的编排DSL、插件化Agent体系等,共同抵御随时到来的“饕餮”!

时间: 2024-08-28 09:20:30

筑一座五军集结的长城:保障运维世界的相关文章

[运维] 第五篇:数据中心改善运维,ITIL与ISO20000如何选择?

企业数据中心需要改善运维现状,提高运维水平,更好的为业务服务,ITIL肯定是不二的选择,因为毕竟ITIL是运维方面的最佳实践.但是ITIL只是告诉你如何才能提高运维能力,但是并没有告诉你怎么才能在你的企业里做好ITIL的落地工作,进而真正对运维发挥效果,所以具体怎么做,还是得你按照ITIL的理念去结合企业实际情况去落地.落地的时候你可能会有两个选择,是通过ITIL流程落地呢?还是去通过ISO20000认证呢?          因为本文不是讲ITIL和ISO20000的帖子,所以具体的讲解可以通

十五个值得你熟练的运维命令,助你排查问题666

操千曲而后晓声,观千剑而后识器.常用的套路快来动手练练吧 1.系统中搜索代码字符串grep -rn "字符串名" 搜索路径grep -rn “xxx” / 2.查看端口开放情况查看所有端口nmap 下面表示扫描A机器的1到65535所有在监听的tcp端口.nmap 10.0.1.161 -p1-65535 查看某个端口netstat参数解释:-l (listen) 仅列出 Listen (监听) 的服务-t (tcp) 仅显示tcp相关内容-n (numeric) 直接显示ip地址以及

《霍比特人:五军之战》片尾曲 最后的再见MV

中土世界终章,<霍比特人:五军之战>片尾曲,由<指环王>三部曲中扮演皮平的比利·博伊德参与创作并演唱的“最后的再见”(The Last Goodbye),日前发布MV,博伊德录音画面与中土世界六部影片台前幕后的片段交织剪辑,烘托出深沉哀婉的气氛. <最后的再见>将随<五军之战>的片尾字幕一同播放,博伊德在接受<娱乐周刊>采访时表示,“我们必须创作出合适的歌曲,用最完美的方式将观众送出影 院”,他说自己是在飞往新西兰的航班上,一边看着电影,一边开始

cocos2d-x-3.4-025-仿霍比特人3五军之战片尾动画

原文同步发布于我的wiki,查看原文或更新请移步: 点击打开链接 <霍比特人3-五军之战>结尾是什么样子的? 主角的图片播放fade in fade out动画 在1过程中fade in时图片略有放大 图片上面有文字,文字无动画(这里涉及到素材的准备,图片,文字等,这一点先忽略) 非动画元素,背景音乐,<The Last Goodbye> 思路 fade in fade out动画,cocos的cpp-tests里面演示的transitionCrossFade和这个效果比较相符 背

Linux运维 第二阶段 (五)权限管理

Linux运维第二阶段(五)权限管理 一.权限管理(解决用户和身份不足的问题) >#dumpe2fs  -h /dev/sda2             (查询指定分区详细文件系统信息的命令,-h仅显示超级块中的详细信息) #mount  -o remount,acl  /             (重新挂载根分区,加入acl权限) >acl基本命令: #getfacl  文件名                      (查询文件的acl权限) #setfacl  -m  u:用户名:权限

Linux运维课程 第一阶段 重难点摘要(五)CISCO

Linux运维课程第一阶段重难点摘要(五)CISCO 一.高级路由管理 1.        路由:数据包从一台设备通过网络发往另一台不同网络中的设备,路由器不关心这些主机,它们只关心网络和通向每个网络的最佳路径.目的主机的IP地址用来保证数据包可以通过路由到达目的网络,而主机的MAC地址用于将数据包从路由器投递到目的主机. 静态路由:由管理员手动输入到路由表中的路由:不占用带宽,不会随着网络拓扑的变化而变化,缺少灵活性: 动态路由:通过动态学习得到路由:占用网络带宽和CPU资源:会随着网络拓扑的

五年屌丝运维工作shell精华

屌丝运维常用shell列出你最常用的10条shellhistory | awk '{a[$2]++}END{for(i in a){print a[i] " " i}}' | sort -rn | headhistory | awk '{a[$4]++}END{for(i in a){print a[$i] " " i}}' | sort -rn | head grep -v "#" .bash_history |awk '{++a[$1]}EN

Linux运维 第五阶段(四) corosync&pacemaker

Linux运维 第五阶段(四)corosync&pacemaker 一.相关概念: 补充 { what is high Availability? A=MTBF/(MTBF+MTTR) MTBF(mean time betweenfailures平均无故障时间) MTTR(mean time to repair平均修复时间) two ways improve availability? increase MTBF to very large values reduce MTTR to very

Linux运维 第五阶段(九)iSCSI & cLVM & gfs2

Linux运维 第五阶段(九)iSCSI&cLVM&gfs2 gfs2(global file system version2,全局文件系统,CFS集群文件系统,利用HA的信息层,向各node通告自己所持有锁的信息) cLVM(cluster logical volume management,集群逻辑卷管理,将共享存储做成逻辑卷,借用HA的心跳传输机制(通信机制,对于脑裂处理的机制),各node要启动clvmd服务(此服务启动前要启动cman和rgmanager),使得各node彼此间通