运维一个应用系统不容易

关于项目,有一个定义是:项目是创造独特产品、服务或其他成果的一次性工作任务。

项目并非实现产品经理的需求就完事了。 当项目投产后,在用户使用的过程中,会遇到千姿百态的问题。相当长的一段时间里,开发人员可能会疲于应付处理这样的问题。 运维一个应用系统不容易呀,那么,为什么会投入这么多时间呢?可能包括用户对业务逻辑的不够清楚,包括程序实现的bug,包括逻辑的复杂,包括线上运行过程中突发的事故。 而这些,往往并不在产品经理的需求范畴里, 所以,在系统实现方面,还应考虑应用系统的运维功能,包括:

监控

系统在运行过程中,难免会因为服务器问题或网络问题导致挂了, 所以,存活性监控是必不可少的。

业务监控:比如短信平台出现过被恶意攻击的情况,客户通过代理伪造了很多的手机号和IP最终触发了我们的短信通知。 像这种情况,应该做一个监控,如果某段时间里短信下发量突然暴增,就要告警并给予关注了。

我曾有一篇监控的文章《Promise计算模块验证和监控》。

当然,性能监控是更高阶的要求了,比如系统吞吐量(TPS)、TP99指标;服务器的disk io、cpu、memory、net io监控不在话题内,略过。

运营支持工具

以差旅订单通知系统为例,客户反映,说你系统出现问题了,你开始向客户索要相关信息,然后排查程序,写一大堆的sql,这样一来,个把小时过去了,你终于把客户的问题解决了。

再以审批系统为例,客服找你,说某个订单,客人手机出问题了无法通过短信审批,你帮忙改下订单的审批状态吧。你开始写sql,改审批单状态,改订单状态,然后,向领导申请,找运维人员在生产环境执行sql。然后,告知客服改好了,客服再告知客人。这样一来,估计快也得半小时。

初看起来,处理系统问题,不就是这么回事嘛。  作为一名项目管理者,我喜欢从成本和绩效的角度考虑,这种处理问题的方式,首先浪费了开发人员的时间,而且这种重复性的工作并不能产生多少业绩,所以一些程序员喜欢抱怨自己的工作没意义也不足为怪。其次呢,如果程序员手头又在参与新的项目,这会令他们无法专注于眼下的工作,事儿多容易乱。那么,我们就要想法对这样的工作say goodbye! 运营支持工具就派上用场了,以上面的帮助客服修改订单审批状态为例,开发一个这样的工具,当客户再有这样的需求时,一个文本框一个按钮就搞定了(条件可以的话,把这个工具交给客服操作,我们程序员就解放了)。

从全局的角度看,这样也节省了客服的工作效率。她们会感谢你的。

运营手册

系统在使用过程中会出现各种你想不到的问题,

即使前期的需求做的多么完美(实际情况下,多数的产品设计出来的需求,在投产后,很多的问题是产品事先没有考虑到的)。

技术方面,用户异常输入致使字段类型长度不够、static的误用、内存的泄露、nullpointerexception。。。等等,无法避免。

不断的迭代,回归测试不足是常态,导致新功能满足了原有功能遭殃了。

好脑袋不如烂笔头。我们需要一个系统运营手册,以日历的形式记录日常出现的问题,常见的原因,解决方案,或者需业务上哪些人给予协助。 遇到过的技术问题和技术解决方案。同样,记录备忘性的内容,比如依赖的上下游系统的接口、联系人。

要说明的是,对于团队项目,这些文档要放到svn等版本管理工具里,大家共享共同更新。

温故而知新。运营手册不是整理完了就放那儿不管了,要定期review,对常见的运维内容,提炼出共性,作为新的需求来有针对性的进一步升级系统,如此以来,问题将会逐渐变少,并能hold住。

BTW,如果系统易主,这对于接管的团队来说,是非常宝贵的资源。

异常错误检测和补偿

一个定时跑批服务,可能会因为服务器异常,导致某次该跑但未跑。

一个批处理程序,可能因为某条记录的“非法”数据,导致漏掉了该条记录的处理。

涉及到完整的业务流程处理的,可能会因为事务得不到很好的控制,而导致数据不一致。 同样,对于分布式系统,数据不一致更常见。

以上情况,在系统运行过程中,我们一定会遇到。 我们要对系统的这些异常数据进行检测,检测是手段,检测不是目的,目的是要将数据调整过来,不一致的调成一致,缺失的数据想办法补充或直接废除。

通过以上方面的努力,我想,运维一个应用系统将会变得更容易!同时,我们得以解放出来,去专注于更多的工作。 拙文写的比较糙,还有更多更好的实践方案还需再积累,也期待和大家一起交流。

时间: 2024-10-10 02:40:48

运维一个应用系统不容易的相关文章

django 运维工单系统

此工单系统从立项到完成,大概用了1个星期,可能部分思路和实现有所不妥,欢迎指正. 朋友公司想做一个运维工单系统,他没思路,正好我最近打算写一个运维工单系统,初步打算和我目前做的cmdb系统结合起来,于是简单写了个. 简单说下实现思路: 1.标准工单,(参考上家公司的工单系统,对工单做了分类,且每个分类下有对应的审批人和执行人) 2.新建工单(用户从上边的标准工单可以进入对应的工单申请,分为保存和提交两种状态,用户提交后将无法在修改,暂缺一个时间控件,任务类型默认为点击进入的类型,但允许用户进行修

运维自动化之系统部署(一)

运维自动化发展历程及技术应用 安装程序 CentOS系统安装 系统启动流程: ??bootloader-->kernel(initramfs)-->rootfs-->/sbin/initanaconda: 系统安装程序 ?? gui:图形窗口 ?? tui: 基于图形库curses的文本窗口 安装程序启动过程 MBR:isolinux/boot.cat stage2: isolinux/isolinux.bin 配置文件:isolinux/isolinux.cfg ??每个对应的菜单选项

【安全运维】linux系统加固(第二部分),经测试可行

前言 接续系统加固第一部分未完的内容,第二部分主要涉及关闭多余的服务,用户账户的安全策略,以及内核网络参数的优化等等. <修改系统默认的账户密码策略> 这是通过编辑  /etc/login.defs  文件相关内容实现的.和前面一样的道理,修改前需要备份,然后把"鸡蛋"放在多个"篮子"里: [[email protected] 桌面]# cp -p  /etc/login.defs /etc/login.defs_backup 使用 vim 文本编辑器编

运维自动化之系统部署

运维自动化发展历程及技术应用 什么是自动化的安装部署操作系统? 在工作中我们可能经常部署很多台主机,手工的一台一台的安装只适合主机非常少的情况,但大的互联网公司在一些特殊的日子要部署大量的主机,以应对要到来的特大流量访问.这时候我们就不能,一台一台的安装主机了,一是效率太慢,二是太累,三是费时间.基于这个情况我们可以自动化的一起部署很多的主机,而不用我们人工一台一台的去安装部署,节约了大量的时间. centos 6的启动流程 1.POST开机加电自检 2.MBR 读取硬盘mbr引导的前446字节

论运维工程师,系统工程师,系统架构师的区别

系统架构师主要负责系统前期的拓扑图(蓝图)的规划,搭建. 系统工程师主要负责建设系统架构师的蓝图建设 运维工程师主要负责系统后期的维护.

20160929老男孩运维视频L4-01系统定时任务crond理论详解

Linux日志默认存放位置 /var/log/ 轮询任务和用户任务 crond 命令 默认的设置crond用户的文件 /etc/crond.deny  #这是不准使用crond的用户就写时这个文件内 /etc/crond.allow #能使用crond的用户写入这里 /var/spool/cron/ #这是放crond命令文件的地方 crontab 命令格式 crontab [-u 用户名] [文件路径] crond的文件写入格式 ***** /文件与命令 解释 分 时 天 月 周 /文件与命令

【sehll学习】linux运维一个简单shell脚本监控系统内存

学习shell脚本入门后,慢慢要尝试编写一些脚本练练手,在这先简单的学习写个系统内存的监控. 1.首先先要确定一下截取一下需要关注的内存使用值,可使用free 命令来操作 free -m 显示 一般在监控内存是我们都是截取 第三行(-/+ buffers/cache)的值.确定后可以使用管道线和grep命令来获取这个的值. free -m | grep - | awk  '{print $4}' 获取到他的值为  858 当中 grep -  就是匹配一下要选取的内容,不太熟悉的可以学习一下gr

【系统运维】CentOS系统MySql,Tomcat和Django自启动

django自启动 编辑启动脚本 cd /etc/rc.d vi rc.local 添加Django启动脚本 把启动程序的命令添加到/etc/rc.d/rc.local文件中 python /usr/local/WebServer/src/manage.py runserver 0.0.0.0:80 & MySQL自启动 转到自启动脚本目录 cd /etc/init.d 查询启动程序 chkconfig –list  系统自带的mysqld系统服务已经生成 添加启动程序 chkconfig  -

运维自动化之系统部署(kickstart、PXE)

anaconda anaconda负责安装系统向导,默认为GUI界面,如果我们使用ks自动应答安装的话建议使用TUI界面来安装 在安装启动界面我们可以按esc键来自己手动指定安装启动选项 anaconda选项: 1)linux askmethod 在稍后的安装中手动选择安装源 本地光盘.硬盘.NFS.FTP.HTTP 2)linux dd 加载驱动盘 3)linux ks=xxx   指定安装ks文件 DVD drive: ks=cdrom:/PATH/TO/KICKSTART_FILE Har