推广项目架构体系不断完善已经发展到3台云服务器和105台拨号服务器,其中2台云服务器和71台拨号服务器同时支持老版架构项目的运营和新版架构项目的测试。2台云服务器是每个月底续费,71台拨号服务器分两个时间段提前两天续费,十一假期的提前休息导致了云服务器的漏续费。
推广项目整个平台的开发和维护由两个人组成,我负责项目的开发和部署,另一个朋友负责服务器的购买和环境搭建。一时的疏忽在10.1号凌晨00:45暴露出问题,当时我还在做着美梦,突然接到运营后台奔溃的电话,此时才想到服务器没续费。打了好几个电话才联系到运维,可能他也在呼呼大睡,打电话的同时我也在确认问题,联系上后问他是否可以续费马上恢复。
云服务器不同于拨号服务器,以前拨号服务器忘续费的时候,服务器会被托管到回收站三天,三天时间内即时续费马上就可以运营,拨号服务器上没有核心数据我们也不会担心数据丢失。我们从未处理过ucloud云服务器的忘续费问题,当时看到后台确实也在回收站,我们的想法就是尽快续费看是否可以恢复,如果回收站都没有了,那么项目的数据将是灾难性丢失产生的损失也将委实不小。运维朋友联系财务大概花了1个小时的时间续费重启服务器和初始化数据,所幸数据没有丢失,但是我们两台云服务器的IP都变了。因为基于业务场景我们没有绑定域名,所有项目都是通过IP接口直接交互数据的,现在所面对的问题就是将所有云服务器上18个工程和拨号服务器上71个工程全部修改更新IP,同时将数据方对接和结算的工程IP都要变更。为了保证项目尽快运营,虽然任务比较重,但是好在任务明确,大概到早上6:00左右工程修改测试完全,吃个早餐可以安然入睡啦!
这次的事件风波都由未续费引起,如果能提前通知续费就不会浪费一晚上的好梦!从中看到的不只是提前续费,项目与项目之间IP做成可配置也能减少大部分的工作量,新版架构也确实将各种配置参数设计成了灵活的数据传输,只是为了节省服务器开支将老版架构和新版架构放到一起碰到了忘续费产生的悲剧,更重要的是这将时刻警醒这我任何时候都要做好数据备份.....
原文地址:https://www.cnblogs.com/xx0829/p/11640789.html