安全生产的规范和机制

安全生产的重要性



安全生产是我们的底线,随着业务的不断扩大,服务的范围变广,线上的故障和问题开始频发;这些故障给客户和公司带来了不可估量的损失,不仅影响我们在业界的口碑,更会影响客户群对我们的信任.

我们需要思考,别人为什么使用你的服务?如果你的服务故障了,用户有怎样的反响?出现故障了我们如何止损,减少对客户的影响,维护我们的价值?

如何提高安全生产



安全生产会促进我们服务的可用性,最大限度的减少线上事故率;那么我们应该从哪些方面来提高安全生产,而保护我们的客户,保护我们生产的同学呢?大致的方向主要集中在技术架构系统工具组织机制文化上.

  1. 在系统设计之初,我们就尽可能的做好系统规划,做到架构优化,架构简化; 把相同功能的系统尽量合并归并(系统改造), 减少学习系统的成本;
  2. 所有的系统必须具备容灾能力(容灾建设)
  3. 所有的代码,在上线的时候一定要确保质量(编码质量)

经过一些数据分析,有80%的线上故障是由于变更导致的,所以对变更的管控一定是减少线上重大故障的一个切面;所以我们在线上变更时一定要格外小心和谨慎;

  1. 变更管控:我们要对所有的线上变更强管控
  2. 灰度能力:所有的系统更新及上线必须具备灰度能力
  3. 监控优化:所有系统要有全方位的监控覆盖,所有的监控告警必须收敛,不能让重大关键的告警被淹没掉
  4. 应急预案:所有的系统对于会发生的或可能发生的故障以及一些问题的场景,要具备应急预案;
  5. 系统演练:光有了应急预案还不够,对于这些应急预案必须定期演练,保证预案的可靠性,确保问题出现的时候能够快速的被执行
  6. 系统巡查:定期对系统做巡查,发现潜在的问题,比如:负载, 性能...
  7. 线上压测:定期对系统进行压测,验证系统功能的同时,也对系统的容量规划起到积极作用

通过上面2个方面(设计、上线)的规范,我们已经能够应对线上的故障及风险了,但是这样的方式方法却没有得到有效的执行和管控,可能兴致高了,我们就执行一下.

所以我们要有安全生产组织这样的部门或组织来保证这些规范和机制在生产中良好运转, 通过这个组织能够保证我们的技术架构和工具能够真正落地,实实在在通过安全技术的手段来解决线上故障;

有了组织的保证,我们也要从一些点来规范我们的操作:

  1. 规范: 变更规范、灰度规范
  2. 红线: 针对规范做了安全红线, 如果没有按照规范区执行,就有可能触发红线,
  3. 问责: 触发红线,造成故障,我们要有问责标准(P,D,E…),这些标准可以来源于业务可用率,安全生产策略,故障影响等

安全生产的理念


  1. 面向失败的设计:我们在设计系统的时候,就要考虑到系统可能产生的情况和极端的问题.并且有相应的处置方案和规划方案
  2. 无灰度、不变更:所有的变更一定要通过灰度环境和我们的分批发布才能够上线,而分批发布之间一定要有间隔
  3. 变更3板斧:可灰度、可观测、可回滚

原文地址:https://www.cnblogs.com/vinsent/p/11221194.html

时间: 2024-10-24 09:45:20

安全生产的规范和机制的相关文章

长沙生态动物园n0

目前,两人已被依法采取刑事强制措施. 红网张家界分站2月23日讯(通讯员 黎国平)2月23日,湖南省张家界市武陵源区旅工委发布消息,3月8日当天,张家界国家森林公园将向全球女性免费开放. "在这条路上,我们必须停下脚步,多为消费者想想,为行业想想,共担责任,共赢未来"这是诚信服务自律联盟的一致心声.发起单位之一上海链家总经理邵非表示,"我们希望联盟成立后,通过搭建诚信服务.自律共赢的平台,实现整个中介行业持续良性发展."设纠纷调解和保证金制度 本次大秀,快乐购对T台

新华社受权发布“十三五”规划纲要 共分为20篇(

新华社受权发布"十三五"规划纲要 共分为20篇(全文/图表) 分享到: 539 2016-03-17 16:00:48字号:A- A A+来源:新华社 关键字:十三五规划全文 2016年,是中国全面建成小康社会决胜阶段的开局之年,也是推进结构性改革的攻坚之年.这一年,中国将在新的历史起点上大展宏图. 新华社将于今日下午播发<政府工作报告>和"十三五"规划纲要,其中,<政府工作报告>共分三个部分,约2万字,"十三五"规划纲要

《自己动手写框架8》:高屋建瓴,理念先行

<史记·高祖本纪>:"地势便利,其以下兵于诸侯,譬犹居高屋之上建瓴水也."这里用到了高屋建瓴这个词.意思是把瓶子里的水从高层顶上倾倒.比喻居高临下,不可阻遏的形势.现指对事物把握全面,了解透彻.此典故于汉高祖刘邦欲杀功臣韩信,大夫田肯进言到"陛下牢牢地控制着三秦(关中),陛下利用这雄险的地势,来控制.驾御诸侯,就如从高高的屋脊上把水从瓶子里倒下去."以此来表彰韩信的功劳,于是,刘邦赦免了韩信,只是将他降为淮阴侯. 同样,设计企业框架,也要对事物把握全面,

为盟结缘寿岳y6

内容简介 聂帅(聂荣臻)曾经流着泪说:"阜平不富,死不瞑目".这件事是福建省委原书记项南同志告诉我的.聂帅的那句话感人至深,我一直铭记在心.项南同志从福建省委书记任上退下来后,当了中国扶贫基金会会长.我当时是福州市委书记.他到福建来找我,希望我支持一下基金会.项南说,有一次他去看望聂帅,聂帅谈到了河北阜平的情况.阜平曾是晋察冀边区所在地,聂帅担任过晋察冀军区司令员.聂帅动情地说,老百姓保护了我们.养育了我们,我们打下了天下,是为老百姓打下的天下,阜平的乡亲们现在生活还没有明显改善,我于

《写自己的框架8》:远视眼的,理念先行

<记录·千年的皇帝>:"地形便利,秉诸侯之下,丕房子仍然排名高于高水也减龄."这里所用的词睿. 这意味着一瓶水从顶部顶部浇注. 居高临下的隐喻,阻遏的形势.现指对事物把握全面,了解透彻. 此典故于汉高祖刘邦欲杀功臣韩信,大夫田肯进言到"陛下牢牢地控制着三秦(关中),陛下利用这雄险的地势.来控制.驾御诸侯,就如从高高的屋脊上把水从瓶子里倒下去."以此来表彰韩信的功劳,于是.刘邦赦免了韩信,仅仅是将他降为淮阴侯. 相同,设计企业框架.也要对事物把握全面.了解

全新ASP框架——IISNODE介绍

Asp是一门经典的动态网页编程语言,通常使用vbscript或者Jscript脚本来实现.一个好的框架,可以帮助您更加快速地使用Asp来完成您的网站开发任务.而Asp框架的终结者——IISNODE框架,无疑就是这样一款产品. 作者:沈赟杰 官网:http://api.webkits.cn/ 交流:431804354(QQ群) 一.框架简介 IISNODE是一套有着完善机制的Asp(非Asp.NET)框架,并且使用了完美兼容nodejs的模块加载方式,易于扩充增加自己的模块.整个框架采用Asp下的

httpClient HTTP状态管理

HTTP状态管理 原始的HTTP是被设计为无状态的,面向请求/响应的协议,没有特殊规定有状态的,贯穿一些逻辑相关的请求/响应交换的会话.由于HTTP协议变得越来越普及和受欢迎,越来越多的从前没有打算使用它的系统也开始为应用程序来使用它,比如作为电子商务应用程序的传输方式.因此,支持状态管理就变得非常必要了. 网景公司,一度成为Web客户端和服务器软件开发者的领导方向,在它们基于专有规范的产品中实现了对HTTP状态管理的支持.之后,网景公司试图通过发布规范草案来规范这种机制.它们的努力通过RFC标

俄官员说美国yd

1971年5月至1998年12月工作期间,何宗志先后任四川省巴中市南江县.巴中市公安局政委,市委常委.市公安局局长等职务. 会议强调:要着眼全局,做好信息参谋工作.紧扣"五区"会战开展调查研究,紧贴县情民意着力以文辅政,紧跟时代步伐敏锐捕捉信息.要突出实效,做好督促检查工作.着力决策督查,抓实专项督办,提高督查实效.要规范程序,做好综合协调工作.办文办会规范高效,后勤接待精细优质,机要保密安全畅通,绩效考核激励到位,小康改革全面统筹.要学练结合,提高队伍整体素质.坚持学习提升,打造素质

总结了Struts1与Struts2的12点区别

1) 在Action完成类方面的号码大全比照:Struts 1需求Action类承继一个笼统基类关键词挖掘工具:Struts 1的一个详细问题是运用笼统类编程而不是接口.Struts 2 Action类可以完成一个Action接口,也可以完成其他接口,使可选和定制的效劳成为可能.Struts 2供给一个ActionSupport基类去完成常用的接口.即便Action接口不是有必要完成的,只要一个包含execute办法的POJO类都可以用作Struts 2的Action. 2) 线程形式方面的比照