运维生存时间呕血之作:网站运维黑锅如何甩

常见经历

讲几个工作中经常遇到的一些时间,或许你也遇到过,高高兴兴上班来,刚打开电脑,出现如下情况:

  1. 领导跑过来问昨天网站访问很慢,服务器又出问题了
  2. 客服跑来说福建地区XX市有用户说网站打开很慢,服务器又出问题了
  3. 老板说昨天他在家里打不开网站,服务器又出问题了
  4. 技术总监说昨天刚上CDN,你看看效果如何
  5. 销售部问能不能看看全国各地区访问咱们网站的速度如何,以及如何改进
  6. 还有更多关于网站运维的黑锅,欢迎大家列举...

为什么出了问题总认为是运维的原因?

说个题外话,在一家公司竟然遇到以前的同事,见面寒暄几句,他说了一句让我至今难忘的话:“还是你们运维轻松,每天什么是都不要干,只要盯着屏幕就好了,盯着服务器是不是有问题”。

网站访问慢的原因

  1. 1、服务器故障
  2. 2、程序逻辑有问题,导致响应慢
  3. 3、网页某个元素慢,导致整个页面慢
  4. 4、用户网络环境慢
  5. 5、南电北网互通慢

运维的烦恼

有人提议用zabbix试试,作为单节点的运维监控工具,zabbix确实功能强大,但是它做不到全栈的网络性能监控,你以为zabbix是大神么,呵呵,过去的事情我不可能知道,某某地区的访问情况我也不会知道,我只有一台服务器。有人说用网页测试软件来试试吧,可是他只是一个普通的get,然并卵。

解决方法

最终这些影响网站访问的问题还是能得到良好解决的,云智慧的监控宝就是不错的选择,里面的页面性能管理和网站监控能让你甩掉不必要的黑锅。话不多说,上几个图:

监测点对比

网页性能管理

全国几十个省份,武汉电信垫底。

当前列出了所有监控点的页面打开时长数据,可以看到各地区的性能评分以及响应时间

时序图

各资源响应时间

网页慢了,有可能是网页上某个元素拖垮的,可以监控到网页上各个元素的加载情况(用过firebug的都知道),我们可以知道DNS解析时间、建立连接、发送请求、等待、接收数据所消耗的时间,和firebug基本一模一样。上图可以看到,各个资源的各种时间都详细的列出来,我们能很精确的分析出问题到底出在哪个网络环节。

网页性能管理 - 请求/响应头

可以看到服务器响应头,一般head里面包含文件过期时间、CACHE命中情况等等,都是一些有助于排查问题的信息。

网站可用率

获取某一天的可用率,上图可以看到上海科教网可用率为75%,没听过,可用率低或许是理所当然的事情。

怎么实现的

监控宝提供了网页性能管理这个功能,只需要简单的配置。登陆后台,点击“监控”-》网页性能管理-》创建监控项目。

创建监控项

检测节点

云智慧赠送给运维生存时间的帐号,一共有三十多个监控节点可供选择,企业版账号可以选择遍布全国以及海外主要城市100多个监控点,包含各个地区,各种网络。监控频率选择15分钟,频率越小数据越丰富。

告警配置

运维可根据自身业务的SLA定制告警触发器,比如,如果任意一个节点响应时间超过5000ms即发送告警,告警方式有Email、短信、微信和电话语音。你可以根据告警状况的严重程度选择合适的告警方式。

检测配置完成

最后

如果你正在被各种网站运维问题所困扰,试试监控宝的网页性能管理吧,不但可以满足老板、领导、同事的各种坑爹需求,还能第一时间发现服务器和网络故障,把用户投诉消灭在萌芽状态,从此不再背黑锅。

云智慧官网:www.cloudwise.com

时间: 2024-08-28 17:24:16

运维生存时间呕血之作:网站运维黑锅如何甩的相关文章

运维工程师告诉你什么是大型网站运维

首先明确一下,全文所讲的"运维"是指:大型网站运维,与其它运维的区别还是蛮大的:然后我们再对大型网站与小型网站进行范围定义,此定义主要从运维复杂性角度考虑,如网站规范.知名度.服务器 量级.pv量等考虑,其它因素不是重点:因此,我们先定义服务器规模大于1000台,pv每天至少上亿(至少国内排名前10),如sina.baidu. QQ,http://51.com等等:其它小型网站可能没有真正意义上的运维工程师,这与网站规范不够和成本因素有关,更多的是集合网络.系统 .开发工作于一身的&q

Web 应用性能和压力测试工具 Gor - 运维生存时间

Web 应用性能和压力测试工具 Gor - 运维生存时间 undefined 无需花生壳,dnspod实现ddns - 推酷 undefined

要成为linux网站运维工程师必须要掌握的技能

我是一名linux运维工程师,确切的说是网站运维工程师,从事linux工作有2年多了,对这方面有一些体会,给新手一点借鉴: 首先说下运维种类:有办公网系统运维(就是网管),有IDC外网运维,外网运维里又分网站运维.游戏运维.IDC运维(装系统排障),监控运维(盯着监控).我强烈建议大家选择linux网站运维路线,这个路线绝对是最好的,会了网站运维了去做别的运维岗位绝对也是信手拈来的,网站运维需要的技术点更多,因此,我以我工作的网站运维岗位说说运维都需要啥. 1.选择linux系统选择linux系

IIS日志-网站运维的好帮手

原文:IIS日志-网站运维的好帮手 对于一个需要长期维护的网站来说,如何让网站长久稳定运行是件很有意义的事情. 有些在开发阶段没有暴露的问题很有可能就在运维阶段出现了,这也是很正常的. 还有些时候,我们希望不断地优化网站,让网站更快速的响应用户请求, 这些事情都发生在开发之后的运维阶段. 与开发阶段不同的,运维阶段不可能让你去调试程序,发现各类问题, 我们只能通过各种系统日志来分析网站的运行状况, 对于部署在IIS上的网站来说,IIS日志提供了最有价值的信息,我们可以通过它来分析网站的响应情况,

网站运维之 域名解析与备案

h4 { padding: 8px 5px; background-color: #32c5d2 } .start-box,.body { padding: 10px } .tit { font-size: 14px; font-weight: bold } 引言 对于网站运维是一个比较要细心有耐心的工作,当一个网站从开发到上线后,后期的维护也很关键,特别是对于引流的网站来说更是至关重要. 对于网站运维的内容大致可以分为: SEO流量监控方面:风险防控:访问速度优化等方面. 我整理了一些个人的经

网站运维技术与实践之服务器监测常用命令

一.监测的意义 不论是网站运维还是系统管理,服务器本身的运行状况都是我们需要掌控的基础资料.在<打造FaceBook>一书中,王淮介绍FaceBook的工程师文化中有一句"Move Fast and Monitor Closely".这个"Closely"有两层意义,其一是"即时"的,要从系统开发初期,就有意识地设计好配套的监测,并逐步改善:其二是"深入",监控不能仅仅停留在监测主机负载.网卡流量的表面层次,而要尽

网站运维技术与实践之集群架构规划

集群架构规划和设计只要是涉及到高并发高流量的项目,基本上都需要. 本文主要围绕两个方面,一个是IDC的规划和选择,另一个是CDN. 一.IDC的规划和选择 IDC的选择是网站上线前要做的最重要的事情之一.哪怕发展初期只有一台服务器,选择一个位置不错的机房托管,都会助益良多. 也许有人会问IDC是什么? 我引用百度百科来回答: IDC为互联网内容提供商(ICP).企业.媒体和各类网站提供大规模.高质量.安全可靠的专业化服务器托管.空间租用.网络批发带宽以及ASP.EC等业务.IDC是对入驻(Hos

[运维] 第一篇:数据中心运维模型之我见

从实际经验来看,每个企业的数据中心运维上都不会是十全十美的,因为毕竟企业业务发展是迅速的,对IT的要求相应也是也是越来越高,越来越复杂,所以无论是在运维团队架构上,还是在具体的管理层面上,尽管现实空间有限,但都有很多值得调整的空间和余地,且听我道来!         先看看这张运维模型,了解一下企业运维到底包括了那些东西:        企业运维包括了四象限:人员.管理.工具和业务.对于人员,通常企业有两种结构:一种是功能性驱动,比如机房维护团队.IT基础架构运维团队.应用维护团队等:另一种是管

GOPS2017全球运维大会深圳站——国内顶级运维专家云集

GOPS在2016年从深圳出发,当时门票提前几周收盘,一年之后承载着运维人的期望,GOPS再次来到了深圳.第六届GOPS2017全球运维大会  深圳站(本次)将于2017年4月21日-22日在深圳举行,历届金牌讲师精选亮相,各种精彩等您发掘. [大会亮点] 一.众多国外重量级嘉宾在路上 目前正在和各位大咖商榷行程中,主会场更配置了同声传译,让你在国内也能听到国际范的运维经验分享:) 二.国内顶级运维专家云集 前5届GOPS已经汇聚了众多运维行业的大咖,他们有来自精益运维的王津银:腾讯的党受辉.熊