大家好,很高兴向大家介绍一下高精度秒级监控
很高兴的告诉大家,阿里云弹性公网IP即日起支持高精度秒级监控了。而令人激动的是,这可能是史上最好用的实时业务流量监控功能,没有之一。
众所周知,弹性公网IP(EIP)承载了海量的互联网BGP流量,这些流量实时性要求很高,对公网带宽的质量要求也很高。如果公网带宽跑满未及时扩容,很容易出现业务流量限速丢包,进而引发客户端访问质量恶化的和用户体验的直线下降。
对于极度关注和珍视用户体验的互联网内容提供方,是十分在意互联网流量的实时监控的。如果业务流量超过预设的门限要及时扩容带宽以支撑业务的快速发展。
但令人沮丧的是,当前给业务流量监控提供的精度都是分钟级的。以分钟为精度的数据虽然可以反映业务流量的情况,但精度是有限的。互联网的业务流量在很多时候呈现较大的突发性,有可能在一分钟内流量的实时带宽峰值已经跑到了200Mbps,但在以分钟为维度的平均带宽值却只有100Mbps或50Mbps。这种低精度监控数据会导致工程师无法真实的感知自身的实时业务带宽使用量。极容易出现被用户吐槽体验差,但无法快速排查出导致体验差的瓶颈在哪里。
今天,阿里云借助强大的自身研发能力和产品化能力,为用户提供了秒级业务流量监控能力,监控精度提升到1秒,较之前的精度提升了60倍。借助秒级监控功能,用户可以实时的掌控瞬息万变的互联网业务流量波动情况。
高精度秒级监控产品介绍
当前秒级监控仅在印度地域上线,后续会逐步全地域放开。
开启秒级监控
在弹性公网IP的控制台二级目录下多出来了一个高精度秒级监控选项,点击后可以进入到高精度秒级监控列表页。列表页会把该地域下的所有弹性公网IP列出,可以在右侧的操作列点击开启秒级监控功能。
高精度秒级监控依托于阿里云日志服务功能提供完善的日志存储、报表、告警等功能。使用高精度秒级监控需要先开通日志服务功能。
第一:您需要首先开通日志服务。
第二:之后可以手工创建log project和logstore,也可以直接点击下图中的点击开通。
需要注意的是,日志服务每个月是有500MB的免费额度,超出后是收取存储费用的,请关注您的日志存储数据量。
在成功开通后,您的高精度秒级监控列表页的秒级监控状态会变为"已开启"。
您可以点击下图所示的监控图标来查看具体弹性公网IP的秒级监控报表。
高精度秒级报表
秒级监控报表当前分为如下几部分
- 入方向和出方向的秒级带宽峰值
单位为Mbps,统计时间间隔和精度为1秒。
如下图所示,蓝色的为入方向流量秒级带宽峰值,出方向秒级带宽峰值为红色。
- 入方向和出方向的秒级包速率
单位pps,即每秒钟的数据包个数。
- 入方向和出方向的秒级丢包速率
- 入方向和出方向的TCP连接速率
上述的所有报表,都可以单独设置查看时间窗口,比如查看当前1小时的的流量统计情况,或查看30天以内的流量统计间隔。
高精度秒级监控高级功能
实时业务流量汇总查看
当前高精度秒级监控支持查看多个已开通秒级监控实例弹性公网IP的带宽峰值汇总统计,就是将多个弹性公网IP作为一个整体查看业务流量的带宽峰值和各种业务流量指标。
您仅仅需要在控制台把过滤条件去除即可查看当前地域下所有开通秒级监控的弹性公网IP的汇总业务流量情况。
我们即将支持任意组合的多个弹性公网IP业务流量的汇总统计和查看。
流量报表实时自动刷新
之前的监控报表大部分都需要支持手工刷新查看,弹性公网IP的高精度秒级监控支持自动刷新功能。
点击自动刷新后,秒级监控就会自动刷新,彻底解放双手。
设置告警阈值并发送告警
如果业务流量出现丢包的时候,可以将告警信息以短信,邮件方式发送,并可以通知机器人,自动调整程序进行告警的处理。
高精度秒级监控技术架构
如果用传统的技术架构去实现高精度秒级监控,技术上实现代价会很大。十分有可能降低物理设备的转发性能。但阿里云采用了创新的技术架构和先进的技术工具实现了高精度的秒级监控。具体的技术架构和技术手段待后文详细分解,敬请关注本作者的后续的云栖文章。
一些不足
第一次查看报表时,日志服务需要建立索引,所以需要等待一分钟。后续查看则无需任何等待,即点即看。
第一次使用时,点击确定,等待一分钟后刷新即可。后续再次查看,无需等待。
当前的对话框的提示也不够友好,本周就会改掉。
原文链接请添加链接描述
本文为云栖社区原创内容,未经允许不得转载
原文地址:http://blog.51cto.com/13866390/2144983