Ess报警任务全新升级

摘要: AutoScaling(弹性伸缩) 报警任务迎来全新升级,本次升级从监控范围,监控方式,监控响应速度等三个方面做出了全方位的优化,升级后的 AutoScaling 报警任务将您提供一种更全面,更可靠的利用报警任务动态管理 AutoScaling 伸缩组的方式。

AutoScaling(弹性伸缩) 报警任务迎来全新升级,本次升级从监控范围,监控方式,监控响应速度等三个方面做出了全方位的优化,升级后的 AutoScaling 报警任务将您提供一种更全面,更可靠的利用报警任务动态管理 AutoScaling 伸缩组的方式。

本次的升级内容主要包括:

  1. 增加了对系统磁盘,网卡,TCP连接数等监控指标的报警任务支持。
  2. 报警任务最小统计周期升级到 1分钟,提供更灵敏的监控报警。
  3. 增加自定义监控,为用户自有监控系统接入 AutoScaling 报警任务提供标准化方式。

AutoScaling 报警任务

AutoScaling 报警任务是 AutoScaling 与 云监控服务(CMS) 深度合作,提供的一种动态管理伸缩组的方式,类似于 AutoScaling 定时任务,AutoScaling 报警任务通过触发您指定的伸缩规则来执行伸缩活动,达到调整伸缩组内实例个数的目的。

定时任务可以在您指定的时间执行您指定的伸缩规则,当业务场景在时间上可预料时,能够提前做出响应,但是,在面对突发或者时间上不可预料的业务场景时,定时任务就显得捉襟见肘,此时,就需要报警任务来提供更灵活的触发伸缩规则的方式,在业务高峰期增加伸缩组内实例数量来缓解业务压力,在业务低谷时释放伸缩组内实例,减小生产成本。

报警任务通过监控特定的监控指标,对数据指标进行实时的统计,当统计值满足您指定的报警条件时,触发报警,执行您指定的伸缩规则。使用报警任务,您可以实时的根据业务的变化来不断调整伸缩组内的实例数量,保证您监控的指标维持在您期望的范围内。

AutoScaling 系统监控报警任务

AutoScaling 系统监控报警任务的监控指标是云监控为用户采集的 ECS 实例的相关数据指标,比如CPU,负载等。用户在 AutoScaling 中设置的系统监控的报警任务是以伸缩组作为监控粒度的,即以伸缩组内的所有实例的监控指标的统计平均值作为伸缩组的指标值,当伸缩组内实例数量发生变化时,监控指标也会同时进行更新。

支持的监控指标

AutoScaling 系统监控报警任务目前支持的监控项,其中红色字体代表本次升级新增支持的监控项:

监控项 单位
CPU %
内存 %
系统平均负载
内网出流量 KB/min
内网入流量 KB/min
外网出流量 KB/min
外网入流量 KB/min
系统盘写bps Byte/s
系统盘读bps Byte/s
系统盘写iops 个/s
系统盘读iops 个/s
外网网卡发包数(经典网络) 个/s
外网网卡收包数(经典网络) 个/s
内网网卡发包数 个/s
内网网卡收包数 个/s
TCP总连接数
TCP已建立连接数

注意事项

  1. AutoScaling 伸缩组在同一时刻只能执行一个伸缩活动,当伸缩组内存在正在执行的伸缩活动是,由报警任务触发伸缩规则产生的伸缩活动将被拒绝。
  2. AutoScaling 报警任务在触发伸缩规则时受伸缩规则冷却时间影响,伸缩规则在冷却时间内时,将拒绝执行伸缩规则。伸缩组内新增加的 ECS 实例从加入伸缩组到完成系统启动配置,部署用户业务,获取到监控数据需要一定的时间(通常需要几分钟),因此您应该根据具体的业务场景,设置合适的冷却时间,防止在新增实例的监控数据缺失的这段时间中,重复触发伸缩规则。
  3. AutoScaling 报警任务,默认设置了一分钟的沉默时间,即触发报警之后,一分钟内不会再次触发伸缩规则。
  4. 部分系统监控项(内存,负载,网卡发包数,TCP连接数)指标的采集需要为您安装云监控客户端。默认情况下,当您针对需要云监控客户端采集的监控项设置报警任务时,将为报警任务关联的伸缩组内的所有实例安装云监控客户端,同时,将为您在云监控控制台开启 新购ECS自动安装云监控,为您所有新购的 ECS 实例安装云监控客户端。

AutoScaling 自定义监控项报警任务

AutoScaling 自定义监控项报警任务的监控对象为用户自主上报到云监控中的监控指标。在一些场景下,系统监控项可能不包含您所需要的监控指标,您可能拥有自己的一套监控系统,并且关心的是与您特定业务相关的某些指标,自定义监控报警任务,为您自有的监控系统,或者与业务相关的自有监控指标提供了设置报警任务的接入点。

AutoScaling 自定义监控报警任务是针对阿里云云监控服务的自定义监控项设置报警的,用户在使用 AutoScaling 自定义监控报警任务之前需要首先向云监控上报自定义监控数据,即自定义监控项。云监控自定义监控是提供给用户自由定义监控项及报警规则的一项服务,通过此服务,用户可以针对自己关心的业务指标进行监控,将采集到监控数据上报至云监控,由云监控来进行数据的处理,并可以对其设置报警规则。

上报监控数据到云监控

云监控的自定义监控服务为您提供了上报监控数据的方式,您可以将自己采集到的时序数据上报到云监控,这样的数据称作时间序列。云监控提供了OpenAPI、Java SDK 和阿里云命令行工具(CLI) 三种方式上报数据,这里我们将主要关注如何使用Java SDK的方式上报监控数据。更多详细的信息您可以查看文档 上报监控数据 。

使用Java sdk之前您需要首先在项目中引入相应的jar包,如果您使用maven管理项目,您只需要在项目中加入以下依赖:

        <dependency>
            <groupId>com.aliyun</groupId>
            <artifactId>aliyun-java-sdk-core</artifactId>
            <version>3.2.6</version>
        </dependency>

        <dependency>
            <groupId>com.aliyun.openservices</groupId>
            <artifactId>aliyun-cms</artifactId>
            <version>0.2.4</version>
        </dependency>

您可以按照如下的方式向云监控上报自定义监控项:

static String endPoint     = "https://metrichub-cms-cn-hangzhou.aliyuncs.com";
CMSClient cmsClient = new CMSClient(endPoint, accAutoScalingKey, accAutoScalingSecret);
CustomMetricUploadRequest request = CustomMetricUploadRequest.builder()
                    .append(CustomMetric.builder()
                    .setMetricName("myCustomMetric")//自定义指标名
                    .setGroupId(54504L)//设置分组id
                    .setTime(new Date())//时间
                    .setType(CustomMetric.TYPE_VALUE)//类型为原始值,
                    .appendValue(MetricAttribute.VALUE, number)//原始值,key只能为这个
                    .appendDimension("key1", "value1")//添加维度
                    .appendDimension("key2","value2")
                    .build())
                 .build();
            CustomMetricUploadResponse response = cmsClient.putCustomMetric(request);//上报

在上述的代码片段中,我们上报了一个数据点到云监控。上报时,必须指定groupId参数,即云监控应用分组id,该分组id可以是您在云监控中已创建的应用分组,也可以是一个不存在的应用分组。您可以在 云监控应用分组 创建和查看应用应用分组信息。您上报的自定义监控项(时间序列),可以在云监控控制的 自定义监控 中查看。

我们建议您向一个 云监控中已经存在的应用分组中推送自定义监控数据,云监控的应用分组是针对多种云产品的逻辑分组,向一个已存在的应用分组推送自定义监控数据将使您在需要使用云监控等相关功能时保留扩展的能力。当然,您也可以完全不必理会应用分组的概念,选择向任意一个分组id推送数据。

您上报到云监控的监控数据,云监控会自动帮您进行聚合,当然,当您需要推送的数据量太大时,您也可以选择在本地聚合之后再推送到云监控。详细信息可以参考 上报监控数据 。

需要注意,云监控对用户上报监控数据设置了以下限制:

  1. 单云账号QPS限制为100。
  2. 单次最多上报100条数据,body最大为256KB。
  3. “metricName”字段只支持字母、数字、下划线。需要以字母开头,非字母开头会替换为大写“A”,非法字符替换为“_”。
  4. “dimensions”字段不支持“=”、“&”、“,” ,非法字符会被替换为“_”。
  5. metricName 和dimensions的Key-value 最大均为64字节,超过64字节会被截断。
  6. 其他限制请关注计量计费说明。

最佳实践

在本文的最佳实践中将具体讲解 如何在 AutoScaling 控制台创建,查看,以及修改一条报警任务。

创建系统监控项报警任务

首先进入 AutoScaling控制台,选中报警任务侧边栏,点击创建报警任务。

在弹出的创建报警任务对话框中,我们选中监控类型为 系统监控,设置任务名称,描述等基本信息,然后选择监控资源,即报警任务监控的伸缩组,选择监控项为cpu(cpu使用率),统计周期选择1分钟,表示将对每1分钟的监控数据进行统计检查,判断是否满足报警条件。统计办法我们选择了 平均值>=50%,重复3次,这表示,当cpu的使用了在1分钟平均值超过阈值50%,并且连续3次满足统计办法时,将发生报警。报警触发规则为伸缩规则add1,表明在发生报警时,将执行报警规则add1,为伸缩组增加1台机器。

创建自定义监控项报警任务

创建自定义监控项报警任务的过程和创建系统监控类似,唯一的不同在于,系统监控报警任务的监控项是由云监控为用户采集,而自定义监控报警任务的监控项则需要用户自己上报至云监控。

在创建自定义监控类型的报警任务时,首先需要存在已上报的自定义监控项,即时间序列。然后才能针对该时间序列设置报警规则。

在上图创建自定义报警任务之前,已经向云监控推送了一条自定义监控数据流(时间序列)。该时间序列所属的应用分组为54504,监控项名称为testMetric,维度信息为 age=10。

查看监控项详情

在成功的创建完报警任务之后,我们可以在报警任务列表看到我们刚刚创建的报警任务。

切换到自定义监控列表,查看刚刚创建的自定义报警任务。

点击报警任务的名称,将跳转到详情页,在详情页您将看到报警任务对应监控项的历史数据。

修改报警任务

您可以在报警任务的列表页修改报警任务,也可以进入报警任务的详情页修改报警规则。

修改报警任务分为两个部分,一个是修改报警任务的基本信息,另外一个是修改报警规则的触发规则。

修改基本信息包括修改任务名称,监控项,统计周期,统计办法,重复次数等,我们不建议您修改报警任务的监控项,因为,修改监控项意味着监控不同的指标,此时,新建一条针对新指标的报警任务是更合适的方法。

写在最后

AutoScaling 报警任务为您提供了一种通过监控特定监控指标来动态调整伸缩组内实例数量的方法,让您能够根据业务的变化实时的执行指定的伸缩规则,调整伸缩组内的实例数量。

本次的 AutoScaling 报警任务的升级,扩展了原有的监控指标,并在原有监控项的基础上,支持用户接入自定义的监控项,提供定制化的报警任务,大大增强了 AutoScaling 报警任务的可用性和实用性,满足用户具体的,多样化的需求。

原文链接

原文地址:http://blog.51cto.com/13679539/2128198

时间: 2024-10-08 09:14:33

Ess报警任务全新升级的相关文章

QQ空间全能营销王 全新升级

购买需知:请下载专用的付款客户端进行在线购买即可,即时付款即时发货无等待(自助购买个人版仅需3元永久)自助购买平台下载自助购买平台下载  (备用)  ===============================================淘宝购买:我们官方的唯一首席代理商(企业版 永久权限) 淘宝购买:我们官方的唯一首席代理商(体验版,有限制)   ================================================ 全新升级版本 所有功能好用 随软件配有官方详

快速开发平台全新升级,把时间留给自己,工作丢给力软平台

请把我带回你的家,请把你的工作留下! 软敏捷开发框架V7.0全新升级功能更全,运行更稳定.新版本增加了多语言,首页动态设置.移动端代码生成以及大量实用组件. IM.工作流.代码生成器也进行了重构,用起来好得不得了! 还等什么,快去官网看看吧!http://www.learun.cn 主要更新的功能: 新增 1.多语言功能: 2.代码生成器模版: a.可编辑列表代码生成器(Excel风格)模版: b.报表现实代码生成器模版: 3.树形代码生成功能: 4.动态配置首页功能: 5.外部邮件收发功能:

ipa包兼容性大作战!WeTest iOS深度兼容测试全新升级

2018年,移动端适配话题热闹无比,有iOS新版本新机型发布,全面屏.异形屏.曲面屏争相斗艳,从而产生了各类特殊的屏幕分辨率设备. 正是因为这些特殊分辨率,导致2018年手机设备频繁出现适配问题,如屏幕显示不全.双边未占满.顶部导航栏高度不对导致部分被遮挡,包括之前经常被用户提及的黑屏.闪退.安装失败等问题.特别是iOS设备在18年推出三款新的 iPhone:6.1英寸的iPhone XR.5.8英寸的iPhone XS.6.5英寸的iPhone XS Max.加上iOS版本升级成iOS 12,

TOM企业邮箱管理后台全新升级,五大亮点独家揭秘

2019年是TOM邮箱的第21年,也是里程碑式跨越的一年.近日,新版管理后台即将正式和大家见面啦~本次升级覆盖全面,包括移动办公.邮箱搬家.邮件群组.邮箱管理.企业定制等多个特色功能.在21周年庆期间,伴随着企邮周年庆活动以及扶贫事业,企业邮箱管理后台2.0版更多实用功能将华丽呈现.看点一:新版管理后台界面操作更流畅新版后台优化了整体布局.改版后的页面主次分明.设置多个快捷入口,可以快速找到功能操作入口.同时全新的架构和分类,按企业用户的需求进行功能模块的再划分,给用户带来更好的交互视觉体验.看

思科CCIE全新升级,SDN/SD-WAN成重头戏!

CCIE,全称Cisco Certified Internetwork Expert,是美国Cisco公司于1993年开始推出的专家级认证考试.被全球公认为IT业最权威的认证,是全球Internetworking领域中最顶级的认证证书.作为网络行业的标杆性资质认证,CCIE从诞生之日起便持续地成为网络工程师的拥趸.随着SDN.NFV.SD-WAN等网络技术的不断变革,今日Cisco对CCIE认证进行了重大升级.(前方高能请注意) 就在今天凌晨,思科发布了最新CCIE认证体系!2020年2月24日

腾讯云游戏服务平台CMatrix品牌全新升级为GameMatrix

近日,隶属腾讯互娱公共研发运营体系(下文称CROS)下的云游戏服务平台CMatrix宣布进行品牌升级,启用全新商标Tencent GameMatrix,将原先代表云服务的“C”替换成游戏的英文单词“Game”,意指更加聚焦游戏,赋能行业. 同时,CROS在原CMatrix团队和前沿技术中心云游技术团队的基础上, 联合音视频技术.网络优化.计算资源管理.智能运维.平台统一登陆.用户平台及游戏安全等相关技术团队,组建了一支更为强大的队伍,将内部资源进一步集中. 腾讯GameMatrix架构图 受益于

超级表格全新升级,这些功能你不可能在其他软件上看到

感谢您一直对超级表格的支持.我们在2016年5月5日凌晨 1:00~1:15 进行了系统更新,此次更新除了调整界面.修复BUG外,还上线了企业版本,以及新增了许多重要功能. 1.简洁的界面设置 点击单元格时不再出现原来的悬浮框.超级表格将工具栏直接显示在表格上方,方便用户操作包括「添加」.「撤销」.「重做」等按钮.更加突出表格导出.评论.以及相关操作. 2.支持右键行操作 取缔了原本点击单元格或选中表格行时出现的悬浮框.当鼠标指向下图中箭头所指的位置时,点击鼠标「右键」就可以出现相关操作进行选择

easyradius通讯接口 V4全新升级,显示同步失败原因,方便用户寻找故障

最近一段时间,我们做了很多的努力,不仅完成了WayOs.BV.ROS.IK.PA接口的重写(主要加入智能判断,能处理的直接处理,不能处理的告诉用户),而且在原有DDNS访问失败的提示下,升级了同步失败错误内容,方便用户快速处理故障. 这几天老是有meibu.net的用户和我们反馈: 远程可以打得开路由,但是easyradius无法通讯,提示内容就是DDNS无法解析,经我们查验,就是每步的域名都无法解析 建议用户在一个路由上,使用两个DDNS,一个是meibu,一个是3322,以防止出问题时,导致

全新升级 Kotlin系统入门与进阶

第1章 课程介绍 1-1 课程导学 1-2 什么是Kotlin?第2章 数据类型 2-1 Boolean数据类型 2-2 Number数据类型 2-3 拆箱装箱与Char数据类型 2-4 基础数据类型转换与字符串 2-5 Kotlin中类和对象初始 2-6 空类型和智能类型转换 2-7 包(package) 2-8 区间(Range) 2-9 数组(Array)第3章 程序结构 3-1 常量与变量(val,var) 3-2 函数(function) 3-3 Lambda表达式 3-4 类成员(成