APM,云时代的应用性能优化神器

  我们都知道,当今的时代是一个新技术蓬勃发展的时代;大数据、云计算、移动互联网、物联网……作为应用服务开发者的我们,有了很多很好的选择;我们的传统的应用基础架构也开始向云端迁移;我们看一下,现在企业应用IT架构是什么样?

  

  很典型,从用户一直到硬件,很立体的六个层面,从用户到CDN,到防护墙,防护墙内有一堆的服务器,跑的是你的代码,还有一堆的硬盘做数据存储,这是咱们传统企业的应用架构。到了云的时代,因为我要讲的是云时代的APM,架构就变成这样了,后端防火墙的一些东西都隐化了,到了云时代背后的一般都变成一种资源,包括网络,可能很多人也不一定知道,网络怎么把它变成一种资源,有一种技术叫SDN,把所有东西变成资源以后在云上我们看到的情况会很不一样。到了云的时代,很多东西都在云上,为什么会发生这样的变化呢?

  

  既然是一种技术趋势上升带来的变化,肯定是有很多的好处;就拿青云的服务为例,给我们技术部门有哪些帮助呢?

  秒级调度 所有计算、存储、网络资源都是秒级响应。如果初始资源不够用,可以弹性扩展伸缩。不需要的资源可以随时销毁。随需应变,无需等待。

  按秒计费,最大限度降低总拥有成本 因为青云的资源可在秒级创建和销毁,为了鼓励大家按需使用资源,我们在计费上只根据您实际使用的时长收费,并精确到秒。让您可以随时调整业务规模,无需考虑计费周期的限制。

  私有云,搭建属于自己的私有云环境 通过 SDN 实现的虚拟路由器和交换机,您可以快速搭建属于自己的私有云环境,并提供 100% 的网络隔离,确保安全。还能与现有的计算环境通过安全隧道连接,形成公私兼顾的混合云(hybrid cloud)。

  最大程度保障您的数据安全 私有网络提供100%二层隔离,在这个环境里,你的内部数据是非常安全的,黑客无法嗅探或者截获到你的数据。多重实时副本和备份可以保障即使在物理硬件彻底损坏时,数据也不会丢失,并且可以很快恢复业务。 都用云了,是不是就不用担心我们的业务系统了呢?一切就完美了吗? 我们的业务一定能向我们期望的那样,快速,稳健增长吗?

  我们可以从另外一个角度来思考这个问题;不知道什么时候开始,我们都听过“用户体验”这个名称;什么是用户体验呢?

  

  百度里是这样解释的:用户使用产品和服务过程中建立起来的纯主观感受;

  那么这种纯主观感受实际上包含很多的要素;比如说漂亮的视觉设计、贴心专业的服务、快速的用户响应、极致简洁的交互界面等等。

  可想而知,上面的这些要素都会影响到用户的纯主观感受,那其实我们今天还要分享一个要素,就是性能;当然性能这块,有很多的数据,比如说网络延迟每增加0.4秒,亚马逊每年将损失16亿美元,性能每减少0.4秒,雅虎访问量就会增加9%,还有移动App里面非常经典的五秒钟定律;如果你的App应用的响应时间大于5秒钟;那么50%移动应用用户会放弃,30%用户会卸载,33%失望的用户会转向竞争对手的应用。

  

  所以小米的雷军也在说一句比较经典的话:抛开性能谈体验,都是耍流氓。

  当然他说这句话时候是在小米手机发布会上针对手机跑分是这样,针对我们线上的业务系统实际上也完全适用;我们不禁思考,为什么性能这样重要呢?

  很简单,性能影响用户体验,用户体验影响的是我们的业务营收,业务营收就是白花花的金钱;所以这个等式就成立了,即我们的系统性能就等于金钱!既然和钱有关系,我们当然要很好的解决掉。

  

  那我们说了这么的性能,对于性能我们应该如何理解呢?

  实际上云智慧对性能的抽象理解很简单,只有两点:

  第一个挑战是业务中断,确实对企业来说这是最大的挑战,业务中断有再多的用户没用。所以对企业来讲,业务是永远不能断的。

  第二个挑战是什么?性能缓慢,我们回想中国GDP增长曲线,从1978年的3650到2014年的636463,保持平均每年8%的快速增长,经济发展速度是相当的快。中国经济的发展不能慢,为什么?慢了挣钱就少了,挣钱少了中国经济就要崩溃陷入中等收入陷阱,我们也不能慢,慢了说明用户要跑了,钱也就没了,企业也就发展不了,所以天下武功唯快不破。慢代表什么?慢代表性能,性能的好和坏。所以说对于在线提供产品和服务的我们,性能就代表一切!

  

  那我们也在思考,性能影响是通过什么表达给我们;响应时间、吞吐率、延迟、丢包率、慢查询、代码堆栈、崩溃率等等——这是一大堆技术参数,很难理解;而恰恰,我们的IT系统运行产生的指标都是很数据化的;传统做APM的方法做到了一定层面的数据可视化,但是对解决问题实际的用户体验问题我觉得还不够直观,为什么?

  其实我们最期望看到的是,用户在做什么的时候怎么样了?每一个他在下单的时候是开怀大笑还是愤怒无边?而这一切,通过用户行为性能分析的层面,我们是能够做的。

  

  当我们的身体出现问题时,只有CT才能在几分钟内给患者完成从头到脚的全身扫描,从而准确发现病灶,为后续的治疗提供准确的依据。

  今天的互联网就像人体一样强大而复杂,一款看似简单的网络应用,需要服务器、存储、系统、应用环境、网络和用户电脑/手机设备的一系列支持,才能顺畅运行。当应用发生故障时,比如用户无法登录、页面打不开、搜索没结果,谁来帮助我们快速而准确的定位应用的问题?

  APM就像是部署在互联网上的CT扫描设备,通过SDK采集用户端数据,通过监控点采集网络数据,通过探针采集服务器上各种软硬件环境数据,然后利用大数据技术把采集到的数据进行快速诊断分析,发现影响应用性能的“病灶”,并给出诊断建议。

  

  参考和分析市场上国内外的应用性能管理的解决方案;云智慧首创面向业务的基于用户行为性能的方法;这是基于真实的用户行为角度来分析应用的性能表现;分析的维度包括行为的维度和用户的维度。

  

  行为的维度,是从影响业务的各种行为入手来分析行为背后的影响;比如有一个行为叫“支付”,在一段时间内,有1000人支付,其中有400人因为性能问题受到了影响;他们没有支付成功,那么这400人就给业务造成了很大的影响,平均每个人100元的支付额,那就是40000元的业务损失;接下来我们分析400人中有多少人是因为前端的Crash问题,可能有150人,我们接下来再分析这150人都用什么样的手机,系统,运营商,这样一步步有助于我们定位问题;也可能有250人是因为后端的服务质量问题造成影响,体现在加载缓慢上,那么我们可以分析后端的各种服务服的质量。

  

  我们还原一个需求的场景;有一天突然有个用户投诉支付缓慢,支付不成功;这个时候我们技术部门如何快速定位到这个用户的问题,当时的历史快照是什么?目前没有很好的办法;用透视宝的用户分析,我们可以定位到系统的每个用户的每次操作的性能问题上;简单的搜索就可以查到当时这个用户操作时发生了什么,包括前端和后端的整体记录都可以定位到;

  另外有的时候我们也关心一类用户的问题,比如说某个区域的联通运营商用户,比如都用了某款国产手机;通过透视宝的用户筛选功能,我们可以针对特定人群进行问题分析,快速找到这类瓶颈。

  

  真正的端到端应该是从用户端到后端的物理服务器以及代码端的完整穿透;

  而且应该是基于细化到每个用户的每个真实行为操作层面来看待;

  化到每个操作层面的端到端,让深入定位问题有了可能;通过标记在每个行为操作上的Unique ID,透视宝将整个操作背后所有相关环节“拍照”;这样非常有助于我们真实还原问题细节;

  

  透视宝能够帮助运营人员实时分析业务,明确业务性能问题以快速适应市场变化;帮助开发人员基于问题事件定位架构及代码瓶颈,以实现快速构建及改进持续交付;提供端到端全技术栈监控,帮助运维人员快速定位、预测IT系统问题,确保运维SLA与服务质量;面向管理层,提供多维报告与数据决策支持,帮助企业实现用户满意度及运营效率持续提升、企业营收不断提高。

  本文作者:陆兴海(Yak)

  2007年硕士毕业于西北工业大学,信息化技术研究方向。工作从事软件产品设计开发多年,现任云智慧产品总监,致力于面向大数据的IT系统监控软件以及应用性能管理(APM)平台的规划、设计与传播。热爱互联网,专注产品设计,喜欢云计算,关注大数据,对一切新鲜事物都抱有好奇心。微信号:yak1982。

时间: 2024-10-29 10:46:20

APM,云时代的应用性能优化神器的相关文章

OneAPM:打造云时代的应用性能管控平台

在2015年大连市CIO信息化年会的现场,记者与OneAPM东北区总经理佟维针对云时代的企业系统应用性能的管理控制进行了简短交流.北京蓝海讯通科技股份有限公司,即OneAPM是中国基础软件领域的新兴领军企业.专注于提供新一代应用性能管理软件和服务,帮助用户降低 IT 成本,提高业务生产力.产品适用于复杂的现代应用程序生产环境,提供端到端应用性能管理.移动端和浏览器真实用户体验分析.业务交易实时分析.以下是采访文字实录:    Chinabyte:请简要介绍一下OneAPM公司的发展历程以及公司概

新时代的页面性能优化

概述 最近这几天对页面性能优化进行了一些思考,记录下来,供以后开发时参考,相信对其他人也有用.在我查资料的过程中,发现以前的一些黄金优化法则,在现代有些已经或多或少的被淘汰了! 首屏时间 首屏时间真的很重要,用户的等待忍受能力是有限的.有以下几个优化方向: 可以通过chrome浏览器的performance面板来查看页面加载时的逐帧闪照.来查看在首屏之前浏览器做了哪些多余的动作,然后一一优化掉. 对于首屏有一个很大的背景图的网站,背景图一般是用background-img实现的,但是backgr

转:MySQL性能优化神器Explain使用分析

详细请点击 https://blog.csdn.net/qq_38293564/article/details/80883704 以下是自己总结: 接下来我们来重点看一下比较重要的几个字段 type type类型的性能比较 通常来说,不同的 type 类型的性能关系如下: ALL < index < range ~ index_merge < ref < eq_ref < const < system ALL 类型因为是全表扫描,因此在相同的查询条件下,它是速度最慢的.

MySQL 性能优化神器 Explain 使用分析

简介 MySQL 提供了一个 EXPLAIN 命令, 它可以对 SELECT 语句进行分析, 并输出 SELECT 执行的详细信息, 以供开发人员针对性优化.EXPLAIN 命令用法十分简单, 在 SELECT 语句前加上 Explain 就可以了, 例如: EXPLAIN SELECT * from user_info WHERE id < 300; 准备 为了接下来方便演示 EXPLAIN 的使用, 首先我们需要建立两个测试用的表, 并添加相应的数据: CREATE TABLE `user_

Mysql系列-性能优化神器EXPLAIN使用介绍及分析

简介 MySQL 提供了一个 EXPLAIN 命令, 它可以对 SELECT 语句进行分析, 并输出 SELECT 执行的详细信息, 以供开发人员针对性优化. EXPLAIN 命令用法十分简单, 在 SELECT 语句前加上 Explain 就可以了, 例如: EXPLAIN SELECT * from user_info WHERE id < 300; 下面是我结合我自己创建的表以及执行相关sql语句总结的相关知识点. 准备 为了接下来方便演示 EXPLAIN 的使用, 首先我们需要建立两个测

性能魔方mmTrix推出基于云的web性能优化服务

性能魔方,新一代云应用性能管理服务商,今天宣布推出基于云的web性能优化服务,帮助客户优化网站速度,提高用户体验,以获得更好的用户转化率和收入. 性能魔方团队有着丰富的行业经验和卓越的前瞻思想,并充分利用云计算技术,使网络更快."我们有信心,我们的网站性能监测和网站速度优化服务将迅速为网站带来好处和价值,这些价值包括更好的用户体验和更高的投资回报率"CEO蒲炜说. 测试你的网站性能,分析与行业基准或者竞争对手的差距,请访问www.mmtrix.com,这是免费的,而且使用简单. 关于性

论云时代最经济的APM工具的姿势

阿里云于大概两月前商业化了一款APM产品 ARMS ,正式填补了 APM 上的云上监控的空白.那么作为阿里云官方 APM 工具,ARMS 和其他传统厂商的 APM 服务相比有什么特点呢? 通过和国内其他 APM 类产品对比,结合其自身各类功能,一个显著的特点是能非常明显地帮助用户降低云上的应用监控使用成本,从而间接提高用户在阿里云上的体验和粘性. 以下从五个方面来为大家详细解说. 随需而动的按量付费定价策略 传统的APM厂商基本上是按照规模的峰值数来一次性收取一年的费用.相比之下,ARMS 无论

云时代IDC自动化运维的几大神器

云时代IDC自动化运维的几大神器 2016年09月18日 10:27:41 天府云创 阅读数:1715 版权声明:本文为EnweiTech原创文章,未经博主允许不得转载. https://blog.csdn.net/English0523/article/details/52572114 自动化运维是数据中心.互联网企业高度重视的方向,数据中心的从纯手工.重复地进行软件部署运维,经历编写脚本运维,再到借助第三方工具高效.方便地部署和运维,在转变的过程中已大大提升了运维的效率和性能.下面给大家推荐

web前端之性能优化

作为一个前端工作人员,而且只会写点HTML5和CSS3的“假”前端工程师,为了能更好地理解一下前端的花花世界,最近拜读了<高性能网站建设指南>一书,对作者提出的前端性能优化的14个规则获益匪浅,为了让自己印象更深刻点,决定作此文,当做学习笔记也好,知识总结也罢,总归看过的东西要让自己很好地掌握很好地运用起来才是王道.在解读这些规则的同时,我会用我一年半多的移动网站开发经历提出一些针对移动网站的优化建议. 首先我们从三个大类讲起:一,网络服务器.二,浏览器,三代码上面,针对这三个大类总结出了下面