【MIG专项测试组】如何准确评测Android应用的流畅度?

转自 腾讯Bugly

叶方正,2008年加入腾讯,就职于无线研发部【专项测试组】。曾经负责多个产品的性能优化工作,积累大量的移动终端平台优化以及评测经验。

怎样获取SM值?

前文我们分析了通过测量应用的帧率FPS并不能准确评价App的流畅度(如何量化Android应用的“卡”?流畅度原理&定义篇),FPS较低并不能代表当前App在UI上界面不流畅,而1s内VSync这个Loop运行了多少次更加能说明当前App的流畅程度。

那么我们可以直接在App代码中通过Choreographer的回调FrameCallback来计算Loop被运行了几次,从而知道应用的流畅度。但在实际情况下我们不一定能修改代码(实际发布的版本不允许加入测试代码)或者根本拿不到代码(譬如和竞品进行对比)。

今天我们介绍一种更简单直观测量Android应用流畅度的方法,就是通过开源测试工具GT(http://gt.qq.com)。

1、先启动要测试的应用。

2、启动GT,在插件中选择GT Injector,再选择被测进程,点击“射它”。


3、点击后,Para界面会出现流畅度指标以及被插入程序的CPU占有率,并且会带上被插入的进程名。将流畅度后面小方框勾选(表示需要记录SM值到log文件),然后点击右个角“Gather & Warning”下小红圈(表示开始记录数值)。


4、启动App,开始做相关的测试。

5、完成测试后,在GT界面点击流畅度(SM),则会出现已经记录的SM值图表,点击右上角磁盘图标,保存log到指定名字的文件夹。


6、最后利用工具(比如应用宝),把log导入到PC端进行后期处理(一般情况下,文件保存路径在:SD卡/GT/GW/进程名/自定义文件夹)。

温馨提醒:以上的操作因为涉及到进程注入需要手机Root权限,如有问题,可以加GT交流群咨询(QQ群号:145535035)。

SM测试效果如何?

我们已经收集了SM的测试数据,但测试数据是否准确?我们拿一些浏览器产品为例子,来评测下SM的数据和人的感受是否对应得上。

首先,我们为了把感官和人的感受对应上,特把主动感官分数对应到以下几种描述。

流畅度主观评分 描述
4~5 界面滑动流畅
并且能够快速响应用户输入(各种操作)
3~4 界面滑动顿挫感
并且能够及时响应用户输入(各种操作)
2~3 界面滑动明显顿挫感
响应用户输入(各种操作)有种慢半拍的感觉
1~2 界面滑动明显画面跳跃感
响应用户输入(各种操作)有严重的延迟
0~1 不能动了

1、先看看流畅度(SM)和丢帧(SF)之间的关系

测试场景:浏览器看妹子图

评测手机:Nexus 4

流畅度主观评分(总体):2.5(界面滑动明显顿挫感,响应用户输入有种慢半拍的感觉


因为丢帧是个不连续的过程,所以图中的丢帧都是以点来表示其离散的状态。从上面图表可以看出:

  • 丢帧(SF)越多,流畅度(SM)越低。
  • 26:16~26:42之间的流畅度很低,并且丢帧最密集。

再整体梳理一下这期间流畅度、丢帧和主观评分的数据:

主观评分 流畅度均值 丢帧均值
2.50 25.26 34.15

从这个数据可以看到,丢帧(SF)越多流畅度(SM)越低,并且主观感觉比较卡,这个关系是成立的。

2、再引入FPS看看三者关系

测试场景:浏览器看妹子图

评测手机:Nexus 4

流畅度主观评分(总体):2.5


这次测试引入了FPS数据,从图表中可以看出:

  • FPS曲线和SM曲线差不多,而且同样受丢帧的影响。
  • 有段比较奇怪的地方:流畅度很高,但FPS比较低,无丢帧情况,将这段数据放大来看:

检查这个时段的测试场景:静置在某个界面没有动,主观评分在4.5左右。

再整体梳理一下这个时间段FPS、流畅度、丢帧和主观的数据:

主观分 流畅度均值 丢帧均值 FPS均值
4.5 58.375 0.5 16.333

可以看出,流畅度SM会比FPS更加适合客观描述App卡的程度。

如何有效利用SM值判断App流畅度?

确定了使用SM值来评估手机App的流畅度后,我们会开始进行一个产品在不同场景,以及多个产品间在相同场景下的测试对比。场景太多,测试数据巨大,该如何有效使用SM测试结果去判断App流畅情况?

1、一些思路

  • 不能直接用平均值和方差

根据以往经验,通过平均值,方差等一些指标,并不好说明问题。如果卡顿时间出现较短,测试时间较长,则平均值和方差这种指标不容易发现问题,但是又确实有卡顿。平均值和方差适合描述服从正态分布的随机变量,但是测试得到的SM值并不是这样的随机变量。

  • 将测试结果按卡顿和流畅分段,对每个卡顿区间段打分

之前参考了一篇游戏流畅度评分的文章,该文章结合FPS平均值和卡顿的程度以及频率,对游戏整体流畅度打分。但是普通App和游戏的区别比较大。对普通App来说,用户不是一直在操作,而且不同的操作差异也较大,因此卡顿的频率一般较低,用平均值和卡顿的频率打分得到的结果可能会偏高。所以把测试过程按照卡顿和流畅分段,计算每个卡顿区间的打分和持续时间可能更有参考意义。

  • 总体打分时加大卡顿时的权重,降低流畅区间的权重

虽然我们重点关注的可能是卡顿的地方,但是竞品测试,以及两个版本对比需要有总体评判结果,不能只看局部。为了加大结果的区分度,对卡顿区间增加权重,对流畅区间降低权重,来突出卡顿对整体评分的影响。因此,评估结果将包括两部分:总体打分,以及卡顿区间、流畅区间的持续时间和打分。

2、流畅度评估方法

  • 预处理,每5个(秒)一组,取最低值。如果5秒内出现多于一次卡顿(SM低于40),则再乘以一个和卡顿次数有关的权值(小于1)。

【说明】如果卡顿出现次数较少,平均值和方差不容易发现问题。因此没有直接对数据评估,先进行了预处理,突出SM值低的部分,加大卡顿对总分的影响。

处理前的三组数据:


处理后的三组数据:

  • 将处理后的数据按卡顿和流畅分段,针对每段打分。

【说明】如果只有最后总分,且流畅的时间较长,卡顿的数据容易被流畅的数据淹没。而且有些测试场景存在一段流畅,一段卡顿的现象,卡顿并不一定在整个测试过程中存在。这样分开流畅和卡顿的区间处理,更容易看出卡顿的程度。

  • 根据测试经验,对SM值对应的卡顿严重程度打分。

【说明】根据测试同学的经验,流畅度指标SM低于40时,用户能感知到卡顿,SM在20以下卡顿比较严重。因此在打分时,SM值在20以下时打分最低,对应0-20,在20-30区间打分低,对应20-60,30-40区间打分较低,对应60-70,40以上打分在70以上。

  • 总体打分时降低流畅区间的权重。

【说明】这样处理的原因和第一项的原因一样,我们更关注的是卡顿,流畅区间过长时会淹没卡顿的数据。

3、对比几个浏览器产品在同一个场景下的测试数据

测试场景:浏览网页

评测手机:Nexus 4

测试方法:打开凤凰网,来回上下滑动,在滑动的过程中记录流畅度数据


流畅度评估后数据:

从上面的数据可以看出,在滑动浏览网页时,C浏览器略微好于A浏览器和B浏览器。

当然这都是在性能比较好的手机(Nexus 4)上测试,其实主观感受差距不大,但从量化数据上就可以看出优略。

小编有话说

卡顿的问题严重性,可能不像崩溃来得那么强烈,但对于用户的流失影响是潜移默化,慢慢深入。若想知道自己产品流畅度如何,也可以试试用SM来评测自己产品性能。

本文系腾讯Bugly特邀文章,转载请注明作者和出处“腾讯Bugly(http://bugly.qq.com)”

时间: 2024-12-27 20:29:36

【MIG专项测试组】如何准确评测Android应用的流畅度?的相关文章

android之app流畅度分析

大多数人感觉卡顿等性能问题的最主要根源都是因为渲染性能.从设计师的角度,他们希望App能够有更多的动画,图片等时尚元素来实现流畅的用户体验.但是Android系统很有可能无法及时完成那些复杂的界面渲染操作.Android系统每隔16ms发出VSYNC信号,触发对UI进行渲染,如果每次渲染都成功,这样就能够达到流畅的画面所需要的60fps,为了能够实现60fps,这意味着程序的大多数操作都必须在16ms内完成.时间超出16ms越多,丢的帧就越多(可以大概估计5秒没响应抛出anr异常期间丢了多少帧,

【MIG专项测试组】移动应用电量消耗测试入门篇

如何评价我们开发出来的应用是耗电还是不耗电,如何测试?这就是我们今天讨论的主题--电量测试,一个在移动应用中新出现的测试类型. 移动设备从之前的诺基亚.摩托罗拉等功能机到现在android.iOS等智能机,手机已经越来越普及,功能越来越丰富,但电池技术基本上却停滞不前,逐渐显现出功能机时代没有出现的续航短板,续航待机时间短一直是用户吐槽的焦点,而许多厂商也坦承电池成了制约手机发展的最大障碍之一.手机的其他模块越来越小,而电池的体积越来越大,已经成为了一个不争的事实.早前的功能机电池容量基本都小于

<转>Android App性能评测分析-流畅度篇

1.前言 在手机App竞争越来越激烈的今天,Android App的各项性能特别是流畅度不如IOS,安卓基于java虚拟机运行,触控响应的延迟和卡顿比IOS系统严重得多.一些下拉上滑.双指缩放快速打字等操作,安卓的流畅度都表现比较糟糕,但是,对于App使用过程是否流畅,一直没有一个可靠的指标将用户的客观感受和数据一一对应.虽然之前有FPS(每秒帧数)作为游戏或视频类App的性能指标,但对于那些界面更新不多的App来说,仍不是一个合适的衡量数据.以下会根据实际app性能测试案例,展开进行app性能

Android流畅度之帧率

背景:app改版,人为感受卡顿,需要客观数据支撑观点.故,搜索各种性能指标,并理解之.(这是一篇摘要文......) 首先,明确人为感受的性能不好属于下面哪种: 1. 响应时间,界面跳转后响应时间: 2. 流畅度,界面操作时或动画展示的效果: 而流畅度的衡量指标又有几种: 1. 帧率fps(Frames Per Second,每秒钟填充图像的帧率) 2. 丢帧SF(Skipped frame) 3. 流畅度SM(SMoothness)(腾讯分享) 其中得到最广泛使用的还是帧率.以下详细说明之 回

Android流畅度测试

Android流畅度测试 测试方法一:系统自带-开发者模式 测试方法二:FPS Meter测试安卓帧数 H5页面加载速度:window.performance.timing 测试方法一:系统自带-开发者模式 实际上,为了方便开发者测试,安卓本身就内置了流畅度检测的功能.不过,这需要我们开启隐藏的开发者选项.如果你在用原生系统,那么开启开发者选项的方法很简单,进入到设置菜单“关于手机”页面,点击数次“版本号”,即可开启开发者选项.如果用的是其他ROM,方法也许有所不同,比如说魅族的Flyme开启开

提高Android应用手写流畅度(基础篇)

在使用android类的手写应用时,整体上都有这样一个印象:android的手写不流畅.不自然,和苹果应用比起来相差太远.本文结合作者亲身经历,介绍一下有效提高手写流畅度的几种方法: 1.未做任何处理的手写效果: 这是一个自定义的view,通过在onTouchEvent时间中捕获系统回调的触摸点信息,然后再onDraw方法里面刷新,可以明显地感觉到线条很生硬,并且在手写的过程中跟随感很差,反应迟钝,具体代码如下: package com.mingy.paint.view; import andr

为什么ios系统比android系统更为流畅

1优先级别不同:iOS最先响应屏幕 不少人都反应苹果iPhone要比一般Android手机流畅,这是一个现象要说是大问题谈不上,毕竟两者是完全两个不同的系统所以严格来说放在一起对比是不公平的.不过因为Android以及iOS是当下两大主流操作系统,对比抗衡之类的说法自然难以避免.今天我们就来谈谈为什么iOS产品在使用过程中会让人觉得更加流畅一些,而为何一些Android手机则容易出现卡顿延迟的情况. iOS手机为什么比安卓流畅 优先级别不同:iOS最先响应屏幕 当我们使用iOS或者是Androi

安卓 App 性能专项测试之流畅度深度解析-上篇

指标背景 流畅度,顾名思义是用户感知使用App页面时的流畅情况,"App卡不卡",这是用户最直接的感受. 但是要用量化之后的数据衡量流畅度,在Android平台这边并没有直接有效的方式/手段去监控. 帧率&刷新频率 首先需要了解到两个概念: 刷新频率(Refresh Rate) 代表屏幕在一秒内刷新操作的次数,这取决于硬件的固定参数,例如60HZ. 帧率(Frame Rate) 代表GPU在一秒内绘制操作的帧数,例如常见的24fps,60fps,单位是fps(每秒帧数),很多游

Android之线程池深度剖析

1.线程池的引入 引入的好处:  1)提升性能.创建和消耗对象费时费CPU资源  2)防止内存过度消耗.控制活动线程的数量,防止并发线程过多.  使用条件:     假设在一台服务器完成一项任务的时间为T     T1 创建线程的时间         T2 在线程中执行任务的时间,包括线程间同步所需时间         T3 线程销毁的时间          显然T = T1+T2+T3.注意这是一个极度简化的假设.     可以看出T1,T3是多线程本身的带来的开销,我们渴望减少T1,T3所用