如何快速优化手游性能问题?从UGUI优化说起

WeTest 导读

本文作者从自身多年的Unity项目UI开发及优化的经验出发,从UGUI,CPU,GPU以及unity特有资源等几个维度,介绍了unity手游性能优化的一些方法。


在之前的文章《手游内存占用过高?如何快速定位手游内存问题》中提到,Mono内存和native内存是PSS内存主要的组成部分,mono内存更多的起到内存调用的功能,因此常常成为了开发人员优化内存的起点;而在游戏的其他的进程中,同样有很多因素影响着游戏的性能表现。本文将从UGUI的优化角度,介绍unity游戏性能优化的一些内容。

一、UGUI简介

UGUI是Unity官方推出的UI系统,集成了所见即所得的UI解决方案, 其功能丰富并且使用简单,同时其源代码也是开放的,下载地址:https://bitbucket.org/Unity-Technologies/ui/src

相比于NGUI,UGUI有以下几个优点:

1. 所见即所得的编辑方式,在Scene窗口中即可编辑。

2. 智能的Sprite packer可以将图片按tag自动生成图集而无需人工维护,生成的图集合并方式比较合理,无冗余资源。

3. 渲染顺序与GameObject的Hierarchy顺序相关,靠近根节点显示在底层,而靠近叶子节点显示在顶层;这样的渲染方式使得调整UI的层级比较方便和直观。

4. RectTranForm及锚点系统更适合于2D平面布局,并且非常方便多分辨率屏幕自适配。

二、UI制作规范和指导方法

本文是关于UGUI优化的,或许你会觉得UI的制作规范及指导方法与优化无关,其实很多性能问题往往是资源的不合理使用造成的,比如使用了尺寸过大的图片、引用了过多的图集以及加载了不必要的资源等。如果从设计和制作UI一开始就遵守特定的规范,则可以规避不必要的性能开销。笔者根据参与的多个项目总结了以下几点通用的规范和指导方法(这些规范适用于所有项目,不管你使用UGUI还是NGUI)。

1. 合理的分配图集

合理的分配图集可以降低drawcall和资源加载速度;具体细节如下:

● 同一个UI界面的图片尽可能放到一个图集中,这样可以尽可能的降低drawcall。

● 共用的图片放到一个或几共享的图集中,例如通用的弹框和按钮等;相同功能的图片放到一个图集中, 例如装备图标和英雄头像等;这样可以降低切换界面的加载速度。

● 不同格式的图片分别放到不同的图集中,例如透明(带Alpha)和不透明(不带Alpha)的图片,这样可以减少图片的存储空间和占用内存。(UGUI的sprite packer会自动处理这种情况)

2. resources目录中应该只保存prefab文件,其它非prefab文件(例如动画,贴图,材质等)应放到resource目录之外

因为随着项目的迭代,可能会导致部分资源(动画,贴图)等失效,如果这些文件放在resource目录下,在打包时,unity会将resource目录下文本全部打成一个大的AssetBundle包(非resouce目录下的文件只有在引用到时才会被打到包里),从而出现冗余,增加不必要的存储空间和内存占用。可以通过以下代码(Mac环境下)在控制台窗口中查看当前目录下所有非prefab资源的代码:

find . -type f | egrep -v "(prefab|prefab\.meta|meta)$"

例如在笔者的一次扫描中,发现在了如下结果:

3. 关卡内的UI资源不要与外围系统UI资源混用

在关卡内,需要加载大量的角色及场景资源,内存比较吃紧,一般在进入关卡时,都会手动释放外围系统的资源,以便使关卡内有更多的内存可以使用。如果战斗内的UI与外围系统的UI使用相同图集里的图片,则有可能会使得外围系统的图片资源释放不成功。对于关卡内与外围共用的UI资源需要特殊处理,一般来说复制一份出来专门给关卡内使用是比较好的选择。

4. 适当的降低图片的尺寸

有时UI系统的背景可能会使用全屏大小的图片,比如在Iphone上使用1136*640大小的图片;使用这样尺寸的图片代价是很昂贵的,可以和美术同学商量适当的降低图片的精度,使用更低尺寸的图片。

5. 在android设备上使用etc格式的图片

目前,几乎所有android设备都支持etc1格式的图片,etc1的好处是第个像素点只战用0.5个字节而普通rgba32的图片每个像素点占4个字节,也就说一张1024*1024图片如果使用rgba32的格式所占用的内存为4M而etc1格式所占用的内存仅为0.5M。但是使用etc1格式的图片有两个限制——长和宽必须是POT的(2的N次方)并且不支持alpha通道,因此使用etc1时需要额外的一张图来存储alpha通道,并且使用特殊的shader来对alpha采样。具体的细节可参考:http://malideveloper.arm.com/resources/sample-code/etcv1-texture-compression-and-alpha-channels/

6. 删除不必要的UI节点、动画组件及资源

随着项目的迭代,可能有部分ui节点及动画已经失效,对于失效的节点及动画一定要删除,在很多项目中,有部分同学为了方便省事,只是将失效的节点及动画disable了。这样做虽然在运行时不会对cpu造成太多负担,但是在加载时会增加不必要的加载时间以及内存占用。对于废弃的UI图片资源,虽然未放到Resource目录最终不会打到包里,但是在Editor模式下仍然会打到图集中从而影响优化决策。笔者写了一个扫描未使用到UI贴图资源的工具,代码地址:https://github.com/neoliang/FindUnUsedUITexture;

另外,对于废弃的脚本,可能还会有某些对象持有对它的引用,而加载这样的对象也比较耗时,笔者也写了一个扫描废弃脚本的工具,代码地址:https://github.com/neoliang/MissingScriptFinder

三、CPU优化

一般来说,优化cpu性能应该先用profiler定位到性能热点,找到消耗最高的函数,然后再想办法降低它的消耗。经过笔者多次使用profiler对UGUI的分析来看,其CPU性能开销高主要原因之一是Canvs对UI网格的重建,有很多情况会触发Canvas对网格的重建,例如Image,Text等UI元素的Enable及UI元素的长、宽或Color属性的变化等。Canvas中UI Mesh顶点较多的话,则该项将会出现较高的CPU开销。在Unity的Profiler中则对应的是Canvas.SendWillRenderCanvases或Canvas.BuildBatch占用过多的时间。

Canvas.BuildBatch主要功能是合并Canvas节点下所有UI元素的网格,合并后的网格会缓存起来,只有其下面的UI元素的网格发生改变时才会重新合并。而UI元素的网络变化主要是因为Canvas.SendWillRenderCanvases调用时,rebuild了Layout或者craphic。该函数的调用过程时序图如下:

1.该过程由CanvasUpdateRegistry监听Canvas的WillRenderCanvases(上图中1)而执行,主要是对前标记为dirty的layout和craphic执行rebuild。引起layout和graphic的dirty主要原因是因为Canvas树形结构下的UI元素发生了变化(例如增加删除UI对象,UI元素的顶点,rec尺寸改变等)调用了Graphic.SetDirty(实际上最终都会调用CanvasUpdateRegistry.RegisterCanvasElementForLayoutRebuild)。

2. 在rebuild layout之前会对Layout rebuild queue中的元素依据它们在heiarchy中的层次深度进行排序(上图中的2),排列的结果是越靠近根的节点越会被优先处理。

3. rebuild layout(上图中的3),主要是执行ILayoutElement和ILayoutController接口中的方法来计算位置,Rect的大小等布局信息。

4. rebulid graphic(上图中的4),主要是调用UpdateGeometry重建网格的顶点数据(上图中5)以及调用UpdateMeterial更新CanvasRender的材质信息(上图中6)。

基于以上UGUI的网格更新原理,我们可以做以下优化:

a. 使用尽可能少的UI元素;在制作UI时,一定要仔细查检UI层级,删除不不必要的UI元素,这样可以减少深度排序的时间(上图中的2)以及Rebuild的时间(上图中的3,4)。

b. 减少Rebuild的频率,将动态UI元素(频繁改变例如顶点、alpha、坐标和大小等的元素)与静态UI元素分离出来,放到特定的Canvas中。

c. 谨慎使用UI元素的enable与disable,因为它们会触发耗时较高的rebuild(图中的3、4),替代方案之一是enable和disableUI元素的canvasrender或者Canvas。

d. 谨慎使用Text的Best Fit选项,虽然这个选项可以动态的调整字体大小以适应UI布局而不会超框,但其代价是很高的,Unity会为用到的该元素所用到的所有字号生成图元保存在atlas里,不但增加额外的生成时间,还会使得字体对应的atlas变大。

e.谨慎使用Canvas的Pixel Perfect选项,该选项会使得ui元素在发生位置变化时,造成layout Rebuild。(比如ScrollRect滚动时,如果开启了Canvas的pixel Perfect,会使得Canvas.SendWillRenderCanvas消耗较高)

f. 使用缓存池来保存ScrollView中的Item,对于移出或移进View外的的元素,不要调用disable或enable,而是把它们放到缓存池里或从缓存池中取出复用。

g. 除了rebuild过程之外,UGUI的touch处理消耗也可能会成为性能热点。因为UGUI在默认情况下会对所有可见的Graphic组件调用raycast。对于不需要接收touch事件的grahic,一定要禁用raycast。对于unity5以上的可以关闭graphic的Raycast Target而对于unity4.6,可以给不需要接收touch的UI元素加上canvasgroup组件。

unity5.x 

unity4.6

四、GPU优化

一般来说,造成GPU性能瓶颈主要有两个原因:复杂的vertext或pixel shader计算以及overdraw造成过多的像素填充。在默认情况下UGUI中所有UI元素使用都使用UI/Defaut shader,因此在优化时可优先考虑解决Overdraw问题。Overdraw主要是因为大量UI元素的重叠引起的,查看overdraw比较简单,在scene窗口中选择overdraw模式,场景中越亮的地方表示overdraw越高(如下图)。

为了降低overdraw,可以做如下优化:

1. 禁用不可见的UI,比如当打开一个系统时如果完全挡住了另外一个系统,则可以将被遮挡住的系统禁用。

2. 不要使用空的Image,在Unity中,RayCast使用Graphi作为基本元素来检测touch,在笔者参与的项目中,很多同学使用空的image并将alpha设置为0来接收touch事件,这样会产生不必要的overdraw。通过如下类NoDrawingRayCast来接收事件可以避免不必要的overdraw。

3. public class NoDrawingRayCast : Graphic

4. {

5.     public override void SetMaterialDirty()

6.     {

7.     }

8.     public override void SetVerticesDirty()

9.     {

10.     }

11.     protected override void OnFillVBO(List<UIVertex> vbo)

12.     {

13.         vbo.Clear();

14.     }

}

五、总结

优化UGUI性能没有万能的方法,笔者这些经验总结也只能作为参考。优化性能往往是在各种选择之间做出平衡,比如drawcall与rebuild平衡、内存战胜与cpu消耗平衡以及UI图片精度与纹理大小的平衡等。每一次优化都有可能使得瓶颈出现在其它的环节上,要善于使用profiler,找到性能热点,对症下药。

六、关于资源占用问题

UI资源优化是UGUI性能优化的重点,腾讯WeTest也在资源方面提供了性能的测试。以下通过“纹理”资源,介绍腾讯WeTest性能测试在资源方面的测试情况。

1、登录http://wetest.qq.com/cube/ ,点击“Android版 下载”,或者在页面末尾扫描二维码直接下载腾讯WeTest的手游客户端性能分析工具Cube。打开工具,选择“Unity资源分析”。

2、上传测试报告后,我们可以通过测试报告,了解unity游戏的资源情况。

资源结论概况

进入资源数据的报告之后,首先可以看到所有资源数据的概况结果,总体上了解存在问题的数据,继续下拉,可以了解该指标的具体情况。

资源数据概况

下面将以“纹理资源”为例,对cube资源测试报告进行解读。

纹理资源

Cube测试报告的“纹理资源”,根据腾讯标准,是期望<50MB的,从下图可见,如果超出红色虚线,就说明纹理资源存在超标。

点击具体数据点,获取具体资源数据

另外,点击图表中的绿色线条中的具体数据点,可以看到这个点的当前数据,所有数据根据资源大小进行排序

所有数据根据资源大小进行排序

在这个表之下,有一个“资源大小top20”的表格,罗列了资源排名前20的资源内容。其中资源大小超过建议值的会呈现红色,资源大小非2的n次幂的呈现黄色。点击任意一个资源名称,可以在图表上观察这个资源所影响的区域:

点击具体资源了解影响区域

了解资源调用的影响区域


针对手游的性能优化,腾讯WeTest平台的Cube工具提供了基本所有相关指标的检测,为手游进行最高效和准确的测试服务,不断改善玩家的体验。目前功能还在免费开放中

体验地址:http://wetest.qq.com/cube/

帮助中心:http://wetest.qq.com/help/documentation/10096.html

如果对使用当中有任何疑问,欢迎联系腾讯WeTest企业qq:800024531

时间: 2024-07-30 13:40:10

如何快速优化手游性能问题?从UGUI优化说起的相关文章

手游性能之渲染分析3

举个例子: 比如,我们现在要用顶点缓存绘制一个正方形.首先我们知道,三角形是绘制图形的基本单元,我们绘制任何图形,都是用大量的三角形组合起来,堆砌完成的.而正方形,显然是由两个大小相同的三角形结合起来组成的.所以要绘制一个正方形,我们用顶点缓存写两个三角形,然后进行绘制就可以了.而一个三角形有三个顶点,两个三角形就有六个顶点.所以,用顶点缓存绘制一个正方形的话,需要用六个顶点缓存.而众所周知一个正方形也就是四个顶点.也就是说我们单用顶点缓存来绘制一个正方形,多用了两个顶点.这是顶点缓存的概念,也

手游精品化的第三年,谁在窃取手游开发者的利益?

WeTest导读 手游市场从2015年开始渐渐趋于平稳,"精品化"概念已经成为手游重要的发展方向.国内手游行业存在着增速放缓.流量获取成本增高的情况.这种现状意味着,一旦手游质量发生闪失,同质产品会迅速涌入抢占市场.等手游开发者意识到质量问题并把问题解决后,市场已经落入竞品之手.因此,在如此市场格局之下,把控手游品质,似乎成为了手游突出重围,稳定增长的突破口. 一.这些问题正在侵害手游开发者的利益 1.游戏崩溃.闪退 兼容性问题是手游上线前最常见的问题,目前国内很多硬件厂商,对于And

UWA发布 | 2017 Unity手游体检蓝皮书 — ARPG篇

报告目录: 一.ARPG手游总体性能开销分析 二.ARPG手游CPU模块性能开销分析 三.ARPG手游内存模块性能开销分析 四.ARPG手游资源管理分析 五.UWA对于ARPG手游研发团队的建议 一.ARPG手游总体性能开销分析 iOS设备的CPU性能普遍高于Android设备,Android设备的CPU均值主体范围为12.4~66.2 ms,iOS设备的CPU均值主体范围为7.0~57.5 ms. 我们选择了测评次数最多的四款机型来进行统计,这四款机型分别是红米2.红米Note2.华为6Plu

手游热更新方案--Unity3D下的CsToLua技术

WeTest 导读 CsToLua工具将客户端 C#源码自动转换为Lua,实现热更新,本文以麻将项目为例介绍客户端技术细节. 麻将项目架构 其中ChinaMahjong-CSLua为C#工程,实现麻将项目的主要业务流程.翻译工程的输入是C#项目生成的dll文件.其中Cecil负责分析类型 类成员关系 ,比如类字段函数结构,引用关系.类之间的继承关系等,ILSpy负责反编译函数体里的语句,比如条件语句,函数调用,算数运算等.下面逐个介绍具体的实现. Mono.Cecil Mono.Cecil:一个

Unity手游优化——CPU篇

Unity 手游优化——CPU篇 前段时间本人转战unity手游,由于作者(Chwen)之前参与端游开发,有些端游的经验可以直接移植到手游,比如项目框架架构.代码设计.部分性能分析,而对于移动终端而言,CPU.内存.显卡甚至电池等硬件因素,以及网络等条件限制,对移动游戏开发的优化带来更大的挑战. 这里就以unity4.5x版本为例,对Unity的优化方案做一个总结,有些是项目遇到的,也有些是看到别人写的不错拿来分享,算作一个整理,后期也会持续更新.本优化从CPU.GPU和内存三个方面着手总结,这

针对手游业务亚马逊,首都在线,迅达云主机的IO Network 性能测试数据

针对手游业务亚马逊,首都在线,迅达云主机的IO Network 性能测试数据,布布扣,bubuko.com

手游与App测试如何快速转型? —— 过来人科普手游与App测试四大区别

随着智能设备的普及和移动互联网的兴起,各家互联网巨头纷纷在往移动端布局和转型,同时初创的移动互联网公司也都盯着这个市场希望分一杯羹.在这个大环境下,互联网的重心已经慢慢从Web端转向了移动端,而移动端的软件测试也变得越来越重要了. 在移动端的软件里,手游又是其中非常大的一块.从下面的图可以看出,智能手机的普及和手游玩家的增长是密切相关的: 加入鹅厂前,笔者曾经长期从事手机App的测试开发工作.1年前加入鹅厂后转行做了手游测试工作,通过摸索实践,发现两者在相同的测试理论基础之上,其实有着非常不同的

手机端优化列表滚动性能——分页加载

现在在手机端列表滚动随处可见,拿现在大家都在用的微信来说,朋友圈就是一个列表,和好友发信息界面就是一个列表. 如果列表长度不长,比如你微信朋友圈一共就只有两三个人分享过他们的动态,那没问题,如果你是大屏手机估计还不用滚动就已经看完了. 但那有可能吗?有也只是少数.我们现在每天刷朋友圈那都是几屏几屏这样刷的. 我们设定一屏有五个人分享的动态,每一个动态里面有5个dom节点,即一屏有25个dom节点. 我们开始刷朋友圈,才看了四屏就已经100个节点了,再往下刷成百甚至上千个dom节点都出来了,那你手

Unity3D如何集成ShareREC手游录像分享SDK,使游戏快速拥有录制视频功能(iOS开发)

一.准备工具 到Mob官网 下载 ShareREC For Unity3d SDK包. 工具概要:ShareREC是Mob推出的最完美手游录像解决方案,开发者只需3分钟快速集成,即可让游戏拥有强大的手游录像.语音及视频解说,第三方分享功能,同时后台还能提供完善的数据统计,可供实时了解播放量.分享量.下载量等数据.下载地址:http://rec.mob.com/Download 功能: 1.支持手游录像功能,游戏过程中可同步录制游戏视频 2.支持分享到主流社交平台,新浪微博.微信好友.微信朋友圈.