鉴于网上没有较完善的time profile教程,官网上的介绍也很简略,look在此写一篇time profile的小教程,此篇文档囊括了谷歌前两页的搜索结果,look浓缩翻译了部分精华并加入了些个人理解,有不对的地方或需要补充的地方,欢迎大家斧正和指导。
在此感谢carmelosui关于self的指正。
一、启动time profiler
已使用过time profiler的同志请直接跳到二、基本介绍
首先您的手机得有证书,能确保能run过,笔者用的是xcode5.0.2 instrument5.0.1,以下的图示均以xcode5.0.2 instrument5.0.1为准,有同学反馈证书都OK了,用time profiler时app会闪退、手机接着重启,可能是手机越狱的原因,请用非越狱手机试试。
启动time profile两种方式
1. 长按Xcode左上角的run键几秒,将会出现一个下拉列表,然后选择profile
2. 通过xcode菜单栏,Product -> Profile 启动instrument
instrument里选取time profiler,然后点Profile:
Time Profile就启动了,操作一段时间后,点击stop,停止分析:
二、基本介绍
如果您对time profiler每个面板,大部分字段了如指掌,请跳到三、简单的过滤
主面板
首先点击下图view中三个选择器,确保所有的视图均有打开
主界面如下:
图1
1、 可以通过range设置您需要关注的时间段,在图1标识5 跟踪(track)面板中
通过时间轴线,设置您的起止时间:
2. run timer and run navigator,记录您run的次数,通过左右三角箭可以查看上/下一次运行:
3. Liabrary,选取这个后,右边会出现instrument工具的库,您可以选取其他工具,然后拖到左上角的instrument视图中,由于look这里只介绍time profile,其他工具请查阅其他文档。
4. 过滤器,如果您需要查找具体的类或函数,在此输入类名或函数名,图1标识8详情面板中将会展示您过滤后的结果
5. 跟踪面板(track pane)
6. 扩展详情面板(extended detail pane)
7. 选项面板(options pane)
8. 详情面板(detail pane)用于展示主要信息
详情面板(detail pane)介绍
下面介绍最重要的详情面板(detail pane)和扩展详情列表(Extended Detail),time profiler下我们主要看两种视图Call Tree和Sample List
调用树(Call Tree)视图
Column heading |
DefinDefinition |
翻译 |
Running Time |
The amount of time the symbol ran. |
该符号(函数)运行时间,注意是累积时间,time profiler不会顺着程序流程去统计时间 |
Self |
The number of times the symbol calls itself. |
并非调用次数,look有发现很多self为0也有耗时的情况,经carmelosui指出后,此为在栈顶次数,look有待考证 |
Symbol Name |
The name of the symbol being called. |
被调用的符号信息 |
详情面板call tree视图与扩展详情面板对应关系如图:
经carmelosui指导,调用树视图下还可以开启一些官网上没有提到的信息,如图所示:
关于self #self self%,可以参考carmelosui 在stackoverflow上的提问和carmelo对本文的评论:
Self in the Time Profiler refers to the amount of time spent in the given function itself, excluding time spent in other methods that it calls.
Self % is the same thing but expressed as a percentage of the total running time.
# Self is the number of actual profiler samples that hit this function or method. The Time Profiler samples every 1 ms by default, so this number will often be the same as the Self value.
如上仅供参考,具体有待考证,look有空再demo验证
样本列表(sample list)
Column heading |
Definition |
Timestamp |
该采样开始时间 |
Depth |
堆栈深度 |
CPU |
线程运行在哪块cpu上 |
Thread |
The thread identifier. |
Hot Frame |
该采样中调用最频繁的函数 |
Responsible Library |
调用该函数的库 |
Responsible Caller |
调用该函数的函数 |
sample list视图下,详情面板与扩展详情面板对应关系如图:
一些简单技巧
如果您想一级级打开调用栈,点击符号信息前的展开/收起即可,如果您想一下全部打开调用栈,按住option,再点展开/收起
您也可以按耗时,调用次数的升序/降序进行排列,如图所示:
放大(shift) /缩小(control)+拖动时间轴线:调整跟踪面板的单位时间长度,
也可以View ->snap Track to fit自动匹配合适的时间间隔显示
比较两次run的差异:
instrument->Compare Call Trees
三、简单的过滤
如果您对基本的过滤方法信手拈来,四、高级的功能或许能满足您
过滤时间段
通过前面的inspection range可以设置起止时间,关注您设定时间内的耗时,设定后的效果如下图:
instrument4.0之后,我还可以教您更快的方法,按住option,然后直接在跟踪面板上拖动就可以限定时间范围
函数名或类名过滤
通过主面板图1标识4,输入名称可以直接过滤
也可以通过Edit ->find( 快捷键Command+F)来查找,还可以设置查找类型:
Call Tree过滤
通过选项面板中一些选项,进行一些简单的过滤,选项面板如下:
Call Tree下面有些很有用的选项
Separate by Thread(建议开启):通过线程分类,能看到哪些线程占用cpu最多,该选项一般选上
invert Call Tree(不建议开启):反转调用树,正常的详情面板中的调用树是从线程的根向下一级级显示,选上该选项,则从最底层的调用向上一级级显示,在您需要看哪个方法调用最深时有用,一般不建议开启此选项,
Hide Missing Symbols(建议): 隐藏丢失的符号,如果应用程序或系统framework的dSYM文件找不到,详情面板中将看不到方法名(符号),看到的是十六进制值,对应的是指令在二进制代码中的地址值.如果开启这个选项,这些数值将会隐藏,只显示能被解析的函数(符号)信息,帮助简化显示的信息。
Hide System Libraries(建议): 当开启这个选项,只展示和您应用程序相关的符号信息,该选项通常很有用,因为您只关心自己代码的耗时, 而不是过多关心系统库的cpu耗时。
Show Obj-C Only(依场景): 开启该选项仅Objective-C methods 展示,C和C++函数不展示,如果您的程序用到了OpenGL ,会包含一些C++的方法。
Flatten Recursion(有递归时建议开启): 这个选项会将调用栈里递归函数作为一个入口,而不是多个
Top Functions:开启这个选项,会将最耗时的函数降序排列,这种耗时统计是累加的,例如A调用B,A的耗时统计里包含B的耗时,如果A B函数依次是第一、二耗时的函数,在此选项下,A B会降序依次显示。
通过一些过滤后,笔者的demo程序最终如图所示:
从上图可以看出,RootViewController类中的tableView:cellForRowAtIndexPath:方法最耗时,
双击该行,可以跳到代码处:
发现tableView:cellForRowAtIndexPath:方法中一行代码耗了该方法50.4%的耗时,这行代码就应该是我们应该优化的重点。
您也可以打开反汇编视图,有助于您排查问题
也可以打开源文件进行处理,而不用在Xcode里去查找该文件
Call Tree Constraints过滤
如果您想看调用次数超过10 或者只关心耗时超过10ms以上的函数,或者指定一个范围,这个可以派上用场了
count 若子级调用里有超过该设定值的,父级调用也不会被过滤掉
打用户标记
在跟踪面板上,同时按
command+方向下键,可以添加用户标记,也可以通过Edit->Add Flag添加
command+方向上键,可以删除用户标记,也可以通过Edit->Remove Flag删除
command+方向左右键,移动到上/下个标记
打用户标记可以缩小具体场景,具体怎么用,笔者还不太清楚,求指导。
Specific Data mining
暂留空,笔者还不太会用,将收集的一些说明暂且放这,求指导。
charge prune flatten
Charge symbols or Library to caller: Time Profiler will tally the time spent for a system symbol or even a complete library, to the method that calls it.
Prune Symbol and subtree: So you are pretty sure that there is nothing in the world that can shave a millisecond from a given portion of your app? Then you can instruct Time Profiler not to display it. In this case, Time Profiler will remove the the symbol and the subtree associate with it (all the code called from the marked symbol) from the tally.
Flatten Library to Boundaries: Let’s say that you call a Core Audio function, that itself spawn a lively arrange of calls to the stack. Again, you cannot do much about how Core Audio works internally, but you might find useful to instruct Time Profiler to show you just the boundaries between your code and Core Audio.
四、高级的功能
如果作为初级用户,前面的介绍想必已够您大展拳脚了,下面介绍一下比较少用的高级功能,有一定帮助的功能,不完全针对time profile。
两种录制模式的介绍
录制主要有两种模式:立即模式(默认)和延时模式,下面简单介绍下两种模式的区别:
立即模式:默认方式,用profile探视用户时间耗时是非常有用的,但是因为instrument和我们探视的程序用同一块cpu,instrument也要耗掉部分那些能被程序所利用的时间,苹果称之为观察者效应。
延时模式:iOS4之后的新特性,该模式会最小化instrument对cpu的观察者效应,当你录制时,这种模式会禁用instrument的实时动态刷新过程,直到录制结束,这些数据才会显示出来,所以称为延时模式,如果您要开启这个选项:
当开启延时模式录制时,您看不到instrument的实时数据,界面如下:
look并没有对两种模式的性能数据做过详尽的对比,暂不清楚两种模式的数据差别有多大
instrument4.0之后的新特性
Specific Data mining
在某行信息上,按住controle+左键或在某行上直接右键,可以进行一些过滤
You select one of five focus options to focus on specific parts of the call tree:
Focus on subtree
只显示选中符号的子树,上面的调用均不显示
Focus on calls made by <symbol name>
只展示该符号发起的子树调用,上面的调用除了根调用均不显示
Focus on callers of <symbol name>
Displays only the subtrees with callers of the selected symbol.
Focus on calls made by <library name>
Displays only the subtrees with calls made by symbols in the selected symbol’s library.
Focus on callers of <library name>
Displays only the subtrees with callers of symbols in the selected symbol’s library.
支持直接将详情面板中的信息拷贝到文本中,
按住command键,可以同时选择不连续的多行,然后按command+C,可以直接拷贝到文本中
支持看源代码时,扩展详情面板有汇总信息,并可以选择升序/降序排列,选中汇总信息表中某行,源代码会对应显示
其他视图
下面主要介绍其他两种视图:cpu视图和线程视图
cpu视图(cpu strategy)
苹果官网上提到,多核的情况下,如果每个核利用率过高,而其他核利用率过低,意味着程序需要优化,上图中,笔者的demo程序两个核运行较均衡。
苹果官网上提供的不均衡的场景:
如果在4核机器上,能把程序写成如上图所示,笔者认为那也不是一般滴程序员。
线程视图
如上图所示,笔者demo程序中共有4个线程,第一个是主线程,用鼠标任意点一个采样点,将会出现和扩展详情面板里一样的调用栈信息
五、参考文档
Time Profiler Instrument官方文档:
Analyzing CPU Usage in Your App官方文档
How to Use Instruments in Xcode
http://www.raywenderlich.com/23037/how-to-use-instruments-in-xcode
time profile详细面板和其他工具的介绍
KISS Time Profiling
http://www.digital-wave.com/blog/2013/02/08/profiling-macro/
设定用户标记
Tuning performance with Instruments:
http://volonbolon.net/post/897931352/tuning-performance-with-instruments
两种录制模式的介绍反汇编 charge prune flatten
self self % # self carmelosui的提问:
命令行启动instrument:
http://diogogmt.wordpress.com/2012/09/17/using-instruments-time-profiler/
Time profiler instruments not showing objective c functions
iOS 5 Tech Talk: Michael Jurewitz on Performance Measurement
http://oleb.net/blog/2011/11/ios5-tech-talk-michael-jurewitz-on-performance-measurement/
launch timePay special attention to the Self column.
iOS SDK: Time Profiling with Instruments
http://mobile.tutsplus.com/tutorials/iphone/ios-sdk-time-profiling-with-instruments/
讲了一个重点,设置用户标记和设定时间范围
此文对应较差劲的中文翻译:
http://blog.163.com/zhuhongwei_2012/blog/static/19541097720130933430461
斯坦福ios开发教程- Time Profiler (November 4, 2011)
http://v.youku.com/v_show/id_XNDUyMjIwNTY4.html
New Features in Instruments 4.0
原文地址:https://www.cnblogs.com/linganxiong/p/9603564.html