google开源的C++性能分析工具 - gperftools

gperftools是Google提供的一套工具,其中的一个功能是CPU profiler,用于分析程序性能,找到程序的性能瓶颈。

安装

gperftools:http://code.google.com/p/gperftools/downloads/list

libunwind:http://download.savannah.gnu.org/releases/libunwind/

64位操作系统需要安装libunwind,官方推荐版本是libunwind-0.99-beta

安装过程:./configure [--disable-shared] &&make && make install

Graphviz是一个由AT&T实验室启动的开源工具包,用于绘制DOT语言脚本描述的图形,gperftools依靠此工具生成图形分析结果。

安装命令:yum install graphviz

1.编译libunwind库

因为使用的是X86_64的Linux系统,因此需要安装libunwind库。

安装方法很简单,常见的configure,make,make install的套路。

wget http://download.savannah.gnu.org/releases/libunwind/libunwind-0.99-beta.tar.gz

tarxvzf libunwind-0.99-beta.tar.gz

cd libunwind-0.99-beta

./configure

make

makeinstall

因为默认的libunwind安装在/usr/local/lib目录下,需要将这个目录添加到系统动态库缓存中。

echo "/usr/local/lib" > /etc/ld.so.conf.d/usr_local_lib.conf
/sbin/ldconfig

libunwind的最新版本是1.0.1,那为什么
不选择最新版本呢?google
perftools的INSTALL文件中给了说明。版本低于0.99-beta的libunwind与preftools一起工作可能不正常,但是高于
0.99-beta的版本中可能包含一些与perftools不兼容的代码(因为libunwind会调用malloc,可能会导致死锁)。
libunwind在X86_64平台上和perftools有不少问题,不过不会影响核心的tcmalloc库,但是会影响perftools中的工
具,例如cpu-profiler,heap-checker,heap-profiler。

2.编译google-perftools

因为我们只需要tcmalloc功能,因此不编译google-perftools中的其他工具。

wget http://gperftools.googlecode.com/files/google-perftools-1.9.1.tar.gz

tarxvzf google-perftools-1.9.1.tar.gz

cd google-perftools-1.9.1

./configure --disable-cpu-profiler --disable-heap-profiler --disable-heap-checker --enable-minimal--disable-dependency-tracking

make

makeinstall

/sbin/ldconfig

用法

1.目标程序中引入头文件<google/profiler.h>,链接libprofiler库,64位操作系统同时链接libunwind库,在需要分析代码的起点和终点调用ProfilerStart()函数和ProfilerStop()函数

2.编译链接,运行程序

分析输出

pprof脚本用于分析profile文件并输出结果,包括文本和图形两种输出风格。

例如:demo是目标程序,my.prof是profile文件

生成文本风格结果:pprof --text ./demo my.prof >profile.txt

生成图形风格结果:pprof --pdf ./demo my.prof > profile.pdf

对于一个函数的CPU使用时间分析,分为两个部分:

1.整个函数消耗的CPU时间,包括函数内部其他函数调用所消耗的CPU时间

2.不包含内部其他函数调用所消耗的CPU时间(内联函数除外)

关于文本风格输出结果

序号

说明

1

分析样本数量(不包含其他函数调用)

2

分析样本百分比(不包含其他函数调用)

3

目前为止的分析样本百分比(不包含其他函数调用)

4

分析样本数量(包含其他函数调用)

5

分析样本百分比(包含其他函数调用)

6

函数名

关于图形风格输出结果

1.节点

每个节点代表一个函数,节点数据格式:

Class Name

Method Name

local (percentage)

of cumulative (percentage)

local时间是函数直接执行的指令所消耗的CPU时间(包括内联函数);性能分析通过抽样方法完成,默认是1秒100个样本,一个样本是10毫秒,即时间单位是10毫秒;

cumulative时间是local时间与其他函数调用的总和;

如果cumulative时间与local时间相同,则不打印cumulative时间项。

2.有向边

调用者指向被调用者,有向边上的时间表示被调用者所消耗的CPU时间

示例

代码如下,可以看出,CPU消耗集中在func1()和func2()两个函数,func2()消耗时间约为func1()的两倍。

#include <google/profiler.h>

#include <iostream>

using namespace std;

void func1() {

int i = 0;

while (i < 100000) {

++i;

}

}

void func2() {

int i = 0;

while (i < 200000) {

++i;

}

}

void func3() {

for (int i = 0; i < 1000; ++i) {

func1();

func2();

}

}

int main(){

ProfilerStart("my.prof"); // 指定所生成的profile文件名

func3();

ProfilerStop(); // 结束profiling

return 0;

}

然后编译链接运行,使用pprof生成分析结果

g++-o demo demo.cpp -lprofiler -lunwind

pprof--text ./demo my.prof > output.txt

pprof--pdf ./demo my.prof > output.pdf

查看分析结果,程序是122个时间样本,其中,func1()是40个时间样本,约为400毫秒;func2()是82个时间样本,约为820毫秒。

Total: 122 samples

82   67.2%  67.2%       82  67.2% func2

40   32.8% 100.0%       40  32.8% func1

0    0.0% 100.0%      122 100.0% __libc_start_main

0    0.0% 100.0%      122 100.0% _start

0    0.0% 100.0%      122 100.0% func3

0    0.0% 100.0%      122 100.0% main

时间: 2024-11-03 21:57:56

google开源的C++性能分析工具 - gperftools的相关文章

Yahoo 开源的 MySQL 性能分析工具(MySQL Performance Analyzer)

原文地址:https://github.com/yahoo/mysql_perf_analyzer MySQL Performance Analyzer is an open source project for MySQL performance monitoring and analysis. This repository includes two sub projects: Java web application project myperf Java web server jetty

三种Linux性能分析工具的比较

无论是在CPU设计.服务器研发还是存储系统开发的过程中,性能总是一个绕不过去的硬指标.很多时候,我们发现系统功能完备,但就是性能不尽如意,这时候就需要找到性能瓶颈.进行优化.首先我们需要结合硬件特点.操作系统和应用程序的特点深入了解系统内部的运行机制.数据流图和关键路径,最好找出核心模块.建立起抽象模型:接着需要利用各种性能分析工具,探测相关模块的热点路径.耗时统计和占比.在这方面,Linux操作系统自带了多种灵活又具有专对性的工具,此外一些厂家也开源了不少优秀的性能分析工具.下面就结合笔者最近

Java 性能分析工具

如何利用 JConsole观察分析Java程序的运行,进行排错调优 http://jiajun.iteye.com/blog/810150 如何使用JVisualVM进行性能分析 http://jiajun.iteye.com/blog/1180230 全功能的Java剖析工具(profiler) http://www.blogjava.net/mrzhangshunli/archive/2007/08/27/140088.html http://www.cnblogs.com/jayzee/p

Visual Studio代码性能分析工具

AMD CodeXL 2011年发布的AMD CodeAnalyst Performance Analyzer 现在已经被AMD CodeXL所替代.AMD CodeXL的主要目的是帮助开发者更好利用CPU, GPU和APU的计算性能,具有强大的GPU调试.CPU和GPU代码分析.及静态的OpenCL内核性能分析等能力. AMD提供了支持Windows 7.Windows 8和Linux系统的单机版CodeXL分析工具.在Visual Studio 2010,2012和2013上也有AMD Co

11个Visual Studio代码性能分析工具

软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和性能测试,从而大大简化程序员进行代码性能优化的过程.MSDN杂志2011年7月份曾发布主题为“.NET代码分析工具和技术”的那一期,让广大程序员收获颇丰.四年过去之后,这些工具又进一步做出了很多改进,同时也出现了更多的选择.本文对当前主流的一些Visual Studio代码性能分析工具进行简单的梳理

Android性能分析工具介绍

1. Android系统性能调优工具介绍 http://blog.csdn.net/innost/article/details/9008691 TraceviewSystraceOprofile 2. [腾讯开源]Android性能测试工具APT使用指南 http://www.csdn.net/article/2014-04-23/2819366-tencent-APT-open-source-tool-guide APT源码地址:https://code.csdn.net/Tencent/a

PHP性能分析工具XHProf安装使用教程

HProf是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低,还可以用在生产环境中,也可以由程序开关来控制是否进行profile.基于浏览 器的性能分析用户界面能更容易查看,或是与同行们分享成果.也能绘制调用关系图.在数据收集阶段,它记录调用次数的追踪和包容性的指标弧在动态callgraph的一个程序. 它独有的数据计算的报告/后处理阶段.在数据收集时,XHProfd通过检测循环来处理递归的函数调用,并通过给递归调用中每个深度的调用一个有用的命名来避开

OProfile 性能分析工具

官方网站:http://oprofile.sourceforge.net/news/ oprofile.ko模块本文主要介绍Oprofile工具,适用系统的CPU性能分析,最主要它能深入内核函数,这是很多用户态工具达不到的地方. Oprofile是一个内核态工具,通过oprofile.ko模块内核模块来获取数据需要在加载oprofile.ko模块的时候,传递”timer=1″参数. modprobe oprofile timer=1 oProfilehttp://baike.baidu.com/

11 个 Visual Studio 代码性能分析工具

软件开发中的性能优化对程序猿来说是一个很重要的问题. 一个小问题可能成为一个大的系统的瓶颈. 可是对于程序猿来说.通过自身去优化代码是十分困难的.幸运的是.有一些很棒的工具能够帮助程序猿进行代码分析和性能測试,从而大大简化程序猿进行代码性能优化的过程.MSDN 杂志 2011 年 7 月份曾公布主题为".NET 代码分析工具和技术"的那一期.让广大程序猿收获颇丰.四年过去之后,这些工具又进一步做出了非常多改进,同一时候也出现了很多其它的选择.很多其它应用代码安全工具请点击:http:/