linux c 用户态调试追踪函数调用堆栈以及定位段错误[转载]

一般察看函数运行时堆栈的方法是使用GDB(bt命令)之类的外部调试器,但是,有些时候为了分析程序的BUG,(主要针对长时间运行程序的分析),在程序出错时打印出函数的调用堆栈是非常有用的。

在glibc头文件"execinfo.h"中声明了三个函数用于获取当前线程的函数调用堆栈。

int backtrace(void **buffer,int size)

该函数用于获取当前线程的调用堆栈,获取的信息将会被存放在buffer中,它是一个指针列表。参数 size 用来指定buffer中可以保存多少个void* 元素。函数返回值是实际获取的指针个数,最大不超过size大小

在buffer中的指针实际是从堆栈中获取的返回地址,每一个堆栈框架有一个返回地址

注意:某些编译器的优化选项对获取正确的调用堆栈有干扰,另外内联函数没有堆栈框架;删除框架指针也会导致无法正确解析堆栈内容

char ** backtrace_symbols (void *const *buffer, int size)

backtrace_symbols将从backtrace函数获取的信息转化为一个字符串数组. 参数buffer应该是从backtrace函数获取的指针数组,size是该数组中的元素个数(backtrace的返回值)

函数返回值是一个指向字符串数组的指针,它的大小同buffer相同.每个字符串包含了一个相对于buffer中对应元素的可打印信息.它包括函数名,函数的偏移地址,和实际的返回地址

现在,只有使用ELF二进制格式的程序才能获取函数名称和偏移地址.在其他系统,只有16进制的返回地址能被获取.另外,你可能需要传递相应的符号给链接器,以能支持函数名功能(比如,在使用GNU ld链接器的系统中,你需要传递(-rdynamic), -rdynamic可用来通知链接器将所有符号添加到动态符号表中,如果你的链接器支持-rdynamic的话,建议将其加上!)

该函数的返回值是通过malloc函数申请的空间,因此调用者必须使用free函数来释放指针.

注意:如果不能为字符串获取足够的空间函数的返回值将会为NULL

void backtrace_symbols_fd (void *const *buffer, int size, int fd)

backtrace_symbols_fd与backtrace_symbols 函数具有相同的功能,不同的是它不会给调用者返回字符串数组,而是将结果写入文件描述符为fd的文件中,每个函数对应一行.它不需要调用malloc函数,因此适用于有可能调用该函数会失败的情况

下面是glibc中的实例(稍有修改):

 1 #include <execinfo.h>
 2 #include <stdio.h>
 3 #include <stdlib.h>
 4
 5 /* Obtain a backtrace and print it to @code{stdout}. */
 6 void print_trace (void)
 7 {
 8     void    * array[10];
 9     size_t  size;
10     char    ** strings;
11     size_t  i;
12
13     size = backtrace(array, 10);
14     strings = backtrace_symbols (array, size);
15     if (NULL == strings)
16     {
17         perror("backtrace_synbols");
18         Exit(EXIT_FAILURE);
19     }
20
21     printf ("Obtained %zd stack frames.\n", size);
22
23     for (i = 0; i < size; i++)
24         printf ("%s\n", strings[i]);
25
26     free (strings);
27       strings = NULL;
28 }
29
30 /* A dummy function to make the backtrace more interesting. */
31 void dummy_function (void)
32 {
33     print_trace ();
34 }
35
36 int main (int argc, char *argv[])
37 {
38     dummy_function ();
39     return 0;
40 }

输出如下:

Obtained 4 stack frames.
./execinfo() [0x80484dd]
./execinfo() [0x8048549]
./execinfo() [0x8048556]
/lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3) [0x70a113]

我们还可以利用这backtrace来定位段错误位置。

通常情况系,程序发生段错误时系统会发送SIGSEGV信号给程序,缺省处理是退出函数。我们可以使用 signal(SIGSEGV, &your_function);函数来接管SIGSEGV信号的处理,程序在发生段错误后,自动调用我们准备好的函数,从而在那个函数里来获取当前函数调用栈。

举例如下:

 1 #include <stdio.h>
 2 #include <stdlib.h>
 3 #include <stddef.h>
 4 #include <execinfo.h>
 5 #include <signal.h>
 6
 7 void dump(int signo)
 8 {
 9     void *buffer[30] = {0};
10     size_t size;
11     char **strings = NULL;
12     size_t i = 0;
13
14     size = backtrace(buffer, 30);
15     fprintf(stdout, "Obtained %zd stack frames.nm\n", size);
16     strings = backtrace_symbols(buffer, size);
17     if (strings == NULL)
18     {
19         perror("backtrace_symbols.");
20         exit(EXIT_FAILURE);
21     }
22
23     for (i = 0; i < size; i++)
24     {
25         fprintf(stdout, "%s\n", strings[i]);
26     }
27     free(strings);
28     strings = NULL;
29     exit(0);
30 }
31
32 void func_c()
33 {
34     *((volatile char *)0x0) = 0x9999;
35 }
36
37 void func_b()
38 {
39     func_c();
40 }
41
42 void func_a()
43 {
44     func_b();
45 }
46
47 int main(int argc, const char *argv[])
48 {
49     if (signal(SIGSEGV, dump) == SIG_ERR)
50         perror("can‘t catch SIGSEGV");
51     func_a();
52     return 0;
53 }                                               

编译程序:
gcc -g -rdynamic test.c -o test; ./test
输出如下:

Obtained6stackframes.nm
./backstrace_debug(dump+0x45)[0x80487c9]
[0x468400]
./backstrace_debug(func_b+0x8)[0x804888c]
./backstrace_debug(func_a+0x8)[0x8048896]
./backstrace_debug(main+0x33)[0x80488cb]
/lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3)[0x129113]

接着:
objdump -d test > test.s
在test.s中搜索804888c如下:

8048884 <func_b>:
8048884: 55 push %ebp
8048885: 89 e5 mov %esp, %ebp
8048887: e8 eb ff ff ff call 8048877 <func_c>
804888c: 5d pop %ebp
804888d: c3 ret

其中80488c时调用(call 8048877)C函数后的地址,虽然并没有直接定位到C函数,通过汇编代码, 基本可以推出是C函数出问题了(pop指令不会导致段错误的)。
我们也可以通过addr2line来查看

addr2line 0x804888c -e backstrace_debug -f

输出:

func_b
/home/astrol/c/backstrace_debug.c:57

参考链接: http://blog.csdn.net/jasonchen_gbd/article/details/44066815

参考代码: https://github.com/castoz/backtrace

时间: 2024-12-23 04:11:11

linux c 用户态调试追踪函数调用堆栈以及定位段错误[转载]的相关文章

Linux下利用backtrace追踪函数调用堆栈以及定位段错误[转]

来源:Linux社区  作者:astrotycoon 一般察看函数运行时堆栈的方法是使用GDB(bt命令)之类的外部调试器,但是,有些时候为了分析程序的BUG,(主要针对长时间运行程序的分析),在程序出错时打印出函数的调用堆栈是非常有用的. 在glibc头文件"execinfo.h"中声明了三个函数用于获取当前线程的函数调用堆栈. int backtrace(void **buffer,int size) 该函数用于获取当前线程的调用堆栈,获取的信息将会被存放在buffer中,它是一个

linux下利用backtrace追踪函数调用堆栈以及定位段错误

一般察看函数运行时堆栈的方法是使用GDB(bt命令)之类的外部调试器,但是,有些时候为了分析程序的BUG,(主要针对长时间运行程序的分析),在程序出错时打印出函数的调用堆栈是非常有用的. 在glibc头文件"execinfo.h"中声明了三个函数用于获取当前线程的函数调用堆栈. [cpp] view plain copy print? int backtrace(void **buffer,int size) 该函数用于获取当前线程的调用堆栈,获取的信息将会被存放在buffer中,它是

linux系统用户态和内核态及其通信

究竟什么是用户态,什么是内核态,这两个基本概念以前一直理解得不是很清楚,根本原因个人觉得是在于因为大部分时候我们在写程序时关注的重点和着眼的角度放在了实现的功能和代码的逻辑性上,先看一个例子: 1)例子 C代码 1.     void testfork(){ 2.     if(0 = = fork()){ 3.     printf("create new process success!\n"); 4.     } 5.     printf("testfork ok\n

linux下C编程free()时出现飘忽诡异的段错误(核心已转储)问题

先说一下问题现场. 代码如下 free(volthisframe->Tops); free(volthisframe->Bots); printf("what\n"); free(volthisframe->SCTops); free(volthisframe->SCBots); 运行时出现段错误,"what"随机出现,也就是说可能是打印前出现段错误,也可能是打印后出现段错误.但最终定位就在这几行free里面. 人格保证,各个指针都有初始化,

初探Windows用户态调试机制

我们在感叹Onlydbg强大与便利的同时,是否考虑过它实现的原理呢? 作为一个技术人员知其然必知其所以然,这才是我们追求的本心. 最近在学习张银奎老师的<软件调试>,获益良多.熟悉Windows调试机制,对我们深入理解操作系统以及游戏保护的原理有着莫大好处. 0X01 初探调试原理 调试系统的实现思路如图所示: 调试器与被调试程序建立联系,程序像调试器发送调试信息,调试器暂停程序处理完调试信息后再恢复程序运行,如此周而复始. 下面我们看看如何用操作系统提供的API去实现一个简单的调试器. //

systemtap 用户态调试2

[[email protected] ~]# cat user.stpprobe process(@1).function(@2){print_ubacktrace();exit();} session 1 执行 stap user.stp "./a.out" "fun" session 2 执行 [[email protected] ~]# ./a.out session 1中打印显示结果 0x4004f9 : fun+0xb/0x12 [/root/a.out]

[Linux]进程——用户态编程相关

1,设定进程的最大资源 [cpp] view plaincopy struct rlimit rlim; rlim.rlim_cur = 8192; rlim.rlim_max = 8192; if (setrlimit(RLIMIT_NOFILE, &rlim)) { ERROR("Error setting RLIMIT_NOFILE, errno = %d\n", errno); }

Linux环境下段错误的产生原因及调试方法小结(转)

最近在Linux环境下做C语言项目,由于是在一个原有项目基础之上进行二次开发,而且 项目工程庞大复杂,出现了不少问题,其中遇到最多.花费时间最长的问题就是著名的“段错误”(Segmentation Fault).借此机会系统学习了一下,这里对Linux环境下的段错误做个小结,方便以后同类问题的排查与解决. 1. 段错误是什么 一句话来说,段错误是指访问的内存超出了系统给这个程序所设定的内存空间,例如访问了不存在的内存地址.访问了系统保护的内存地址.访问了只读的内存地址等等情况.这里贴一个对于“段

Linux环境下段错误的产生原因及调试方法小结

最近在Linux环境下做C语言项目,由于是在一个原有项目基础之上进行二次开发,而且项目工程庞大复杂,出现了不少问题,其中遇到最多.花费时间最长的问题就是著名的“段错误”(Segmentation Fault).借此机会系统学习了一下,这里对Linux环境下的段错误做个小结,方便以后同类问题的排查与解决. 1. 段错误是什么 一句话来说,段错误是指访问的内存超出了系统给这个程序所设定的内存空间,例如访问了不存在的内存地址.访问了系统保护的内存地址.访问了只读的内存地址等等情况.这里贴一个对于“段错