如何定位Release 版本中程序崩溃的位置 ---利用map文件 拦截windows崩溃函数

1       案例描述

作为Windows程序员,平时最担心见到的事情可能就是程序发生了崩溃(异常),这时Windows会提示该程序执行了非法操作,即将关闭。请与您的供应商联系。呵呵,这句微软的“名言”,恐怕是程序员最怕见也最常见的东西了。

在一个大型软件的测试过程中,初期出现程序崩溃似乎成了不可避免的事。其实测试中出现程序崩溃并不可怕,反而是测试的成功。作为开发的我们更需要关心的是程序中的哪个函数或哪一行导致了系统崩溃,这样才能有针对性的进行改正。

本文描述了自己总结的几种定位崩溃的办法。

2       案例分析

以下是几种常见的崩溃现象及对应的处理办法:

1.        对于Release版本必现的崩溃且在Debug版本上也崩溃的程序。

解决思路:去掉所有断点,直接在Debug版本上运行程序,在程序崩溃时,VC会自动跳转定位到崩溃代码行, 这种方法最简单也最常用。

2.        对于在Debug版本上不崩溃但Release版本崩溃的程序,很有可能是Debug和Release版本的差异。例如Debug版本所有成员在构造时会被清0,而Release版本所有成员在构造时是内存里面的原始值,而且Debug有运行时库做保护,这些都会导致某些程序在Debug正常而Release崩溃。

解决思路:1)在程序中加打印,通过程序崩溃之前的打印定位出错位置; 2)逐段注释代码,直到程序不崩溃为止。这种方法耗时较长,对程序员要求较高,而且对于那种不是必现的bug或者很难搭建执行环境的情况就较难处理了。

3.        对于在客户现场崩溃的情况,显然不适合直接带一台电脑去调试。

解决思路:应该有文件记录下崩溃信息,客服人员可以将崩溃信息文件发送给程序员,以便程序员查询崩溃原因,然后利用编译时生成MAP文件(工程信息文件,存放在版本编译机中)的信息来定位问题函数或问题代码行。下面就这种方法展开讨论一下:

3       解决过程

对于上节第三种情况,也是最难解决的情况,解决过程如下:

1.      崩溃回调注册,拦截Windows程序崩溃;

2.      在回调处理中,输出崩溃原因,崩溃内存地址,崩溃堆栈;

3.      工程输出map文件;

4.      通过崩溃内存地址以及map文件找出崩溃的函数。

5.      使用COD文件精确定位崩溃行

3.1     崩溃回调注册

实际上,只靠Windows的错误消息对话框提供的信息量是很有限的。用SetUnhandledExceptionFilter注册自定义错误处理回调函数,可以替换Win32默认的异常处理过滤器(top-level exception filter),而且能打印出崩溃堆栈,这对定位崩溃原因非常有用。

SetUnhandledExceptionFilter的函数原型:


LPTOP_LEVEL_EXCEPTION_FILTER SetUnhandledExceptionFilter(

LPTOP_LEVEL_EXCEPTION_FILTER lpTopLevelExceptionFilter );

功  能:注册和注销异常处理回调;

用  法:第一次调用注册异常处理回调,第二次调用注销;

返回值:返回当前的exception filter。需要保存这个函数指针,在注销异常处理回调的时候,以此为参数再次调用SetUnhandledExceptionFilter。打印异常处理也需要此值。

参数: 异常处理的回调函数;

3.2     输出崩溃信息

崩溃信息在异常回调函数中打印,输出到程序执行目录下的文件:

异常处理回调的函数原形:


LONG WINAPI CallBackDebugInfo ( EXCEPTION_POINTERS *pException);

功  能:异常处理回调处理,打印崩溃信息;

用  法:注册自定义错误处理回调:SetUnhandledExceptionFilter (CallBackDebugInfo);

返回值:EXCEPTION_CONTINUE_EXECUTION –  错误已经被修复,从异常发生处继续执行

EXCEPTION_CONTINUE_SEARCH    –  继续查找异常过滤器

EXCEPTION_EXECUTE_HANDLER   –  正常返回

参数: 崩溃信息结构,包含崩溃原因、崩溃模块、崩溃地址、崩溃堆栈等;

常见崩溃原因有:

EXCEPTION_ACCESS_VIOLATION = C0000005h   读写内存错误

EXCEPTION_INT_DIVIDE_BY_ZERO = C0000094h  除0错误

EXCEPTION_STACK_OVERFLOW = C00000FDh  堆栈溢出或者越界

EXCEPTION_GUARD_PAGE = 80000001h 由Virtual Alloc建立起来的属性页冲突

EXCEPTION_NONCONTINUABLE_EXCEPTION = C0000025h不可持续异常,程序无法恢复执行,异常处理例程不应处理这个异常

EXCEPTION_INVALID_DISPOSITION = C0000026h在异常处理过程中系统使用的代码

EXCEPTION_BREAKPOINT = 80000003h  调试时中断(INT 3)

EXCEPTION_SINGLE_STEP = 80000004h  单步调试状态(INT 1)

3.3     输出map文件

map文件记录程序的全局符号、源文件和代码行号信息,是整个程序工程信息的静态文本。通过文本阅读工具如Ultra Edit或记事本就可以打开Map文件。

在 VC 中,打开“Project Settings”选项页,选择 C/C++ 选项卡,并在最下面的 Project Options 里面输入:/Zd ,然后选择 Link 选项卡,选中“Generate mapfile”复选框。并在最下面的 Project Options 里面输入:/mapinfo:lines,表示生成 map 文件时,加入行信息。

最后编译就可以生成 MAP 文件,可以在工程的Debug或Release目录下找到刚刚生成的MAP文件,文件名为“工程名.map”。

3.4     使用map文件找出崩溃函数

      通过上面的步骤,已经得到了 MAP 文件,那么我们该如何利用它呢?下面一步步演示使用MAP文件定位程序崩溃行的过程。

1.我们先在代码中加入非法内存操作(最常见的异常)的代码:


BOOL CMainFrameDlg::OnInitDialog()

{

::SetProp(m_hWnd,AfxGetApp()->m_pszExeName, (HANDLE)1);

s32 *p=NULL;

*p= 123;

2.执行程序,程序在开始就异常,在异常打印文件中打印了如下信息:


======================== 崩溃信息 ==========================

崩溃时间: 2009/06/02 16:58:22

崩溃原因:非法内存操作

异常代码 = c0000005

异常地址 = 0x0045a76f

异常模块: E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\prj_win32\Release\pcmt2.exe

Section name: .text - offset(rva) : 0x0005976f

---------------------- Trips of Stack ----------------------

E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\prj_win32\Release\pcmt2.exe

name : pcmtver - location: 2bef

3.确定崩溃地址是:0x0005976f,在Map文件中定位函数:


0001:00059420 [email protected]@@[email protected]@@Z 0045a420 f  MainFrameDlg.obj

0001:00059460       [email protected]@@AAEXXZ 0045a460 f   MainFrameDlg.obj

0001:00059700       [email protected]@@[email protected] 0045a700 f   MainFrameDlg.obj

0001:00059730       [email protected]@@MAEHXZ 0045a730 f   MainFrameDlg.obj

0001:00059a10  [email protected]@@[email protected] 0045aa10 f   MainFrameDlg.obj

0001:00059c20       [email protected]@@IAEXXZ 0045ac20 f   MainFrameDlg.obj

根据00059730< 0005976f < 00059a10 ,确定是在CMainFrameDlg 的OnInitDialog函数中的某一行产生了异常。

3.5     使用map代码行定位崩溃行区间


Line numbers for .\Release\MainFrameDlg.obj(E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\source\MainFrameDlg.cpp) segment .text

498 0001:00059647   499 0001:00059667   501 0001:0005966e   502 0001:000596af

503 0001:000596ed   506 0001:00059700   507 0001:00059703   508 0001:00059708

510 0001:0005970f   511 0001:00059720   512 0001:00059723   515 0001:00059730

516 0001:0005974e   521 0001:0005976d   524 0001:0005977e   526 0001:0005978b

我们在map文件的代码行信息里查找不超过计算结果0x0005976f,但可以找最接近的数。发现是MainFrameDlg.cpp 文件中的:521 0001:0005976d,而程序实际崩溃行在519(注释行和空行也要计算在内),非常接近实际崩溃行了,考虑到程序实际执行的是汇编指令,我们可以在(516 ~524)行区间内寻找到实际崩溃行。

时间: 2024-10-23 22:01:55

如何定位Release 版本中程序崩溃的位置 ---利用map文件 拦截windows崩溃函数的相关文章

解决mingw动态库在vs下调用 release版本中会出现的奇怪问题

REF | NOREF /OPT:REF 清除从未引用的函数和/或数据,而 /OPT:NOREF 保留从未引用的函数和/或数据. 默认情况下,LINK 移除未引用的封装函数. 如果对象已经用 /Gy 选项编译过,它包含封装函数 (COMDAT). 此优化称为可传递的 COMDAT 消除. 若要重写该默认值并在程序中保留未引用的 COMDAT,请指定 /OPT:NOREF. 可以使用 /INCLUDE 选项重写特定符号的移除. 如果指定了 /DEBUG,/OPT 的默认项是 NOREF(否则,为 

C#.NET常见问题(FAQ)-如何生成release版本的程序,生成debug版本的程序

除了右击项目在生成中配置改成Release还要在顶部切换成Release ? ? 更多教学视频和资料下载,欢迎关注以下信息: 我的优酷空间: http://i.youku.com/acetaohai123 ? 我的在线论坛: http://csrobot.gz01.bdysite.com/ ? 问题交流: QQ:910358960 邮箱:[email protected] ? ?

VS2013生成Release版本MFC程序在其他机器上运行

对于自己机器安装了VS开发环境,生成MFC的exe文件能够在自己机器上运行,复制到其他目标机器可能出现不能运行的情况.下面就个人经历将发布的两中情况简要说明. 1.工程属性中:配置属性-常规,MFC使用类型选择“在共享的DLL中使用MFC”:C/C++ - 代码生成-MFC的使用 选择“多线程DLL(/MD)”这种情况下,若直接将exe文件放到目标机器运行,则需要目标机器安装相应的开发平台.或者将生成exe程序的依赖dll文件复制到目标机器的程序运行目录下:若用到第三方库,也要复制相应的dll文

ns2中程序未执行完无trace文件探究

最近几天在做仿真的过程中,程序执行了一点点就出错了,想分析一下trace文件发现还没有内容,这是为什么呢?不是MAC层的downtarget就是trace吗?明明已经从MAC层几进几出了为什么还是没有内容呢?带着这个疑问我查看了一下cmu-trace.cc文件,发现了这个: 原来trace文件的内容是先输入到pt_->buffer()这个缓冲区中,当缓冲区满后再输入到文件中,那么此时的缓冲区的长度是多少呢?在此,我继续在trace.h文件中找到pt_的定义 我们再看一下BaseTrace这个类中

debug、 release两个版本中正确运行的一些经验

在Qt编程中,默认的是debug版本,在编译器中可以正常的使用,但是单独运行.exe可执行文件时却发现系统提示缺少文件.其实就是缺少必要的.dll动态库文件.根据提示添加需要的.dll动态库文件即可.另外,这些动态库文件就在Qt的安装目录中,找到复制进去就行了. 并且,debug需要添加的动态库文件名字一般就是XXXd.dll文件,比如Qt5Cored.dll文件.但是在release版本中,需要添加的文件根debug版本中的是一样的,但是名字有一点区别.比如在debug版本中添加的是Qt5Co

VS中 Debug和Release版本的区别

VS Debug和Release版本的区别 1. 变量.大家都知道,debug跟release在初始化变量时所做的操作是不同的,debug是将每个字节位都赋成0xcc(注1),而release的赋值近似于随机(我想是直接从内存中分配的,没有初始化过).这样就明确了,如果你的程序中的某个变量没被初始化就被引用,就很有可能出现异常:用作控制变量将导致流程导向不一致:用作数组下标将会使程序崩溃:更加可能是造成其他变量的不准确而引起其他的错误.所以在声明变量后马上对其初始化一个默认的值是最简单有效的办法

【转】Debug 运行正常,Release版本不能正常运行

http://blog.csdn.net/ruifangcui7758/archive/2010/10/18/5948611.aspx引言 如果在您的开发过程中遇到了常见的错误,或许您的Release版本不能正常运行而Debug版本运行无误,那么我推荐您阅读本文:因为并非如您想象的那样,Release版本可以保证您的应用程序可以象Debug版本一样运行. 如果您在开发阶段完成之后或者在开发进行一段时间之内从来没有进行过Release版本测试,然而当您测试的时候却发现问题,那么请看我们的调试规则1

Debug与Release版本的区别详解

原文链接 Debug 和 Release 并没有本质的区别,他们只是VC预定义提供的两组编译选项的集合,编译器只是按照预定的选项行动.如果我们愿意,我们完全可以把Debug和Release的行为完全颠倒过来.当然也可以提供其他的模式,例如自己定义一组编译选项,然后命名为MY_ABC等.习惯上,我们仍然更愿意使用VC已经定义好的名称.     Debug版本包括调试信息,所以要比Release版本大很多(可能大数百K至数M).至于是否需要DLL支持,主要看你采用的编译选项.如果是基于ATL的,则D

Debug与Release版本的区别

Debug 和 Release 并没有本质的区别,他们只是VC预定义提供的两组编译选项的集合,编译器只是按照预定的选项行动.如果我们愿意,我们完全可以把Debug和Release的行为完全颠倒过来.当然也可以提供其他的模式,例如自己定义一组编译选项,然后命名为MY_ABC等.习惯上,我们仍然更愿意使用VC已经定义好的名称. Debug版本包括调试信息,所以要比Release版本大很多(可能大数百K至数M).至于是否需要DLL支持,主要看你采用的编译选项.如果是基于 ATL的,则Debug和Rel