《Linux内核设计与实现》读书笔记 18

第十八章调试

18.1 准备开始

         需要准备的东西:

l  一个bug:大部分bug通常都不是行为可靠而且定义明确的

l  一个藏匿bug的内核版本:找出bug首先出现的版本

l  相关内核代码的知识和运气

最好能让bug重现,有一些bug存在而且有人没办法让他重现,因为内核与用户程序和硬件间的交互很微妙。

18.2内核中的bug

可以有无数种原因产生,表象也变化多端。代码中的错误往往引发一系列连锁反应,目击者才看到bug。

18.3通过打印来调试

内核提供了打印函数printk()。和C库中的printf()几乎相同。

Printk()的特质:

l  健壮性:任何时候,任何地方都可以调用。仅有的不能调用的情况是在终端还没初始化之前。Early_printk()再启动过程初期就可以打印。

l  日志等级:可以在打印的消息的开头加上记录等级,内核通过记录等级和当前终端的记录登记比较,来决定是否打印。最好给消息加记录等级 ,不然就是默认等级KERN_WARNING。<0>到<7>。

l  记录缓冲区:内核消息保存在一个环形队列中,单处理器默认16k,环形可以新信息覆盖老信息。好处是同步问题容易解决,记录也容易维护。坏处是可能会丢失信息。

l  Syslogd和klogd:用户空间的守护进程klogd从记录缓冲区中获取内核消息,再通过syslogd守护进程将它们保存在系统日志。

l  Printf()到printk():等啥时候写C语言会把pringf()错写成printk()就行了。

18.4opps

Oops:是内核告知用户有不幸发生的最常用方式。因为内核不能自我修复,也不能将自己杀死,所以只有发oops。通常发完oops,内核会处于不稳定状态。内核必须适当的从当前上下文环境退出并尝试恢复对系统的控制,但一般会死机。寄存器上下文和回溯线索。

l  Ksymoops:解析opps信息。Ksymoops save_oops.txt

l  Kallsyms:解码不需要再使用system.map和ksymoops工具了

18.5 内核调试配置选项

为了方便调试和测试内核代码,内核提供了配置选项。可以启用slab layer debugging,high-memory debugging,I/O mapping debugging,spin-lock debugging,stack-overflow checking.其中最有用的是sleep-inside-spinlock check

.

18.6引发bug并打印信息

一些内核调用可以用来方便标记bug,BUG(),BUG_ON()

Panic()可以引发更严重的错误。dumo_stack()仅在终端上打印寄存器上下文和跟踪线索。

18.7神奇的系统请求键

Sysrq(系统请求)键是救命稻草,无论内核出于什么状态,都可以和内核进行通信。

Sysrq-h:获取一份可用选项列表

Sysrq-s:将脏缓冲区跟硬盘交换分区同步

Sysrq-u:卸载所有的文件系统

Sysrq-b:重启设备

18.8内核调试器的传奇

Gdb:gdb vmlinux /proc/kcore启动调试器。Gdb不能修改内核数据,不能设断点。

Kgdb:一个补丁,让我们在远端主机上通过串口利用gdb的所有功能得内核进行调试。

18.9探测系统

用UID作为选择条件

使用条件变量

使用统计量

重复频率限制

18.10用二分法找出引发罪恶的变更

知道bug是什么版中出现的,就可以对比没有bug的版本,找出引发bug的代码变更。用二分法找到两个相继版本,一个有bug,一个没bug

18.11使用Git进行二分搜索

Git源码管理工具提供二分搜索机制

时间: 2024-11-07 23:41:03

《Linux内核设计与实现》读书笔记 18的相关文章

Linux内核设计与实现 读书笔记 转

Linux内核设计与实现  读书笔记: http://www.cnblogs.com/wang_yb/tag/linux-kernel/ <深入理解LINUX内存管理> http://blog.csdn.net/yrj/article/category/718110 Linux内存管理和性能学习笔记(一) :内存测量与堆内存 第一篇 内存的测量 2.1. 系统当前可用内存 # cat /proc/meminfoMemTotal:        8063544 kBMemFree:       

Linux内核设计与实现读书笔记——第三章

Linux内核设计与实现读书笔记——第三章 进程管理 20135111李光豫 3.1进程 1.进程即处于执行期的程序,并不局限于一个可执行的代码,是处于执行期程序以及其相关资源的总称. 2.Linux系统中,对于进程和线程并没有明显的区分,线程是一种特殊的进程. 3.Linux系统中,常用fork()进程创建子进程.调用fork()进程的成之为其子进程的父进程. 4.fork()继承实际上由clone()系统调用实现.最后通过exit()退出执行. 3.2任务描述符及任务结构 1.任务队列实质上

Linux内核设计与实现读书笔记——第十八章

第18章 调试 调试工作艰难是内核级开发区别于用户级开发的一个显著特点,相比于用户级开发,内核调试的难度确实要艰苦得多.更可怕的是,它带来的风险比用户级别更高,内核的一个错误往往立刻就能让系统崩溃. 18.1 准备开始 一个bug.听起来很可笑,但确实需要一个确定的bug.如果错误总是能够重现的话,那对我们会有很大的帮助(有一部分错误确实如此).然而不幸的是,大部分bug通常都不是行为可靠而且定义明确的. 一个藏匿bug的内核版本.如果你知道这个bug最早出现在哪个内核版本中那就再理想不过了.

Linux内核设计与实现 读书笔记

第三章 进程管理 1. fork系统调用从内核返回两次: 一次返回到子进程,一次返回到父进程 2. task_struct结构是用slab分配器分配的,2.6以前的是放在内核栈的栈底的:所有进程的task_struct连在一起组成了一个双向链表 3. 2.6内核的内核栈底放的是thread_info结构,其中有指向task_struct的指针: 4. current宏可以找到当前进程的task_struct:X86是通过先找到thread_info结构,而PPC是有专门的寄存器存当前task_s

《Linux内核设计与实现读书笔记之系统调用》

1.系统调用的概念 为了和用户空间上运行的进程进行交互,内核提供了一组借口.透过该接口,应用程序可以访问硬件设备和其他操作系统资源.这组借口在应用程序和内核之间扮演着使者的角色.同时,这组接口也保证了系统稳定可靠,避免应用程序肆意妄行,惹出麻烦.Linux系统的系统调用作为C库的一部分提供,其调用过程中的实例如下图所示: 从程序员的角度看,系统调用无关紧要,他们只需要跟API打交道就可以了.相反,内核只跟系统调用打交道,库函数以及应用程序是怎么使用系统调用不是内核所关心的. 2.系统调用的处理程

Linux内核设计与实现——读书笔记2:进程管理

1.进程: (1)处于执行期的程序,但不止是代码,还包括各种程序运行时所需的资源,实际上进程是正在执行的 程序的实时结果. (2)程序的本身并不是进程,进程是处于执行期的程序及其相关资源的总称. (3)两个或两个以上并存的进程可以共享诸如打开的文件,地址空间等共享资源. (4)在Linux中通常是调用fork()系统函数的结果,通过复制一个现有的进程来创建一个新的子进程. fork()系统函数 (5)fork在这个系统调用结束时,在同一位置上返回两次(从内核返回两次),父进程恢复运行,子进程开始

《Linux内核设计与实现》笔记-1-linux内核简介

一.Linux内核相对于传统的UNIX内核的比较: (1):Linux支持动态内核模块.尽管Linux内核也是整体式结构,可是允许在需要的时候动态哦卸除(rmmod xxx)和加载内核模块(insmod  xxx.ko). (2):Linux支持对称多处理(SMP)机制,尽管许多UNIX的变体也支持SMP,但是传统的UNIX并不支持这种机制. (3):Linux内核可以抢占(preemptive).在Linux 2.4以及以前的版本都是不支持内核抢占的,在Linux 2.6以及以后就支持了. (

《Linux内核设计与实现》笔记——内核同步简介

相关概念 竞争条件 多个执行线程(进程/线程/中断处理程序)并发(并行)访问共享资源,因为执行顺序不一样造成结果不一样的情况,称为竞争条件(race condition) 举例说明 #include<thread> using namespace std; int i = 0; void thread1(){ //for(int x=0;x<100000;x++) i++; } void thread2(){ //for(int x=0;x<100000;x++) i++; } i

Linux内核架构与底层--读书笔记

linux中管道符"|"的作用 命令格式:命令A|命令B,即命令1的正确输出作为命令B的操作对象(下图应用别人的图片) 1. 例如: ps aux | grep "test"  在 ps aux中的結果中查找test. 2. 例如:   find . -name "*.txt" | xargs grep "good" -n --color=auto   把find的结果当成参数传入到grep中,即在那些文件内部查找good关键

Linux内核设计与实现 阅读笔记:8、下半部和推后执行的工作

By:Ailson Jack Date:2016.04.10 个人博客:www.only2fire.com 本文在我博客的地址是:http://www.only2fire.com/archives/871.html,排版更好,便于学习. 上一章简单的讲了一下中断的上半部(中断处理程序),这一章就讲讲中断的下半部以及下半部的几种实现机制,最后简单的写了几个测试的例子来测试软中断.tasklet和工作队列. 测试程序下载地址:. 1.下半部简述 中断下半部的任务是执行与中断处理密切相关但中断处理程序