近期程序总是会在启动阶段崩溃,而这是一个网络服务程序,启动时会产生大量的网络通信工作。从现象来看是比较典型的内存溢出导致堆栈被摧毁的问题,即使是用gdb调试也看不到出错的问题点,可以推断出其实是发生了比较严重写非法内存区的动作。
经过不断排查,有一处网络接收逻辑与预期不符。具体现象是服务端已经发送了数据,而接收端recv方法报错,可是套接字状态却是正常的establish。再将errno值与描述打印出来查看是14, bad address提示。此时犯了一个大意的错误,想当然的将其归为套接字地址的异常,直至后来搜索时才发现其实是地址不可写,实际上是指用来接收的缓存区是不可写的。
问题到此发现,再将缓存区内存地址打印出来查看,果然是因为一个作为下标计算的值未经过网络字节序转换而导致数组越界太多。从此处也可以发现系统调用写内存方法其实对缓存区是有一个判断的,推测其原则是若内存区处于内核态则会返回bad address错,防止对系统造成破坏,但如果内存区处于用户态,则系统不会阻止,结果造成程序堆栈被破坏而导致崩溃。
时间: 2024-10-30 03:43:32