linux下调试core dump方式汇总,工作必备技能

共 4351字,需浏览 9分钟

 ·

2021-03-04 20:14

缘起

调试,是开发流程中一个非常重要的环节。每个程序员都应,具备调试代码的能力,尤其对于从事 Linux 下的开发的读者。

从事 linux 下后台开发,有时候会遇到程序突然崩溃的情况,也没有任何日志,这会让你不知所措。

今天给大家介绍一个 core 文件,用这个文件,我们可以找出对应
出错的代码行,感觉是不是很神奇。

透着树荫看着朦胧的太阳,晒着日光浴,感觉还不错。先学完这篇,我们再去欣赏风景。


什么是core dump

对于程序,由于各种异常或者 bug,导致在运行过程中,并且在满足一定条件下,产生一个叫做 core 的文件。

通常情况下,core 文件会包含了,程序运行时的
内存,寄存器状态,堆栈指针,内存管理信息还有各种函数调用堆栈信息等。

许多程序出错的时候,会产生一个 core 文件。通过工具分析这个文件,我们可以定位到,程序异常退出的时候对应的堆栈调用等信息。

打开 core dump 开关:ulimit -c unlimited

看一段有问题的代码:

#include<stdio.h>
 
int main()
{
       int *p=NULL;
       *p=0;
 
       printf("bad\n");
       return 0;
}


linux下编译和执行:

[root@VM-16-9-centos c++]# g++ -g main.cpp 
[root@VM-16-9-centos c++]# ./a.out 
Segmentation fault (core dumped)
[root@VM-16-9-centos c++]# ls
a.out  core.1989  main.cpp

上述代码一看就有错误,执行会产生 core dump。但是在大型项目中,用肉眼就很难看了。下面说明一下 linux 下调试 core dump 方法。


dmesg+addr2line调试

先介绍 2 个 linux 命令:

dmesg ,一种程序,用于检测和控制内核缓冲。程序用来帮助用户,了解系统的启动信息,可以获得出错堆栈地址。

addr2line ,可以将指令的地址和可执行映像转换成文件名,函数名或源代码的工具。这种功能将跟踪地址转换成更有意义的内容来说很有用。

在调用 addr2line 工具时,要使用 -e 选项来指定可执行映像,使用 -f 选项可以告诉工具输出函数名。

linux下操作过程:

[root@VM-16-9-centos c++]# dmesg | grep a.out 
[  212.330289] a.out[1946]: segfault at 0 ip 0000000000400571 sp 00007ffdf0aafbb0 error 6 in a.out[400000+1000]
[  227.437065] a.out[1989]: segfault at 0 ip 0000000000400571 sp 00007ffcfd01c8c0 error 6 in a.out[400000+1000]
[root@VM-16-9-centos c++]# 
[root@VM-16-9-centos c++]# addr2line -e a.out 0000000000400571
/root/c++/main.cpp:6

先通过dmesg找到对应出错的地址,再用 addr2line -e 将地址解析到对应的代码行


gdb调试

gdb 想必大家都有听说,Linux 下面一款常用的的调试工具。
gdb 编译器通常以 gdb 命令的形式在终端中使用,下面学习下常用调试选项。


bt :查看堆栈信息

i locals :查看当前程序栈的局部变量

i args :查看当前程序栈的参数

i catch :查看当前程序中栈帧的异常处理器

p a :打印变量的值

i register :查看当前寄存器的值

r :从运行程序至第一个断点,没有断点则一直运行完

quit :退出

gdb调试过程中,输入 r ,bt。r 是运行 a.out 文件,bt查看堆栈情况
我们不需要执行 gdb a.out,这样就相当于重新运行了 a.out 文件。然而在实际开发中,有很多问题都是
概率发生的,所以此方法不太实用。

linux下操作过程(省略部分 gdb 介绍信息):

[root@VM-16-9-centos c++]# gdb a.out core.1989 
Reading symbols from /root/c++/a.out...done.
[New LWP 1989]
bCore was generated by `./a.out'.
Program terminated with signal 11, Segmentation fault.
#0  0x0000000000400571 in main () at main.cpp:6
6        *p=0;
Missing separate debuginfos, use: debuginfo-install glibc-2.17-307.el7.1.x86_64 libgcc-4.8.5-44.el7.x86_64 libstdc++-4.8.5-44.el7.x86_64
(gdb) bt
#0  0x0000000000400571 in main () at main.cpp:6
(gdb) 


直接执行 gdb a.out core.1989,不用 r 命令避免程序重复执行。
使用 bt 命令,可以看到程序出错代码行


strace+addr2line调试

strace 是一个集诊断、调试、统计与一体的工具,我们可以使用strace,对应用的系统调用和信号传递的跟踪结果,来对应用进行分析,以达到解决问题,或者是了解应用工作过程的目的。

strace 的简单的用法就是,执行一个指定的命令,在指定的命令结束之后,它也就退出了。
在命令执行的过程中,
strace 会记录和解析命令进程的所有系统调用,以及这个进程所接收到的,所有的信号值

-c ,统计每一系统调用的所执行的时间,次数和出错的次数等

-p ,指定进程pid
-i  ,输出系统调用的入口指针

linux 下操作过程(省略部分加载信息):

[root@VM-16-9-centos c++]# strace -i ./a.out 
[00007f79d3573847] munmap(0x7f79d377200031038) = 0
[0000000000400571] --- SIGSEGV {si_signo=SIGSEGV, si_code=SEGV_MAPERR, si_addr=NULL} ---
[????????????????] +++ killed by SIGSEGV (core dumped) +++
Segmentation fault
[root@VM-16-9-centos c++]# addr2line -e a.out 0000000000400571
/root/c++/main.cpp:6


絮叨

linux 调试技巧很重要,平时用到的也会很多,掌握好这些很关键。通过这篇文章,希望读者能对 core dump 调试有大致的了解,更多 linux 知识和 linux 调试相关的知识,我下期会给大家继续更新。


给大家推荐一本linux学习书籍,感觉还不错!


 ·················· END ··················

点击关注公众号,免费领学习资料

                                                                 点“赞”和“在看”哦

浏览 141
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报