如何快速定位找出SEGV内存错误的程序Bug

2023-06-13,,

通过查看php日志/usr/local/php/var/log/php-fpm.log,有如下警告信息:

    [16-Mar-2015 16:03:09] WARNING: [pool www] child 9453 exited on signal 11 (SIGSEGV) after 9.601040 seconds from start

日志中的信息表明,进程号为9453的进程由于收到SIGSEGV信号而退出了。收到这个信号的时候,程序是可以生成core文件的。不过通过日志我们可以知道进程9453退出时没有生成core文件。因为在php-fpm的日志中,如果退出时生成了core文件,日志中会有“SIGSEGV – core dumped”字样。如:

    [16-Mar-2015 16:04:29] WARNING: [pool www] child 9581 exited on signal 11 (SIGSEGV - core dumped) after 15.921916 seconds from start

core dump文件对于诊断Linux中程序的问题非常有用。当程序异常退出的时候,可能会生成core文件。如,程序写一个不属于他的内存,操作系统出于保护,会发信号给程序,程序可能会因此而退出,退出的时候可能会生成core文件。我们可以通过分析core文件,找出程序中那里有内存问题。这篇文章主要是阐述生成core文件需要做的一些设置。

如何生成core文件

默认Linux操作系统是不允许生成core文件的。如下:

    [root@linuxeye ~]# ulimit -a
    core file size          (blocks, -c) 0
    data seg size           (kbytes, -d) unlimited
    scheduling priority             (-e) 0
    file size               (blocks, -f) unlimited
    pending signals                 (-i) 5762
    max locked memory       (kbytes, -l) 64
    max memory size         (kbytes, -m) unlimited
    open files                      (-n) 65535
    pipe size            (512 bytes, -p) 8
    POSIX message queues     (bytes, -q) 819200
    real-time priority              (-r) 0
    stack size              (kbytes, -s) 10240
    cpu time               (seconds, -t) unlimited
    max user processes              (-u) 65535
    virtual memory          (kbytes, -v) unlimited
    file locks                      (-x) unlimited

可以通过如下命令解除限制:

    [root@linuxeye ~]# ulimit -c unlimited
    [root@linuxeye ~]# ulimit -a
    core file size          (blocks, -c) unlimited
    data seg size           (kbytes, -d) unlimited
    scheduling priority             (-e) 0
    file size               (blocks, -f) unlimited
    pending signals                 (-i) 5762
    max locked memory       (kbytes, -l) 64
    max memory size         (kbytes, -m) unlimited
    open files                      (-n) 65535
    pipe size            (512 bytes, -p) 8
    POSIX message queues     (bytes, -q) 819200
    real-time priority              (-r) 0
    stack size              (kbytes, -s) 10240
    cpu time               (seconds, -t) unlimited
    max user processes              (-u) 65535
    virtual memory          (kbytes, -v) unlimited
    file locks                      (-x) unlimited

注意,ulimit -c 的设置仅仅是对你完成设置后启动的进程有效。而且退出登陆后,再进入需要从新设置。否则从新登陆后启动的进程也无法生成core文件。

如果想永久生效,可以把命令加入到 /etc/profile 中。建议不要这样做, 会疯狂dump文件,浪费性能

如何找到core文件

一般情况下,core文件会生成在你执行程序的地方。文件名是core.进程号

你也可以指定core文件名和生成目录。在/etc/sysctl.conf 文件中指定

    # vi /etc/sysctl.conf
    kernel.core_uses_pid = 1 #追加进程号到core文件名中
    fs.suid_dumpable = 2 #确保设置属主的进程也可以生成core文件
    kernel.core_pattern = /tmp/core-%e-%s-%u-%g-%p-%t #指定core文件生成的位置和文件名规则。

文件名规则可以使用的参数有:

    %% – 符号%
    %p – 进程号
    %u – 进程用户id
    %g – 进程用户组id
    %s – 生成core文件时收到的信号
    %t – 生成core文件的 时间 (seconds since 0:00h, 1 Jan 1970)
    %h – 主机名
    %e – 程序文件名

执行如下命令,让设置生效


    # sysctl -p

重启php-fpm

    service php-fpm restart

重现502错误

访问http://demo.linuxeye.com/wp-admin/customize.php?theme=dux

日志/usr/local/php/var/log/php-fpm.log中会有"SIGSEGV – core dumped"字样

如何使用core文件

可以使用gdb命令查看core文件信息

    gdb -e /usr/local/php/sbin/php-fpm -c /tmp/core-php-fpm-11-501-501-9581-1426493066

根据上面的堆栈信息,可以知道iplookup扩展有问题,编辑/usr/local/php/etc/php.ini,注销掉iplookup段,重启php-fpm ,正常。。。

参考:http://www.searchtb.com/2014/03/如何找出发生segv内存错误的程序.html

如何快速定位找出SEGV内存错误的程序Bug的相关教程结束。

《如何快速定位找出SEGV内存错误的程序Bug.doc》

下载本文的Word格式文档,以方便收藏与打印。