Linux 系统内存泄漏排查：基于 valgrind 与 ps 的内存使用分析流程

Chen Jing 2025-12-30 08:10 8

一、内存泄漏的那些事儿

作为一个常年和 Linux 系统打交道的程序员，最让人头疼的问题之一就是内存泄漏。想象一下，你的程序运行得好好地，突然有一天，系统开始变得卡顿，甚至直接崩溃。这时候你打开监控一看，内存占用曲线像坐了火箭一样直线上升——恭喜你，大概率遇到了内存泄漏。

内存泄漏的本质是程序申请了内存，但用完以后没有正确释放。这些"无主"内存会一直占用系统资源，直到把整个系统拖垮。在 Linux 环境下，我们可以借助 valgrind 和 ps 这对黄金搭档来排查这类问题。

二、valgrind：内存问题的显微镜

valgrind 就像给程序做 CT 扫描的仪器，能精确找出内存问题的病灶。它通过模拟 CPU 运行程序，可以检测出包括内存泄漏、非法内存访问等各种内存问题。

2.1 基本使用方法

# 使用 memcheck 工具检查内存泄漏
valgrind --leak-check=full ./your_program

2.2 典型输出分析

==12345== 40 bytes in 1 blocks are definitely lost in loss record 1 of 20
==12345==    at 0x483877F: malloc (vg_replace_malloc.c:307)
==12345==    by 0x401234: main (example.c:10)

这段输出告诉我们：

有 40 字节内存泄漏
内存是在 example.c 第 10 行通过 malloc 分配的
这些内存在程序结束时仍未释放

2.3 高级技巧

# 生成详细报告到文件
valgrind --leak-check=full --log-file=valgrind_report.txt ./your_program

# 只检查特定类型的内存问题
valgrind --tool=memcheck --undef-value-errors=no ./your_program

三、ps：实时监控内存的好帮手

如果说 valgrind 是实验室里的精密仪器，那么 ps 就是随身携带的听诊器。它能实时查看进程的内存使用情况，帮助我们快速定位可疑进程。

3.1 常用命令组合

# 查看进程内存占用情况
ps aux --sort=-%mem | head -10

# 持续监控某个进程的内存变化
watch -n 1 'ps -p 12345 -o %mem,rss,vsz,cmd'

3.2 关键指标解读

RSS(Resident Set Size)：进程实际使用的物理内存
VSZ(Virtual Memory Size)：进程使用的虚拟内存总量
%MEM：进程占用物理内存的百分比

四、实战演练：一个真实的内存泄漏案例

让我们通过一个实际的 C 程序示例，演示完整的排查流程。

4.1 问题程序

#include <stdlib.h>
#include <string.h>

void leaky_function() {
    char *buffer = malloc(1024);  // 分配内存
    strcpy(buffer, "This memory will leak!");
    // 忘记释放 buffer
}

int main() {
    while(1) {
        leaky_function();
        sleep(1);
    }
    return 0;
}

4.2 排查步骤

先用 ps 发现内存异常增长：

watch -n 1 'ps -p $(pgrep leaky_program) -o %mem,rss,vsz'

使用 valgrind 确认泄漏点：

valgrind --leak-check=full ./leaky_program

分析 valgrind 报告，定位到 leaky_function 中的 malloc 调用。

五、技术选型的思考

5.1 valgrind 的优势

检测精度高，能定位到具体代码行
支持多种内存问题检测
对程序运行影响可控

5.2 ps 的优势

无需停止程序即可监控
系统自带，无需安装
可以观察实时变化趋势

5.3 注意事项

valgrind 会使程序运行变慢，不适合生产环境持续使用
某些系统库可能产生误报，需要仔细甄别
对于多线程程序，需要额外注意线程安全问题

六、更深入的排查技巧

6.1 结合 /proc 文件系统

# 查看进程详细内存映射
cat /proc/12345/maps

# 检查内存使用统计
cat /proc/12345/status | grep -E 'VmRSS|VmSize'

6.2 自动化监控脚本

#!/bin/bash
PID=$1
LOG_FILE="memory_monitor.log"

while true; do
    DATE=$(date '+%Y-%m-%d %H:%M:%S')
    MEM_INFO=$(ps -p $PID -o %mem,rss,vsz | tail -1)
    echo "$DATE $MEM_INFO" >> $LOG_FILE
    sleep 5
done

七、总结与最佳实践

经过上面的探索，我们可以总结出一套高效的内存泄漏排查流程：

先用 ps 或 top 确认是否存在内存异常增长
使用 valgrind 进行详细检测，定位泄漏点
结合 /proc 文件系统获取更详细的内存信息
修复问题后，建立长期监控机制

在日常开发中，建议：

关键服务部署内存监控告警
开发阶段定期使用 valgrind 检查
建立内存使用基线，便于快速发现问题

记住，内存问题往往不会立即显现，但一旦爆发就可能造成严重后果。养成良好的内存管理习惯，才能写出健壮可靠的程序。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。