Linux 系统性能基准测试：使用 sysbench、fio 等工具建立性能基线

Li Xin 2025-08-27 20:39 12

1. 当计算机也需要"体检报告"

每次我们听到"系统变卡了"这句话，就像医生面对病人的主诉。但计算机不会自己开口说哪里疼，这时候性能基准测试就像它的体检报告。今天我们就以CentOS 7和Ubuntu 22.04双平台为例（技术栈：Linux Kernel 5.4+），使用sysbench 1.0.20和fio 3.28这对"听诊器"，带大家做一次系统的深度体检。

2. 性能测试工具全家福

2.1 sysbench的多面手特性

这个瑞士军刀般的工具能测试：

CPU运算能力（质数计算）
内存吞吐量（数据搬运）
线程调度效率（并发处理）
数据库性能（OLTP事务）

2.2 fio的专业特长

当需要精准测量存储性能时，fio的表现就像显微镜：

顺序读写速度（大文件传输）
随机访问性能（数据库场景）
混合读写比例（真实业务场景）
IOPS和延迟（关键服务质量）

3. 实战演练：CPU性能会诊

# 使用16线程计算100000以内的质数，持续时间60秒
sysbench cpu --threads=16 --cpu-max-prime=100000 run

# 典型输出（关键指标用*标记）
    events per second:  2568.95
    *总耗时: 23.2345秒*
    *95%延迟: 12.34毫秒*
    *线程公平性: 0.95（理想值1.0）*

这个示例演示了如何通过质数计算评估CPU的计算吞吐量。注意观察事件数（events/s）和线程公平性，前者体现计算速度，后者反映多核负载均衡情况。当发现公平性持续低于0.9，就要检查CPU调度或NUMA配置了。

4. 内存性能压力测试

# 测试32GB内存的读写速度，设置20个并发线程
sysbench memory --memory-block-size=1G --memory-total-size=32G \
--memory-oper=write --threads=20 run

# 输出关键指标解读
    *传输速率: 38.45 GiB/s*
    操作延迟: 0.025 ms/op
    内存消耗: 20.12 GiB

在内存测试中，1GB的块大小更适合现代服务器的内存子系统测试。突然下降的传输速率可能暗示内存带宽瓶颈，而波动过大的延迟则可能指向硬件故障。建议测试后执行dmidecode --type 17检查内存详细信息。

5. 磁盘性能的终极考验

# 使用fio进行混合读写测试（技术栈：XFS文件系统）
cat > mixed-io.fio <<EOF
[global]
ioengine=libaio
direct=1
runtime=300
time_based
group_reporting

[randwrite]
rw=randwrite
bs=4k
iodepth=32
numjobs=8

[seqread]
rw=read
bs=128k
iodepth=8
numjobs=4
EOF

fio mixed-io.fio

# 重点关注结果：
   randwrite: *iops=7850, latency=5.6ms*
   seqread: *bw=2150MiB/s*

这个复杂的测试方案同时模拟了数据库随机写和日志顺序读场景。iodepth参数就像高速公路的通行能力，numjobs相当于同时发车的卡车数量。当延迟的p99值（第99百分位）超过平均值的3倍，就要警惕存储设备的稳定性了。

6. 如何建立你的性能基线

6.1 基准建立的黄金三原则

一致性：同硬件同配置同负载
可重复：记录完整环境指纹（包括微码版本）
时效性：每次系统变更后更新

6.2 基准档案范例

# 系统指纹快照
dmidecode -t system | grep "Serial Number"
lscpu | grep "Model name"
hdparm -I /dev/sda | grep "Transport"

# 性能指标存档
echo "CPU基准 $(date)" >> baseline.log
sysbench cpu --threads=$(nproc) run | tee -a baseline.log

7. 何时需要这份体检报告？

7.1 服务器采购验收

对比供应商承诺的性能参数，避免配置缩水。某次实测发现某批SSD的4K随机写性能只有标称值的60%，及时更换避免损失。

7.2 系统优化前后对比

在调整磁盘调度算法时，通过基准对比验证cfq与deadline调度器的实际差异，选择最适合业务特性的方案。

7.3 故障诊断定位

当数据库响应变慢时，通过历史基线快速定位到是RAID卡缓存电池故障导致写策略降级。

8. 工具间的较量与取舍

8.1 sysbench的AB面

优点：

一站式测试多种硬件
友好的结果输出
支持Lua脚本扩展

局限：

存储测试不够深入
网络测试功能缺失
硬件压力不够极致

8.2 fio的独特价值

专业优势：

精确控制IO模式
模拟任意负载比例
详细的延迟统计

使用门槛：

配置文件复杂度高
结果需要专业解读
缺乏预设测试场景

9. 测试过程中的避坑指南

9.1 环境隔离原则

在物理机测试时，禁用NUMA自动平衡：

echo 0 > /proc/sys/kernel/numa_balancing

9.2 数据预热技巧

避免冷启动误差，测试前预加载：

fio --name=preheat --rw=read --size=10G --filename=/test.file

9.3 结果去噪方法

采用3次测试取中位值：

for i in {1..3}; do sysbench memory run; done | awk '/avg:/{print $2}' | sort -n | sed -n '2p'

10. 站在基线上看未来

建立性能基线就像给系统拍X光片，不仅为了发现问题，更要预防问题。每次基础架构变更后重新建立基线，你会发现：

虚拟化平台的性能衰减规律
SSD随使用时长性能曲线的变化
不同内核版本对特定硬件的优化效果

记住：没有万能的测试工具，只有持续完善的基线档案。当遇到性能迷案时，你积累的这些数据就会变成最有力的侦探工具。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。