PolarDB 缓存命中率：shared_buffers 命中率计算与优化

一、什么是shared_buffers命中率

在数据库系统中，缓存命中率是一个非常重要的性能指标。简单来说，它表示数据库从内存中获取数据的比例。当这个比例越高，说明数据库性能越好，因为从内存读取数据比从磁盘读取要快得多。

对于PolarDB这样的云原生数据库来说，shared_buffers是它的重要内存区域，专门用来缓存数据页。我们可以通过一个简单的公式来计算命中率：

命中率 = (1 - (物理读取次数 / 逻辑读取次数)) × 100%

举个例子，假设你的数据库：

逻辑读取次数：10000次
物理读取次数：1000次

那么命中率就是：(1 - (1000/10000)) × 100% = 90%

二、如何监控shared_buffers命中率

在PolarDB中，我们可以通过几种方式来监控这个指标。最直接的方法就是查询系统视图。下面我给出一个完整的SQL示例：

-- PolarDB PostgreSQL兼容版查询shared_buffers命中率
SELECT 
    sum(blks_hit) as logical_reads,
    sum(blks_read) as physical_reads,
    CASE 
        WHEN sum(blks_hit) = 0 THEN 0 
        ELSE round((sum(blks_hit) - sum(blks_read)) * 100 / sum(blks_hit), 2) 
    END as hit_ratio
FROM 
    pg_stat_database;

这段代码会返回三个重要指标：

logical_reads：逻辑读取次数（从缓存读取）
physical_reads：物理读取次数（从磁盘读取）
hit_ratio：计算出的命中率百分比

三、优化shared_buffers命中率的方法

3.1 调整shared_buffers大小

这是最直接的优化方法。在PolarDB中，shared_buffers默认配置可能不适合你的业务场景。我们可以通过以下步骤来调整：

-- 查看当前shared_buffers设置（PolarDB PostgreSQL兼容版）
SHOW shared_buffers;

-- 修改shared_buffers大小（需要重启生效）
ALTER SYSTEM SET shared_buffers = '8GB';

注意：

通常建议设置为总内存的25%-40%
修改后需要重启数据库才能生效
调整后要持续监控性能变化

3.2 优化查询模式

有时候命中率低不是因为缓存大小问题，而是查询模式不合理。比如：

-- 不好的查询示例：全表扫描
SELECT * FROM large_table WHERE non_indexed_column = 'value';

-- 优化后的查询：使用索引
SELECT * FROM large_table WHERE indexed_column = 'value';

3.3 预热缓存

对于重要的表，我们可以主动将它们加载到缓存中：

-- 预热特定表到shared_buffers（PolarDB PostgreSQL兼容版）
CREATE EXTENSION IF NOT EXISTS pg_prewarm;

SELECT pg_prewarm('important_table');

四、实际案例分析

让我们看一个真实的优化案例。某电商平台的PolarDB数据库命中率只有70%，导致大促期间性能下降。我们通过以下步骤解决了问题：

首先分析当前状态：

-- 查看各表缓存使用情况
SELECT 
    c.relname as table_name,
    count(*) as buffers_used
FROM 
    pg_class c
JOIN 
    pg_buffercache b ON b.relfilenode = c.relfilenode
GROUP BY 
    c.relname
ORDER BY 
    buffers_used DESC
LIMIT 10;

发现订单表缓存使用不足，于是调整：

-- 增加订单表缓存
ALTER SYSTEM SET shared_buffers = '12GB'; -- 从8GB增加到12GB

-- 预热订单表
SELECT pg_prewarm('orders');

优化后，命中率提升到95%，QPS提升了3倍。

五、常见问题与解决方案

5.1 命中率突然下降怎么办？

可能原因：

有新的大表被频繁查询
有新的全表扫描查询
缓存被其他进程挤占

解决方案：

-- 找出最近新增的全表扫描
SELECT 
    query, 
    calls, 
    total_time,
    rows
FROM 
    pg_stat_statements
WHERE 
    query LIKE '%Seq Scan%'
ORDER BY 
    total_time DESC
LIMIT 10;

5.2 命中率高但性能仍然差