SQLServer中的行版本控制：READ_COMMITTED_SNAPSHOT 与 ALLOW_SNAPSHOT

好的，没问题。作为一名资深的数据库专家，我深知在高并发场景下，传统锁机制带来的阻塞和死锁问题有多么令人头疼。今天，我们就来深入聊聊 SQL Server 中两个基于行版本控制的“救星”——READ_COMMITTED_SNAPSHOT 和 ALLOW_SNAPSHOT_ISOLATION。它们通过保存数据的旧版本来实现非阻塞读，是优化数据库并发性能的利器。

我们将从基础概念出发，通过详实的示例，一步步剖析它们的工作原理、差异、应用场景以及需要注意的“坑”。

一、从“锁”的烦恼到“版本”的曙光

在默认情况下，SQL Server 使用锁来保证事务的 ACID 特性。例如，在 READ COMMITTED 隔离级别下，一个事务正在修改某行数据时，会对该行加上排他锁（X Lock）。此时，另一个事务如果想读取这行数据，就必须等待，直到第一个事务提交或回滚，释放锁。这就是“阻塞”。如果多个事务相互等待对方持有的锁，就会形成“死锁”。

这种机制虽然保证了严格的一致性，但在读多写少的 OLTP 系统中，大量读操作被写操作阻塞，会严重拖慢系统响应速度，影响用户体验。

行版本控制（Row Versioning）提供了一种不同的思路。它的核心思想是：当需要修改一行数据时，SQL Server 不会直接覆盖原有数据，而是将修改前的数据副本（行版本）保存到一个叫 tempdb 的系统数据库中的版本存储区里。这样，其他正在读取数据的事务，就可以去读取这个旧版本的数据，而无需等待写事务提交。读操作和写操作从此“分道扬镳”，互不阻塞。

SQL Server 主要通过两个数据库选项来启用这项能力：READ_COMMITTED_SNAPSHOT 和 ALLOW_SNAPSHOT_ISOLATION。

二、 READ_COMMITTED_SNAPSHOT (RCSI)：开箱即用的乐观读

READ_COMMITTED_SNAPSHOT 是一个数据库级别的开关。一旦打开，它就将数据库默认的 READ COMMITTED 隔离级别语义从“基于锁”改变为“基于行版本”。

开启方法：

-- 注意：此操作需要独占数据库连接，不能在应用连接池活跃时执行。
-- 技术栈：Microsoft SQL Server / T-SQL
ALTER DATABASE [YourDatabaseName] SET READ_COMMITTED_SNAPSHOT ON;

它是如何工作的？

当一个事务在 READ COMMITTED 隔离级别下运行（这是最常见的情况），它发出的 SELECT 语句会读取在语句开始时刻已提交的最新行版本。
写操作（UPDATE, DELETE）仍然会获取锁，但读操作（SELECT）不再需要申请共享锁（S Lock），因此不会被写操作阻塞。
它提供的是“语句级”的一致性。在同一事务中，两次执行相同的 SELECT 语句，可能会看到不同的数据（因为在这两次查询之间，可能有其他事务提交了修改）。

让我们看一个示例：

假设我们有一个简单的账户表。

-- 技术栈：Microsoft SQL Server / T-SQL
CREATE TABLE Account (
    Id INT PRIMARY KEY,
    Name NVARCHAR(50),
    Balance DECIMAL(18, 2)
);
INSERT INTO Account VALUES (1, '张三', 1000.00), (2, '李四', 500.00);

现在，我们开启两个查询窗口，模拟两个并发事务。

会话 1：执行一个长时间运行的更新操作

-- 会话 1：开始一个事务，更新张三的余额，但先不提交。
BEGIN TRANSACTION;
UPDATE Account SET Balance = Balance - 200 WHERE Id = 1; -- 张三余额变为800
-- 此时，旧版本（余额=1000）已被存入tempdb。
-- 我们暂停在这里，不执行 COMMIT。

会话 2：在 RCSI 开启的情况下执行查询

-- 会话 2：在另一个连接中查询。数据库已开启 READ_COMMITTED_SNAPSHOT。
-- 默认隔离级别就是 READ COMMITTED。
SELECT * FROM Account WHERE Id = 1;
-- 结果：Id=1, Name='张三', Balance=1000.00
-- 重要！会话2没有等待会话1提交，它立刻返回了数据。
-- 它读取的是会话1更新开始前已提交的版本（即1000），而不是未提交的800。

会话 1：提交更改

-- 回到会话1
COMMIT TRANSACTION;

会话 2：再次查询

-- 回到会话2，再次查询
SELECT * FROM Account WHERE Id = 1;
-- 结果：Id=1, Name='张三', Balance=800.00
-- 因为会话1已提交，这次读取到的是最新的已提交数据。

可以看到，读操作完全没有被阻塞，并且读取到的始终是已提交的数据，完美符合 READ COMMITTED 的语义，但通过版本机制避免了锁竞争。

三、 ALLOW_SNAPSHOT_ISOLATION (SI)：事务级的一致性快照

ALLOW_SNAPSHOT_ISOLATION 是另一个数据库选项。它开启后，并不会改变默认隔离级别的行为，而是为你提供了一个新的隔离级别选择：SNAPSHOT。

开启方法：

-- 技术栈：Microsoft SQL Server / T-SQL
ALTER DATABASE [YourDatabaseName] SET ALLOW_SNAPSHOT_ISOLATION ON;

它是如何工作的？

你需要显式地将事务的隔离级别设置为 SNAPSHOT。
在 SNAPSHOT 隔离级别下，事务会读取在事务开始时刻已提交的所有数据版本。这个“快照”在整个事务期间保持一致。
它提供的是“事务级”的一致性。在同一事务中，无论执行多少次 SELECT，看到的数据都和事务开始时一致。
如果在该事务尝试提交时，发现它要修改的数据在事务开始后被其他事务修改过，SQL Server 会引发“更新冲突”（Update Conflict）错误（错误号 3960），并回滚该事务。

让我们看一个示例：

继续使用上面的 Account 表。现在开启两个会话，使用 SNAPSHOT 隔离级别。

会话 1：开启一个快照事务，并读取数据

-- 会话 1：设置隔离级别为 SNAPSHOT，并开始事务。
SET TRANSACTION ISOLATION LEVEL SNAPSHOT;
BEGIN TRANSACTION;
SELECT * FROM Account WHERE Id = 1; -- 假设此时余额是800
-- 这个查询确定了事务的“快照点”，之后读取的都是这个时间点的数据。

会话 2：更新同一条记录并提交

-- 会话 2：在另一个连接中更新并提交。
UPDATE Account SET Balance = Balance + 100 WHERE Id = 1; -- 余额变为900
COMMIT;

会话 1：在快照事务中再次读取，并尝试更新

-- 回到会话1
SELECT * FROM Account WHERE Id = 1;
-- 结果：余额仍然是800！因为它读取的是事务开始时的快照，无视会话2的提交。
-- 现在尝试更新这条记录
UPDATE Account SET Balance = Balance - 50 WHERE Id = 1; -- 试图将800改为750
-- SQL Server 会报错：消息 3960，级别 16，状态 2
-- 快照隔离事务由于更新冲突而中止。您无法在数据库'YourDatabaseName'中使用快照隔离来直接或间接更新自事务启动后已修改的表。
-- 事务被自动回滚。

这个例子清晰地展示了 SNAPSHOT 隔离级别的核心特点：读取一致性和更新冲突检测。它非常适合那些需要长时间运行、基于某个时间点数据进行复杂计算或报表生成，并且希望计算基础不被其他事务干扰的场景。但你必须准备好处理更新冲突，通常意味着在应用层捕获该错误并重试整个事务。

四、深入辨析：双剑合璧还是择一而用？

这两个选项常常被混淆，但它们的设计目标不同。

1. 关联技术与底层机制 两者都依赖 tempdb 中的版本存储（Version Store）。每当一行数据在启用版本控制的数据库中被修改时，它的前像（before image）就会被复制到 tempdb。tempdb 的性能和空间因此变得至关重要，必须被妥善规划和监控。这是使用行版本控制技术最重要的注意事项之一。

2. 主要区别

行为改变方式：RCSI 改变了默认 READ COMMITTED 的行为，是“隐式”的。SI 是增加了一个新的隔离级别选项，需要“显式”使用 SET TRANSACTION ISOLATION LEVEL SNAPSHOT。
一致性级别：RCSI 提供语句级读一致性。SI 提供事务级读一致性。
更新冲突：RCSI 不会产生更新冲突错误。SI 在检测到写入冲突时会抛出错误 3960。
时间戳：SI 事务有明确的事务序列号（XSN）作为快照点。RCSI 的每条语句都有自己的逻辑时间点。

3. 应用场景

READ_COMMITTED_SNAPSHOT (RCSI) 的应用场景：
- 通用 OLTP 系统：读多写少，希望彻底消除读操作被写操作阻塞的场景。这是它最典型、最成功的应用。许多系统可以简单通过开启此选项获得显著的并发性能提升。
- 替代旧的、使用 NOLOCK 提示（脏读）来规避阻塞的方案，以提供真正已提交的读一致性。
ALLOW_SNAPSHOT_ISOLATION (SI) 的应用场景：
- 财务批处理或报表事务：需要在一个长时间运行的事务中，基于一个稳定不变的数据视图进行计算。
- 数据同步或ETL过程：需要获取某个时间点的一致性数据快照。
- 乐观并发控制：当业务逻辑能够接受并处理更新冲突（如“您修改的数据已被他人更改，请刷新后重试”）时，可用于实现高并发更新。

4. 技术优缺点与注意事项

共同优点：
- 大幅减少阻塞和死锁，提高并发吞吐量。
- 读操作不申请锁，减少锁管理开销。
共同缺点与注意事项：
- tempdb 压力：版本存储带来额外的 I/O 和空间消耗，tempdb 可能成为性能和容量瓶颈。必须监控 tempdb 大小、I/O 以及版本清理任务。
- 更新开销：每次数据修改都需要生成版本，写操作会有轻微额外开销。
- 旧版本清理：长期未完成的事务会阻止其开始时间点之前的所有行版本被清理，可能导致 tempdb 无限增长。
RCSI 特有注意事项：由于它改变了默认行为，启用后需要对整个应用进行充分测试，确保所有在 READ COMMITTED 下的逻辑仍然正确。
SI 特有注意事项：必须编写代码处理更新冲突错误 3960，实现重试逻辑。不适合更新冲突频繁发生的场景。

5. 如何选择与搭配 它们不是互斥的，可以同时开启。

对于大多数应用，优先考虑启用 READ_COMMITTED_SNAPSHOT。它能以最小的改动（改个数据库选项）解决最普遍的读阻塞问题，收益风险比最高。
仅在那些明确需要“事务级读一致性”的特定业务场景中，再使用 SNAPSHOT 隔离级别。你可以同时开启两个选项，让数据库默认使用无阻塞的 RCSI，然后在特定的存储过程或代码块中按需使用 SNAPSHOT 隔离级别。

总结 READ_COMMITTED_SNAPSHOT 和 ALLOW_SNAPSHOT_ISOLATION 是 SQL Server 应对高并发挑战的两把神兵。RCSI 像一把“重剑无锋”，通过改变默认行为，大巧不工地解决日常阻塞；而 SI 则像一把“精巧的手术刀”，为特定场景提供严格的事务快照和冲突检测。理解其底层基于 tempdb 的行版本机制，明确它们在不同一致性级别和冲突处理上的差异，是正确使用它们的关键。在启用前，务必评估 tempdb 的容量与性能，并在测试环境中进行完整验证。用好它们，你的数据库并发能力将迈上一个新的台阶。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。

SQLServer中的行版本控制：READ_COMMITTED_SNAPSHOT 与 ALLOW_SNAPSHOT_ISOLATION

一、从“锁”的烦恼到“版本”的曙光

二、 READ_COMMITTED_SNAPSHOT (RCSI)：开箱即用的乐观读

三、 ALLOW_SNAPSHOT_ISOLATION (SI)：事务级的一致性快照

四、深入辨析：双剑合璧还是择一而用？

评论

关联文章

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。

一、 从“锁”的烦恼到“版本”的曙光

二、 READ_COMMITTED_SNAPSHOT (RCSI)：开箱即用的乐观读

三、 ALLOW_SNAPSHOT_ISOLATION (SI)：事务级的一致性快照

四、 深入辨析：双剑合璧还是择一而用？

评论

关联文章

一、从“锁”的烦恼到“版本”的曙光

四、深入辨析：双剑合璧还是择一而用？