PostgreSQL事务隔离级别详解：避免脏读和幻读的实用方案

一、啥是事务隔离级别

咱先说说啥是事务隔离级别。在数据库操作里，经常会有好几个事务同时运行的情况。这时候，就可能会出现数据不一致的问题，比如脏读、幻读啥的。事务隔离级别就是为了解决这些问题，给不同事务之间的隔离程度定了几个标准。

PostgreSQL 里有四个不同的事务隔离级别，从低到高分别是：读未提交、读已提交、可重复读和串行化。这几个级别就像不同的防护墙，级别越高，事务之间的隔离性就越好，不过性能可能就会受点影响。

二、脏读和幻读是啥

脏读

脏读就是一个事务读到了另一个还没提交的事务修改的数据。举个例子，有个事务 A 把数据从 100 改成了 200，但还没提交，这时候事务 B 读取到了这个 200，可后来事务 A 回滚了，数据又变回 100 了，那事务 B 读到的 200 就是脏数据，这就是脏读。

幻读

幻读是一个事务在多次查询同一个范围的数据时，由于其他事务插入或删除了符合查询条件的数据，导致该事务两次查询结果不一样。比如说，事务 A 第一次查询年龄大于 20 岁的员工有 10 个，这时候事务 B 插入了一个年龄大于 20 岁的员工，然后事务 A 再次查询，发现有 11 个了，就好像出现了幻觉一样，这就是幻读。

三、PostgreSQL 的四个事务隔离级别详解

读未提交

这个级别是最低的隔离级别，它允许一个事务读取另一个未提交事务修改的数据。也就是说，会出现脏读的情况。不过它的好处是性能比较高，因为不需要太多的锁机制。

下面是一个使用 PostgreSQL 演示读未提交的示例（PostgreSQL 技术栈）：

-- 开启一个事务，设置隔离级别为读未提交
BEGIN TRANSACTION ISOLATION LEVEL READ UNCOMMITTED;

-- 事务 A 修改数据
UPDATE employees SET salary = 5000 WHERE id = 1;

-- 这时候另一个事务 B 就可以读到未提交的修改后的数据
-- 假设事务 B 执行查询
SELECT salary FROM employees WHERE id = 1;

在这个示例中，事务 B 可能会读到事务 A 还没提交的修改后的数据，这就可能出现脏读。

读已提交

这个级别是 PostgreSQL 的默认隔离级别。在这个级别下，一个事务只能读取另一个已经提交的事务修改的数据，避免了脏读。但是，它还是可能会出现幻读的情况。

示例如下（PostgreSQL 技术栈）：

-- 开启一个事务，设置隔离级别为读已提交
BEGIN TRANSACTION ISOLATION LEVEL READ COMMITTED;

-- 事务 A 查询数据
SELECT COUNT(*) FROM orders WHERE status = 'pending';

-- 事务 B 插入一条 status 为 pending 的订单
INSERT INTO orders (status) VALUES ('pending');

-- 事务 A 再次查询
SELECT COUNT(*) FROM orders WHERE status = 'pending';

这里事务 A 两次查询的结果可能不一样，因为事务 B 插入了新的数据，这就是幻读。

可重复读

这个级别可以保证在同一个事务中多次读取相同的数据时，结果是一样的，避免了脏读和幻读。它通过给读取的数据加锁，防止其他事务修改这些数据。

示例（PostgreSQL 技术栈）：

-- 开启一个事务，设置隔离级别为可重复读
BEGIN TRANSACTION ISOLATION LEVEL REPEATABLE READ;

-- 事务 A 第一次查询
SELECT COUNT(*) FROM products WHERE price > 100;

-- 事务 B 插入一个价格大于 100 的产品
INSERT INTO products (price) VALUES (200);

-- 事务 A 第二次查询
SELECT COUNT(*) FROM products WHERE price > 100;

在这个示例中，事务 A 两次查询的结果是一样的，因为可重复读级别避免了幻读。

串行化

这是最高的隔离级别，所有事务串行执行，就好像一个一个排队执行一样，不会出现脏读、幻读和不可重复读的问题。不过它的性能是最低的，因为事务之间要一个一个来，不能并行执行。

示例（PostgreSQL 技术栈）：

-- 开启一个事务，设置隔离级别为串行化
BEGIN TRANSACTION ISOLATION LEVEL SERIALIZABLE;

-- 事务 A 查询数据
SELECT COUNT(*) FROM customers;

-- 事务 B 插入一个新的客户
INSERT INTO customers (name) VALUES ('John');

-- 事务 A 再次查询
SELECT COUNT(*) FROM customers;

在串行化级别下，事务 B 要等事务 A 提交或者回滚之后才能执行，所以事务 A 两次查询的结果是一样的。

四、应用场景

读未提交

这个级别适用于对数据一致性要求不高，但对性能要求比较高的场景。比如说一些实时统计的场景，允许有一些小误差，只要能快速得到结果就行。

读已提交

这是最常用的隔离级别，适用于大多数业务场景。因为大多数情况下，我们只需要避免脏读，对幻读的容忍度相对较高。比如说普通的订单查询、用户信息查询等。

可重复读

适用于对数据一致性要求比较高，不允许出现幻读的场景。比如说财务系统，在一个事务中多次查询账户余额，必须保证结果一致。

串行化

适用于对数据一致性要求极高，不能容忍任何并发冲突的场景。比如说银行的核心业务系统，涉及到资金的转账、账户的余额更新等，必须保证数据的绝对一致性。

五、技术优缺点

优点

不同的隔离级别可以满足不同的业务需求，开发者可以根据实际情况选择合适的隔离级别。
高级别的隔离级别可以保证数据的一致性和完整性，避免了脏读、幻读等问题。

缺点

随着隔离级别的提高，数据库的并发性能会下降。比如说串行化级别，事务只能一个一个执行，会导致系统响应变慢。
高隔离级别可能会导致死锁的概率增加。因为事务需要持有更多的锁，不同事务之间可能会因为锁的竞争而产生死锁。

六、注意事项

在选择隔离级别时，要综合考虑业务需求和系统性能。不能一味地追求高隔离级别，而忽略了性能问题。
要注意死锁的问题。当使用高隔离级别时，要合理设计事务的逻辑，避免死锁的发生。可以通过减少事务持有锁的时间、按顺序获取锁等方法来降低死锁的概率。
在开发过程中，要对不同隔离级别进行测试，确保系统在各种情况下都能正常工作。

七、文章总结

PostgreSQL 的事务隔离级别是保障数据一致性和并发性能的重要机制。我们了解了四个不同的隔离级别，分别是读未提交、读已提交、可重复读和串行化，以及它们如何避免脏读和幻读。每个隔离级别都有自己的应用场景、优缺点和注意事项。在实际开发中，我们要根据业务需求选择合适的隔离级别，平衡好数据一致性和系统性能之间的关系。同时，要注意死锁等问题，确保系统的稳定和可靠运行。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。

PostgreSQL事务隔离级别详解：避免脏读和幻读的实用方案

一、啥是事务隔离级别

二、脏读和幻读是啥

脏读

幻读

三、PostgreSQL 的四个事务隔离级别详解

读未提交

读已提交

可重复读

串行化

四、应用场景

读未提交

读已提交

可重复读

串行化

五、技术优缺点

优点

缺点

六、注意事项

七、文章总结

评论

关联文章