并查集算法精解：解决社交网络中的好友关系合并问题

Li Yu 2026-02-06 11:14

一、什么是并查集？

并查集（Disjoint Set Union，简称DNU）是一种用来管理元素分组情况的数据结构。它主要支持两种操作：查找（Find）和合并（Union）。简单来说，它可以帮助我们高效地解决“动态连通性”问题，比如社交网络中的好友关系合并、网络中的连接状态判断等。

举个例子，假设你在微信里有100个好友，这些好友之间可能互相认识。现在你想知道某两个人是否属于同一个朋友圈（即是否通过某些共同好友间接认识）。并查集就能帮你快速回答这个问题。

二、并查集的核心操作

并查集的核心操作包括：

初始化（Init）：每个元素最初都是独立的集合。
查找（Find）：找到某个元素所属的集合代表（通常是根节点）。
合并（Union）：将两个集合合并为一个。

示例代码（Python实现）

class UnionFind:
    def __init__(self, size):
        self.parent = list(range(size))  # 初始化，每个元素的父节点是自己
    
    def find(self, x):
        while self.parent[x] != x:       # 查找根节点
            self.parent[x] = self.parent[self.parent[x]]  # 路径压缩优化
            x = self.parent[x]
        return x
    
    def union(self, x, y):
        root_x = self.find(x)
        root_y = self.find(y)
        if root_x != root_y:             # 如果不在同一个集合，则合并
            self.parent[root_y] = root_x

# 示例：社交网络好友关系
friends = UnionFind(5)  # 假设有5个人，编号0~4
friends.union(0, 1)     # 0和1是好友
friends.union(2, 3)     # 2和3是好友
friends.union(1, 2)     # 1和2是好友，此时0、1、2、3都在同一个集合
print(friends.find(0) == friends.find(3))  # 输出True，说明0和3间接认识

三、优化策略

并查集的效率取决于Find和Union操作的实现方式。常见的优化方法有：

路径压缩：在Find操作时，将节点的父节点直接指向根节点，减少后续查找时间。
按秩合并：在Union操作时，将较小的树合并到较大的树下，避免树过高。

优化后的代码

class UnionFind:
    def __init__(self, size):
        self.parent = list(range(size))
        self.rank = [0] * size          # 记录树的深度
    
    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])  # 路径压缩
        return self.parent[x]
    
    def union(self, x, y):
        root_x = self.find(x)
        root_y = self.find(y)
        if root_x != root_y:
            if self.rank[root_x] > self.rank[root_y]:   # 按秩合并
                self.parent[root_y] = root_x
            elif self.rank[root_x] < self.rank[root_y]:
                self.parent[root_x] = root_y
            else:
                self.parent[root_y] = root_x
                self.rank[root_x] += 1

# 示例：优化后的并查集
uf = UnionFind(5)
uf.union(0, 1)
uf.union(2, 3)
uf.union(1, 2)
print(uf.find(0) == uf.find(3))  # 输出True

四、应用场景

社交网络：快速判断两个人是否属于同一个朋友圈。
图的连通性：判断图中两个节点是否连通。
Kruskal算法：用于最小生成树的构建。

五、技术优缺点

优点：

时间复杂度接近O(1)（经过优化后）。
代码实现简单，易于理解。

缺点：

无法处理动态删除操作。
需要额外的空间存储父节点和秩信息。

六、注意事项

初始化时，确保每个元素独立。
路径压缩和按秩合并可以显著提升性能，但会增加代码复杂度。
并查集通常用于无向图的连通性问题，不适用于有向图。

七、总结

并查集是一种高效的数据结构，特别适合处理动态连通性问题。通过路径压缩和按秩合并，可以进一步提升性能。在社交网络、图算法等场景中，它都能发挥重要作用。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。