哈希表冲突解决的C++实现：开放寻址法、链地址法及布谷鸟哈希的代码对比

在计算机编程里，哈希表可是个非常实用的数据结构，它能让我们快速地存储和查找数据。不过呢，哈希表有个小麻烦，就是会出现冲突。啥是冲突呢？简单来说，就是不同的数据通过哈希函数计算后，得到了相同的哈希值。今天咱们就来聊聊解决哈希表冲突的几种方法，并且用 C++ 代码来实现和对比一下。

一、开放寻址法

原理

开放寻址法就是当发生冲突时，我们不在原来的位置放数据了，而是去寻找其他空的位置。常见的有线性探测、二次探测等。线性探测就是一个一个往后找空位置，二次探测就是按照二次方的步长去找。

C++ 代码示例

// C++ 技术栈
#include <iostream>
#include <vector>

class OpenAddressingHashTable {
private:
    std::vector<int> table;
    int size;
    int capacity;

    // 哈希函数
    int hash(int key) {
        return key % capacity;
    }

public:
    OpenAddressingHashTable(int cap) : capacity(cap), size(0) {
        table.resize(capacity, -1); // -1 表示空位
    }

    // 插入元素
    bool insert(int key) {
        if (size == capacity) {
            return false; // 哈希表已满
        }
        int index = hash(key);
        while (table[index] != -1) {
            index = (index + 1) % capacity; // 线性探测
        }
        table[index] = key;
        size++;
        return true;
    }

    // 查找元素
    bool search(int key) {
        int index = hash(key);
        int start = index;
        while (table[index] != -1) {
            if (table[index] == key) {
                return true;
            }
            index = (index + 1) % capacity;
            if (index == start) {
                break; // 回到起点，说明没找到
            }
        }
        return false;
    }
};

int main() {
    OpenAddressingHashTable hashTable(10);
    hashTable.insert(5);
    hashTable.insert(15);
    std::cout << "Search 5: " << (hashTable.search(5) ? "Found" : "Not Found") << std::endl;
    std::cout << "Search 20: " << (hashTable.search(20) ? "Found" : "Not Found") << std::endl;
    return 0;
}

应用场景

开放寻址法适合哈希表数据量比较小，并且对空间利用率要求比较高的场景。比如在嵌入式系统里，内存比较有限，就可以用开放寻址法。

优缺点

优点：空间利用率高，不需要额外的指针来维护链表。缺点：删除操作比较麻烦，而且容易产生聚集现象，就是数据都集中在一块，影响查找效率。

注意事项

要注意哈希表的负载因子，负载因子过高会导致冲突增多，查找效率下降。一般来说，负载因子控制在 0.5 - 0.7 比较合适。

二、链地址法

原理

链地址法就是在每个哈希位置放一个链表。当发生冲突时，把冲突的数据都放到这个位置对应的链表里面。

C++ 代码示例

// C++ 技术栈
#include <iostream>
#include <vector>
#include <list>

class ChainingHashTable {
private:
    std::vector<std::list<int>> table;
    int capacity;

    // 哈希函数
    int hash(int key) {
        return key % capacity;
    }

public:
    ChainingHashTable(int cap) : capacity(cap) {
        table.resize(capacity);
    }

    // 插入元素
    void insert(int key) {
        int index = hash(key);
        table[index].push_back(key);
    }

    // 查找元素
    bool search(int key) {
        int index = hash(key);
        for (auto it = table[index].begin(); it != table[index].end(); ++it) {
            if (*it == key) {
                return true;
            }
        }
        return false;
    }
};

int main() {
    ChainingHashTable hashTable(10);
    hashTable.insert(5);
    hashTable.insert(15);
    std::cout << "Search 5: " << (hashTable.search(5) ? "Found" : "Not Found") << std::endl;
    std::cout << "Search 20: " << (hashTable.search(20) ? "Found" : "Not Found") << std::endl;
    return 0;
}

应用场景

链地址法适合数据量比较大，冲突比较多的场景。比如在数据库系统里，需要存储大量的数据，用链地址法可以很好地处理冲突。

优缺点

优点：处理冲突简单，插入和删除操作比较方便。缺点：需要额外的空间来存储链表节点，空间利用率相对较低。

注意事项

要注意链表的长度，如果链表太长，查找效率会下降。可以考虑在链表长度达到一定阈值时，将链表转换为红黑树等更高效的数据结构。

三、布谷鸟哈希

原理

布谷鸟哈希使用多个哈希函数。当发生冲突时，把冲突的数据放到另一个哈希函数计算出的位置。如果那个位置也有数据，就把那个位置的数据挤出来，再把挤出来的数据放到另一个哈希函数计算出的位置，就像布谷鸟把别的鸟蛋挤出鸟巢一样。

C++ 代码示例

// C++ 技术栈
#include <iostream>
#include <vector>
#include <algorithm>

class CuckooHashTable {
private:
    std::vector<int> table1;
    std::vector<int> table2;
    int capacity;

    // 哈希函数 1
    int hash1(int key) {
        return key % capacity;
    }

    // 哈希函数 2
    int hash2(int key) {
        return (key / capacity) % capacity;
    }

    // 插入辅助函数
    bool insertHelper(int key, int count) {
        if (count > capacity) {
            return false; // 插入失败，需要扩容
        }
        if (table1[hash1(key)] == -1) {
            table1[hash1(key)] = key;
            return true;
        } else if (table2[hash2(key)] == -1) {
            table2[hash2(key)] = key;
            return true;
        } else {
            int oldKey = table1[hash1(key)];
            table1[hash1(key)] = key;
            return insertHelper(oldKey, count + 1);
        }
    }

public:
    CuckooHashTable(int cap) : capacity(cap) {
        table1.resize(capacity, -1);
        table2.resize(capacity, -1);
    }

    // 插入元素
    bool insert(int key) {
        return insertHelper(key, 0);
    }

    // 查找元素
    bool search(int key) {
        return table1[hash1(key)] == key || table2[hash2(key)] == key;
    }
};

int main() {
    CuckooHashTable hashTable(10);
    hashTable.insert(5);
    hashTable.insert(15);
    std::cout << "Search 5: " << (hashTable.search(5) ? "Found" : "Not Found") << std::endl;
    std::cout << "Search 20: " << (hashTable.search(20) ? "Found" : "Not Found") << std::endl;
    return 0;
}

应用场景

布谷鸟哈希适合对查找效率要求非常高的场景，比如缓存系统。

优缺点

优点：查找效率高，平均查找时间复杂度接近 O(1)。缺点：插入操作可能会比较复杂，而且需要多个哈希函数。

注意事项

要注意哈希函数的选择，哈希函数不好会导致插入失败的概率增加。同时，当插入失败时，可能需要扩容哈希表。

四、代码对比

空间复杂度

开放寻址法的空间复杂度比较低，因为不需要额外的指针。链地址法需要额外的空间来存储链表节点，空间复杂度相对较高。布谷鸟哈希需要多个哈希表，空间复杂度也比较高。

时间复杂度

开放寻址法在负载因子较低时，查找和插入的时间复杂度接近 O(1)，但负载因子过高时会变差。链地址法的查找和插入时间复杂度平均为 O(1)，但链表过长时会变慢。布谷鸟哈希的查找时间复杂度接近 O(1)，插入时间复杂度在大多数情况下也接近 O(1)，但可能会出现插入失败需要扩容的情况。

适用场景

如果数据量小，对空间利用率要求高，用开放寻址法。如果数据量大，冲突多，用链地址法。如果对查找效率要求极高，用布谷鸟哈希。

五、总结

不同的哈希表冲突解决方法有各自的优缺点和适用场景。开放寻址法空间利用率高，但容易产生聚集现象；链地址法处理冲突简单，但空间利用率低；布谷鸟哈希查找效率高，但插入操作可能复杂。在实际应用中，我们要根据具体的需求来选择合适的方法。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。

哈希表冲突解决的C++实现：开放寻址法、链地址法及布谷鸟哈希的代码对比

一、开放寻址法

原理

C++ 代码示例

应用场景

优缺点

注意事项

二、链地址法

原理

C++ 代码示例

应用场景

优缺点

注意事项

三、布谷鸟哈希

原理

C++ 代码示例

应用场景

优缺点

注意事项

四、代码对比

空间复杂度

时间复杂度

适用场景

五、总结

评论

关联文章