C++ Hash算法与数据去重

发布时间：2024-11-20 10:45:34 作者：小樊
来源：亿速云阅读：171

在C++中，哈希算法（Hash Algorithm）是一种将任意长度的输入（也称为预映射）通过散列函数变换成固定长度输出的过程。哈希算法在数据去重、查找、插入等操作中具有高效性。

以下是一个简单的C++哈希算法示例，用于实现数据去重：

#include <iostream>
#include <vector>
#include <unordered_set>

// 简单的哈希算法示例
unsigned int simpleHash(const std::string& input) {
    unsigned int hash = 0;
    for (char c : input) {
        hash = (hash * 31 + c) % 1000000; // 使用31作为乘数，1000000作为模数
    }
    return hash;
}

int main() {
    std::vector<std::string> data = {"apple", "banana", "orange", "apple", "grape", "banana"};

    // 使用unordered_set进行数据去重
    std::unordered_set<unsigned int> uniqueHashes;
    for (const std::string& item : data) {
        uniqueHashes.insert(simpleHash(item));
    }

    // 输出去重后的哈希值
    std::cout << "Unique hashes:" << std::endl;
    for (unsigned int hash : uniqueHashes) {
        std::cout << hash << std::endl;
    }

    return 0;
}

在这个示例中，我们首先定义了一个简单的哈希算法simpleHash，它接受一个字符串输入并返回一个哈希值。然后，我们使用std::unordered_set来存储去重后的哈希值。unordered_set会自动处理重复元素，只保留唯一的哈希值。最后，我们输出去重后的哈希值。

需要注意的是，这个简单的哈希算法可能会产生碰撞（两个不同的输入具有相同的哈希值）。在实际应用中，你可能需要使用更复杂的哈希算法，如MurmurHash、CityHash等，以降低碰撞的可能性。

C++ Hash算法与数据去重

相关阅读