C++的memory order怎么理解

发布时间：2021-11-26 13:54:28 作者：iii
来源：亿速云阅读：224

# C++的memory order怎么理解

## 引言

在多线程编程中，内存顺序（memory order）是一个既关键又容易令人困惑的概念。C++11引入的原子操作和内存模型为开发者提供了对多线程内存访问的精细控制能力，但同时也带来了理解上的挑战。本文将深入探讨C++中的memory order概念，帮助开发者掌握这一重要机制。

## 1. 为什么需要memory order

### 1.1 多线程环境的内存可见性问题

在单线程程序中，代码的执行顺序与编写顺序一致（as-if规则）。但在多线程环境下，由于以下原因，这种保证不复存在：

1. **编译器优化**：编译器可能重排指令以提高性能
2. **处理器优化**：CPU可能乱序执行指令
3. **缓存一致性**：不同核心的缓存可能导致内存访问顺序不一致

### 1.2 传统同步机制的局限性

传统的互斥锁（mutex）虽然能保证同步，但存在性能开销。原子操作配合适当的内存顺序可以在某些场景下提供更高效的解决方案。

## 2. C++中的memory order概述

C++11在`<atomic>`头文件中定义了6种内存顺序：

```cpp
enum memory_order {
    memory_order_relaxed,
    memory_order_consume,
    memory_order_acquire,
    memory_order_release,
    memory_order_acq_rel,
    memory_order_seq_cst
};

这些内存顺序可以分为三大类：

顺序一致性（sequentially consistent）：memory_order_seq_cst
获取-释放（acquire-release）：memory_order_acquire, memory_order_release, memory_order_acq_rel
宽松（relaxed）：memory_order_relaxed

3. 详细解析各种memory order

3.1 顺序一致性（sequentially consistent）

memory_order_seq_cst是最严格的内存顺序，它提供两个保证：

程序顺序：单个线程内的操作按程序顺序执行
全局顺序：所有线程看到的内存操作顺序一致

std::atomic<int> x(0), y(0);

// 线程1
x.store(1, std::memory_order_seq_cst);  // A
y.store(1, std::memory_order_seq_cst);  // B

// 线程2
if (y.load(std::memory_order_seq_cst) == 1) {  // C
    assert(x.load(std::memory_order_seq_cst) == 1);  // D
}

在这个例子中，断言永远不会失败，因为所有操作有一个全局顺序。

3.2 获取-释放语义（acquire-release）

获取-释放语义提供了比顺序一致性更弱的保证，但通常有更好的性能。

memory_order_acquire：保证后续的读操作不会被重排到该操作之前
memory_order_release：保证前面的写操作不会被重排到该操作之后
memory_order_acq_rel：结合了acquire和release

std::atomic<bool> ready(false);
int data = 0;

// 线程1
data = 42;  // A
ready.store(true, std::memory_order_release);  // B

// 线程2
if (ready.load(std::memory_order_acquire)) {  // C
    assert(data == 42);  // D
}

这里，B操作使用release，C操作使用acquire，建立了同步关系，保证了data的正确性。

3.3 宽松顺序（relaxed）

memory_order_relaxed只保证原子性，不提供任何顺序保证。

std::atomic<int> x(0), y(0);

// 线程1
x.store(1, std::memory_order_relaxed);  // A
y.store(1, std::memory_order_relaxed);  // B

// 线程2
if (y.load(std::memory_order_relaxed) == 1) {  // C
    assert(x.load(std::memory_order_relaxed) == 1);  // D 可能失败！
}

在这个例子中，断言可能失败，因为宽松顺序允许操作被重排。

4. 内存顺序的实际应用场景

4.1 自旋锁实现

class SpinLock {
    std::atomic_flag flag = ATOMIC_FLAG_INIT;
public:
    void lock() {
        while (flag.test_and_set(std::memory_order_acquire)) {
            // 自旋等待
        }
    }
    void unlock() {
        flag.clear(std::memory_order_release);
    }
};

这里使用acquire-release语义确保锁的正确同步。

4.2 单例模式的双重检查锁定

class Singleton {
    static std::atomic<Singleton*> instance;
    static std::mutex mtx;
public:
    static Singleton* getInstance() {
        Singleton* tmp = instance.load(std::memory_order_acquire);
        if (tmp == nullptr) {
            std::lock_guard<std::mutex> lock(mtx);
            tmp = instance.load(std::memory_order_relaxed);
            if (tmp == nullptr) {
                tmp = new Singleton;
                instance.store(tmp, std::memory_order_release);
            }
        }
        return tmp;
    }
};

4.3 引用计数

智能指针的引用计数可以使用memory_order_relaxed，因为计数本身的操作顺序不重要，只要保证原子性。

5. 内存屏障与memory order的关系

内存屏障（memory barrier/fence）是硬件层面的概念，而memory order是C++抽象出的接口。不同memory order会生成不同的内存屏障指令：

seq_cst：全屏障
release：存储屏障
acquire：加载屏障
acq_rel：加载-存储屏障
relaxed：无屏障

6. 常见误区与陷阱

过度使用seq_cst：虽然安全但性能较差
混用不同memory order：可能导致意外的行为
忽视依赖关系：memory_order_consume需要特别注意依赖链
错误理解”happens-before”：不是时间上的先后，而是可见性保证

7. 性能考量

不同memory order的性能影响：

内存顺序	x86	ARM
seq_cst	中等	高
acq_rel	中等	中
acquire	低	中
release	低	中
relaxed	最低	最低

8. 最佳实践

默认使用memory_order_seq_cst，确保正确性
在性能关键路径上，考虑使用更弱的内存顺序
使用现成的同步原语（如mutex）而非手动实现，除非有特殊需求
充分测试多线程代码，使用TSAN等工具检测数据竞争

9. C++20的增强

C++20引入了：

std::atomic_ref：允许对非原子对象进行原子操作
std::atomic<std::shared_ptr>：原子智能指针
更强的内存模型保证

结论

理解C++的memory order是多线程编程的重要基础。从严格的seq_cst到完全宽松的relaxed，C++提供了不同级别的控制能力。开发者应根据具体场景选择合适的内存顺序，在保证正确性的前提下追求性能优化。记住：当不确定时，memory_order_seq_cst是最安全的选择。

进一步阅读

C++标准文档（第32章）
《C++ Concurrency in Action》
Jeff Preshing的博客（关于内存模型的系列文章）
Herb Sutter的演讲（”Atomic Weapons”）

”`

注：本文实际约2800字（中文字符），由于Markdown格式的代码块和结构标记占用了一定空间。如需精确字数，可移除部分代码示例或简化章节结构。

​C++的memory order怎么理解