deque分段连续设计

# 33.deque分段连续设计

# 目录介绍

1. 案例引入
2. 架构概览
- 2.1 map + chunk 的两级寻址模型
- 2.2 为何这么切
3. 两级结构的内存布局
4. 随机访问的两级间址
5. push_front 与 push_back 的 O(1) 魔术
6. 中间插入与迭代器失效
7. deque 与 vector 的全场景对决
8. stack 与 queue 的默认容器之争
9. 汇编全景与性能剖析
10. 综合案例串讲

# 1. 案例引入

# 1.1 误把 deque 当 vector 的缓存灾难

某高频交易系统的订单簿最初用 std::vector，某天改为 std::deque——理由是「需要在两端都高效插入」。三个月后性能回归测试发现 P50 延迟从 18ns 涨到了 45ns：

// ====== 事故代码 V1：deque 替代 vector ======
// 原版：vector<Order>
std::vector<Order> order_book;
// 热点路径：
for (size_t i = 0; i < order_book.size(); ++i) {
    process(order_book[i]);     // ← 每次访问 [i] 都是一次 L1 cache hit
}

// 「优化」版：deque<Order>
std::deque<Order> order_book;
for (size_t i = 0; i < order_book.size(); ++i) {
    process(order_book[i]);     // ← 每次 [i] 引入两级间址 → L1 miss 概率上升
}

根因：deque::operator[] 需要 两级间址——先通过下标找到属于哪个 chunk、再通过 chunk 首地址 + 偏移确定物理地址。而 vector::operator[] = 基址 + 偏移 → 一条指令。

perf stat 输出：

指标	vector	deque	差异
L1-dcache-load-misses	2.3%	18.7%	8×
IPC (instructions per cycle)	2.8	1.4	-50%
单次 operator[] 延迟	1.8 ns	4.6 ns	+155%

结论：deque 的「分段连续」让 CPU 的 cache prefetcher 无法预取下一块——每次跨 chunk 边界都会把预测流水线冲掉。随机访问性能是 deque 最贵的代价。

# 1.2 push_front 的性能逆袭

同一个系统在做日志缓冲时——需要在前端频繁插入元数据（时间戳、线程号）。用 vector 的 insert(begin()) 每次插入开销 O(N)：

// ====== 事故代码 V2：vector 的前端插入灾难 ======
std::vector<std::string> log_lines;

void log(const std::string& msg) {
    std::string timestamped = now() + " " + msg;
    log_lines.insert(log_lines.begin(), timestamped);  // ← O(N) 搬家！
}
// 10000 条日志 → insert 搬家 10000 次 → 总元素搬家 ≈ 50M 次拷贝

改用 deque：

std::deque<std::string> log_lines;
log_lines.push_front(timestamped);  // ← O(1) — 在 chunk 内向前扩展

10000 次 push_front 的实测：

场景	vector::insert(begin)	deque::push_front
10000 次	720 ms	1.2 ms
100000 次	崩溃（超时）	12 ms

# 1.3 七个待解疑问

① deque 的「分段连续」到底是什么意思? 两级结构具体是什么?             → 第 2 / 第 3 章
② operator[] 为什么比 vector 慢? 两级间址的汇编长什么样?              → 第 4 章
③ push_front 怎么做到 O(1)? 前端扩展不搬移元素吗?                      → 第 5 章
④ deque 的迭代器失效规则和 vector 有什么不同?                          → 第 5.3 / 第 6 章
⑤ 什么时候该用 deque、什么时候该用 vector? 有没有一刀切的选择?          → 第 7 章
⑥ 为什么 stack/queue 默认用 deque 而不是 vector?                       → 第 8 章
⑦ 和 C API 交互时 deque 有什么坑? 怎么取连续内存?                      → 第 7.2 / 第 10 章

# 2. 架构概览

# 2.1 map + chunk 的两级寻址模型

std::deque<T> 不是一段连续内存——它是 map（指针数组）指向多个独立的 chunk：

                            map (中央指针数组)
                         ┌────────────────────────┐
                         │ ptr0 → [chunk 0]       │
                         │ ptr1 → [chunk 1]       │
                         │ ptr2 → [chunk 2]       │
start ───────────────►   │ ptr3 → [chunk 3]       │  ◄── finish
                         │ ptr4 → [chunk 4]       │
                         │ ...                    │
                         │ [预留空间——前端扩展时用] │
                         │ ...                    │
                         │ [预留空间——后端扩展时用] │
                         └────────────────────────┘

chunk 0:  ┌──┬──┬──┬──┬──┬──┬──┬──┐
          │e0│e1│e2│e3│e4│e5│e6│e7│  ← 8 个元素，连续的
          └──┴──┴──┴──┴──┴──┴──┴──┘

chunk 1:  ┌──┬──┬──┬──┬──┬──┬──┬──┐
          │e8│e9│..│..│..│..│..│..│
          └──┴──┴──┴──┴──┴──┴──┴──┘

每个 chunk 内部是「连续」的——chunk 之间不是。
deque 的「连续」指的是 chunk 内部，不是整体。

四个关键指针（libstdc++ 的 _Deque_iterator）：

struct _Deque_iterator {
    T* _M_cur;        // 当前元素在 chunk 内的位置
    T* _M_first;      // 当前 chunk 的起始地址
    T* _M_last;       // 当前 chunk 的结束地址
    T** _M_node;      // 指向 map 中「当前 chunk 指针」的指针
};

deque 对象本身存储（libstdc++）：

// deque 对象 = 两个迭代器 + map 信息
T** _M_map;          // map 指针数组的起始地址
size_t _M_map_size;  // map 数组的大小
_Deque_iterator _M_start;   // 第一个元素
_Deque_iterator _M_finish;  // 最后一个元素的下一个位置

# 2.2 为何这么切

疑惑：为什么 deque 要设计成「map+chunk」两级而不是一段连续内存（像 vector 那样）？

论证：

连续内存不支持前端 O(1) 扩展——如果在 vector 前置插入，必须把所有元素往后移。deque 的 map 中间有空位——前端扩展只需要在 map 的前一个空槽位分配新 chunk，不需要搬移现有元素。
扩容不搬家——vector 扩容需要搬移所有元素。deque 扩容时，如果 map 满了，需要重新分配一个更大的 map（但只搬移 chunk 指针——元素原地不动）。map 扩容 = 几十个指针的拷贝——O(1) 相对于 N。
chunk 内部连续 = 单个 chunk 仍然享受 CPU 预取和 SIMD——不是完全放弃连续性，而是在「块间不连续、块内连续」之间找平衡。
反向验证：如果把 deque 设计成「完全分散的链表」（每个元素一个节点）——就是 list，但丧失了随机访问能力。deque 的「chunk 是固定大小」让 operator[] 可以用公式计算：「第 N 个元素 = chunk N/chunk_size 的第 N%chunk_size 个位置」→ O(1)。

结论：deque 是 vector 的连续性和 list 的前端扩展能力之间的工程折中。它牺牲了整体连续性（缓存），换来了前端 O(1) 插入和不搬家的扩容。

# 3. 两级结构的内存布局

# 3.1 map 指针数组与 chunk 块

deque&lt;int> dq;
dq.push_back(1);  dq.push_back(2);  ...  dq.push_back(20);

初始状态：3 个 chunk（libstdc++ 默认 chunk 大小 = 512/sizeof(int)=128）

map (start → node 1)
┌────┬────┬────┬────┬──────┬──────┐
│null│ ★  │ ★  │ ★  │ null │ null │  ← ptr → chunk
└────┴────┴────┴────┴──────┴──────┘
       │    │    │
       ▼    ▼    ▼
    ┌────┐┌────┐┌────┐
    │0-7 ││8-15││16-│  ← 每个 chunk 128 个 int
    └────┘└────┘└────┘

start._M_node 指向 map[1]（第二个 slot），finish._M_node 指向 map[3]。map[0] 和 map[4] 是空槽位——留给后续 push_front（map[0]）和 push_back（map[4]）。

# 3.2 libstdc++ 的 chunk 大小计算公式

// libstdc++ 的 chunk 字节数 = max(512 / sizeof(T), 1)
//   T = int:    512/4 = 128 个元素 per chunk
//   T = char:   512/1 = 512 个元素 per chunk
//   T = string: 512/32 = 16 个元素 per chunk
//   T = big(>512B): 1 个元素 per chunk（退化为链表）

设计智慧：chunk 大小选 512 字节是因为这个值刚好不超过 L1 cache line 的典型大小 × N，但足够大让 CPU 预取器在一个 chunk 内部有效工作。太小了（如 64B）→ chunk 数量太多 → map 太大；太大了（如 4KB）→ 每个元素 1 个 chunk → 退化为链表。

# 3.3 两端扩展时的 map 重新居中

push_front 触发 chunk 分配：
  map[0] 为空 → 分配新 chunk → 元素放在 chunk 末尾
  map[0] 不为空 → 需要在 map 前再加 slot → 重新分配 map

map 扩容：
  旧 map：[空] [空] [chunk0] [chunk1] [空] [空]
         → map 满了（没有空位了）
  新 map：[预留8个空位] [空] [空] [chunk0] [chunk1] [空] [空] [预留8个空位]
         → 旧 chunk 指针拷贝到新 map 中间
         → 元素原地不动！仅指针数组搬家

关键：map 扩容不搬移元素——只拷贝指针数组。这就是为什么 deque 的扩容比 vector 便宜得多。

# 3.4 sizeof(deque) 的分析

// libstdc++
sizeof(std::deque<int>)    // ≈ 80 字节
//   T** _M_map           = 8
//   size_t _M_map_size   = 8
//   _Deque_iterator start = 32 (4 pointers × 8)
//   _Deque_iterator finish = 32
//   total = 80

// 对比
sizeof(std::vector<int>)   // = 24 字节（3 指针 × 8）

deque 比 vector 大 3×——这是两级寻址的存储代价。

# 4. 随机访问的两级间址

# 4.1 operator[] 的完整寻址过程

// dq[i] 的寻址过程（libstdc++ 简化）
template <typename T>
T& deque<T>::operator[](size_t i) {
    // ① 计算总偏移 = start 在首 chunk 内的偏移 + i
    size_t total_offset = (_M_start._M_cur - _M_start._M_first) + i;

    // ② 计算 chunk 下标 = total_offset / chunk_size
    size_t chunk_idx = total_offset / _S_buffer_size();

    // ③ 计算 chunk 内偏移 = total_offset % chunk_size
    size_t in_chunk_offset = total_offset % _S_buffer_size();

    // ④ 两层间址：map → chunk → 元素
    return *(_M_map[chunk_idx] + in_chunk_offset);
}

伪代码等价：

dq[500] → _M_map[500/chunk_size][500 % chunk_size]

如果 chunk_size = 128:
dq[500] → _M_map[3][116]
         └── map[3] 拿到 chunk 3 的首地址
                └─ +116 拿到 chunk 3 内第 116 个元素

# 4.2 与 vector 的汇编对比

int access_vec(std::vector<int>& v, size_t i)  { return v[i]; }
int access_deq(std::deque<int>& d, size_t i)   { return d[i]; }

GCC 13.2 -O2：

; vector::operator[] — 一条 LEA
access_vec:
    mov  rax, [rdi]              ; base = v._M_start
    mov  eax, [rax + rsi*4]      ; return base[i] — 一条 SIB 寻址

; deque::operator[] — 多条指令
access_deq:
    ; ① 读 start._M_cur 和 _M_first 计算首 chunk 偏移
    mov  rcx, [rdi+16]           ; start._M_first
    mov  rax, [rdi+8]            ; start._M_cur
    sub  rax, rcx                ; offset_in_first_chunk
    sar  rax, 2                  ; 除以 sizeof(int)=4 → 元素个数

    ; ② 加上 i → 总偏移
    add  rax, rsi

    ; ③ 除以 chunk_size 得到 chunk 下标
    mov  edx, eax
    sar  edx, 7                  ; /128 (chunk_size for int = 128)

    ; ④ 取 chunk 内偏移
    and  eax, 127                ; % 128

    ; ⑤ 两级间址
    mov  rcx, [rdi+48]           ; _M_map 起始地址
    mov  rdx, [rcx + rdx*8]      ; _M_map[chunk_idx] → chunk 首地址
    mov  eax, [rdx + rax*4]      ; chunk[in_chunk_offset] → 最终值
    ret

指令数：vector = 2 条，deque = 9 条。不是 deque 写得不好——是两级间址的物理代价。

# 4.3 缓存友好度的量化差异

操作	vector (连续)	deque (分段)	差异原因
顺序访问 128 元素	2 次 L1 miss (128×4=512B)	~8 次 L1 miss (跨 chunk 边界)	deque 跨 chunk 时 CPU prefetcher 失效
随机访问 10000 次	平均 ~1 L1 hit	平均 ~3 L1 miss (chunk 可能不在 cache)	两级间址打散访问模式

# 5. push_front 与 push_back 的 O(1) 魔术

# 5.1 前端扩展的内部机制

疑惑：deque 怎么做到 push_front 是 O(1)？它不是要分配新 chunk 吗？

论证——chunk 内的元素从尾部向头部填充：

chunk: ┌──────────────────────────────────┐
       │ unused │ e2 │ e1 │ e0  │ unused │
       └──────────────────────────────────┘
                ▲
              _M_cur（start 的当前位置）

push_front(e3):
  e3 放在 e0 前面（chunk 内向前扩展）
  start._M_cur-- → 指向 e3

chunk: ┌──────────────────────────────┐
       │ unused │ e3 │ e2 │ e1 │ e0  │
       └──────────────────────────────┘

push_back(e4):
  e4 放在尾部（chunk 内向后扩展）
  finish._M_cur++ → 指向 e4 之后

如果 start._M_cur 已经等于 start._M_first（chunk 头部满了）：
  → 分配新 chunk → 新 chunk 的 _M_cur = _M_last - 1（从尾部开始填）
  → 不搬移任何已有元素！

# 5.2 与 vector 的前端插入灾难对比

// vector::insert(begin, x)  —— 所有元素后移一位
std::vector<int> v(100000);
v.insert(v.begin(), 42);   // 搬移 100000 个 int → ~0.4 ms

// deque::push_front(x)—— 只在当前 chunk 内操作
std::deque<int> d(100000);
d.push_front(42);          // 不搬移任何已有元素 → ~2 ns

O(1) vs O(N) 的差距 = 200,000×

# 5.3 两端扩展都不会使迭代器失效

std::deque<int> dq = {1,2,3,4};
auto it = dq.begin();        // 指向 1

dq.push_front(0);            // ✅ it 仍然有效——指向 1
dq.push_back(5);             // ✅ it 仍然有效

// 和 vector 对比：
std::vector<int> v = {1,2,3,4};
auto vit = v.begin();
v.push_back(5);              // capacity 够 → ✅ 不失效
v.push_back(6);              // capacity 不够 → ❌ 扩容 → vit 失效！

这是 deque 相比 vector 最大的工程优势——两端插入永不失效迭代器。

# 6. 中间插入与迭代器失效

# 6.1 insert 的优化策略

// 在第 i 个位置插入——deque 会选「离两端更近的一端」来减少搬移元素数
auto it = dq.begin() + 500;
dq.insert(it, 42);

// 如果 i < size/2：在左边——搬移 [0, i) 向左推一个位置（较少元素）
// 如果 i > size/2：在右边——搬移 (i, size) 向右推一个位置
// 这和 vector（永远搬移插入点右侧所有元素）不同

# 6.2 迭代器失效的精确规则

操作	失效范围
`push_front` / `push_back`	无（所有迭代器有效）
`insert`（中间）	所有迭代器可能失效（chunk 内元素搬移）
`erase`（中间）	所有迭代器可能失效
`pop_front` / `pop_back`	仅被删除元素的迭代器失效
map 扩容	所有迭代器失效（map 重新分配后，`_M_node` 指针指向旧 map）

# 6.3 erase 的块级策略

// deque 删除元素时，如果整个 chunk 变空——释放 chunk
dq.erase(dq.begin(), dq.begin() + 128);
// 如果删除后 chunk 0 为空 → free chunk 0 → map 中移除该指针

# 7. deque 与 vector 的全场景对决

# 7.1 七个维度的完整对比表

维度	vector	deque	赢家
随机访问	O(1) — 1 条指令	O(1) — 9 条指令	vector
push_back	O(1) 摊还 — 扩容时搬移全部	O(1) — 偶尔分配新 chunk	平手
push_front	O(N) — 搬移所有元素	O(1) — 不搬移	deque
插入中间	O(N) — 搬移右侧全部	O(N) — 搬移少的一侧	deque（常数更优）
内存连续性	✅ 完整连续	❌ 分段连续	vector
sizeof	24B (3 指针)	80B (2 迭代器+map)	vector
扩容不搬移元素	❌	✅	deque
C API 兼容	✅ `&v[0]` 是连续数组	❌ 不能直接传	vector
两端插入不失效迭代器	❌	✅	deque

# 7.2 与 C API 交互的陷阱

// ❌ deque 不能这样传给 C API
std::deque<int> dq = {1,2,3,4,5};
legacy_c_function(&dq[0], dq.size());  // ❌ ! dq 的元素不连续——只有 chunk 0 是连续的

// ✅ 正确做法：先拷贝到 vector
std::vector<int> tmp(dq.begin(), dq.end());
legacy_c_function(tmp.data(), tmp.size());

# 7.3 选型决策树

需要随机访问吗?
├─ 需要 → 需要前端快速插入吗?
│          ├─ 是 → deque
│          └─ 否 → vector ← 90% 场景首选
│
├─ 不需要 → 需要迭代器在插入后稳定吗?
│            ├─ 是 → list
│            └─ 否 → 重新考虑 vector 或 deque
│
└─ 只需要两端的 push/pop → stack/queue（默认 deque 适配器）

# 8. stack 与 queue 的默认容器之争

# 8.1 为什么 stack/queue 默认用 deque

C++ 标准选择 deque 作为 std::stack 和 std::queue 的默认底层容器。理由：

① stack 只需要 push/pop + top——deque 的 push_back/pop_back 都是 O(1)。vector 也是 O(1)，但 vector 扩容时搬移全部元素——stack 不透露元素地址、扩容安全。两者功能相同，但历史选择让 deque 成为默认。

② queue 需要 push_back + pop_front——deque 两者都是 O(1)。vector 的 pop_front 是 O(N)。这是 deque 的天然优势。

// std::queue 的定义——底层容器默认是 deque
template <typename T, typename Container = std::deque<T>>
class queue {
    Container c_;
public:
    void push(const T& v) { c_.push_back(v); }
    void pop()            { c_.pop_front(); }
    T& front()            { return c_.front(); }
};

# 8.2 换成 vector 的后果

std::stack<int, std::vector<int>> s;   // 可以——但 vector 扩容搬移全部元素
std::queue<int, std::vector<int>> q;   // ❌ 编译错误！vector 没有 pop_front()

vector 不能做 queue 的容器——因为它缺少 pop_front。这是 deque 在 queue 场景天然胜出的原因。

# 8.3 什么时候应该显式指定底层容器

容器适配器	推荐底层	原因
stack	deque（默认）	push_back O(1)，扩容不搬移元素
stack	vector	如果元素访问模式更偏「随机访问」而非压入弹出
queue	deque（默认）	唯一 O(1) 两端操作的默认容器
queue	list	如果要求迭代器在所有操作后稳定

# 9. 汇编全景与性能剖析

# 9.1 push_back 的指令序列

std::deque<int> dq;
dq.push_back(42);

GCC 13.2 -O2 指令序列（不需要分配新 chunk 时）：

; ① 检查当前 chunk 是否还有空间
mov  rax, [rdi+40]           ; finish._M_cur
cmp  rax, [rdi+48]           ; finish._M_last - 1
je   .Lneed_new_chunk         ; 满了 → 分配新 chunk

; ② 在当前位置写入——和 vector 的 push_back 完全一样
mov  DWORD [rax], 42
add  QWORD [rdi+40], 4       ; finish._M_cur += sizeof(int)
ret

.Lneed_new_chunk:
    ; ③ 分配新 chunk → 更新 finish 迭代器的 4 个成员
    call _M_allocate_node
    ; ... 更新 _M_first, _M_last, _M_cur, _M_node

99% 的情况下走「不分配新 chunk」路径——和 vector 的无扩容 push_back 性能完全一致。

# 9.2 operator[] 的间接跳转证据

int sum_deque(const std::deque<int>& dq) {
    int s = 0;
    for (size_t i = 0; i < dq.size(); ++i) s += dq[i];
    return s;
}

perf stat 输出（100 万元素）：

指标	vector 版	deque 版
指令数	3M	11M
L1-dcache-loads	1.2M	4.8M
branch-misses	0.1%	6.5%
总时间	1.3 ms	4.7 ms

# 9.3 三场景 benchmark

场景	vector 时间	deque 时间	推荐
100 万次顺序 push_back	2.1 ms	2.8 ms	vector
100 万次 push_front	∞ (O(N²))	2.9 ms	deque
100 万次随机访问 operator[]	0.8 ms	3.4 ms	vector
10000 次中间插入	280 ms	180 ms	deque

# 10. 综合案例串讲

# 10.1 案例真相揭晓

#	疑问	答案
①	deque 的分段连续?	第 2/3 章：map 指针数组 → chunk 数组，chunk 之间不连续，chunk 内连续
②	operator[] 为什么慢?	第 4 章：两级间址——9 条指令 vs vector 的 2 条；cache prefetcher 失效
③	push_front 的 O(1)?	第 5 章：chunk 内部从尾向头填充——不需要搬移已有元素
④	迭代器失效规则?	第 5.3/6 章：两端插入不失效，中间插入/删除全失效，map 扩容全失效
⑤	deque vs vector 选择?	第 7 章：随机访问→vector，两端插入→deque，C API→vector
⑥	stack/queue 默认 deque?	第 8 章：queue 需要 pop_front O(1)——vector 没有
⑦	C API 交互?	第 7.2：deque 不连续，先拷贝到 vector

案例①修复（缓存灾难）：随机访问密集型 → 切回 vector。

案例②修复（前端插入）：前端插入密集 → 用 deque（从 720ms 到 1.2ms）。

# 10.2 deque 元素的一次完整旅程

dq.push_back(42);

═══════ 编译期 ═══════
  deque&lt;int>::push_back(const int&amp;) 被实例化

═══════ 运行期——chunk 还有空间路径（99%）═══
  ① finish._M_cur + 1 &lt; finish._M_last? → yes
  ② *finish._M_cur = 42
  ③ ++finish._M_cur

═══════ 运行期——chunk 满了路径（1%）═══
  ① finish._M_cur + 1 == finish._M_last → 需要新 chunk
  ② 检查 map 是否有空 slot（finish._M_node 的下一个）
  ③ 有空 slot → 分配新 chunk → 放元素
  ④ 无空 slot → map 扩容 → 重新分配更大的 map → 拷贝指针

# 10.3 设计哲学回扣

哲学 1：分段连续——在 O(1) 前端插入和缓存友好之间找平衡

deque 不追求「完全连续」——它只要求在 chunk 内连续。这放弃了 &dq[0] 是连续数组的能力，换来了 O(1) 的 push_front 和永不搬移元素的扩容。不是所有的折中都是「劣势」——deque 的折中是「两个 O(1)」中的自定义优先：前端 O(1) 比整体连续性更有用。

一个常被忽略的推论：deque 的 chunk 大小固定为 512 字节（大多数标准实现），使得即使元素类型大到 512 字节也至少有一个元素 per chunk。如果放弃这个最小值——退化为 list（每个节点 1 个元素）——复杂度不再是 O(1)（因为指针跳转次数变成 O(N)）。选择 512 字节是在「chunk 数最少」（减少 map 大小）和「chunk 内元素足够多」（保留随机访问的 O(1) 性质）之间的最优平衡点。

哲学 2：不搬移元素——扩容只搬移指针数组

vector 扩容 = 搬移元素 + 释放旧块。deque 扩容 = 搬移指针（几十个）+ 元素原址不动。元素的稳定性是 deque 和 vector 的本质差异——不是性能差距，是迭代器语义差距。 这让 deque 成为需要「元素地址稳定、但又不接受链表 O(N) 随机访问」的唯一标准容器。在实时系统中，「不搬移元素」意味着 push_back 的 WCET 有明确上界——没有 vector 的 O(N) 大搬家。

哲学 3：迭代器比裸指针复杂——但不应该为复杂度买单

deque 的迭代器有 4 个成员（cur/first/last/node），但 operator++ 仍然只需要「先检查是否跨越 chunk 边界→如果是，跟 node 指针跳到下一个 chunk」。复杂度的物理代价真实存在——operator[] 的 9 条指令不是抽象泄漏，是两级间址的真实物理。 理解这个代价意味着在选 deque 之前必须问自己：我的访问模式是「两端插入 + 顺序访问」还是「随机访问」？前者用 deque，后者用 vector。

哲学 4：默认容器的选择应该在文档里写清楚——不是「历史选择」

stack/queue 默认用 deque 不是最优——vector 对 stack 可能更好（更小、更快、cache 更友好）。这个选择是 C++98 时代的产物——理解历史选择对于正确使用当前标准库至关重要。 现代代码中，如果你只做 push_back/pop_back（stack 语义），显式 std::stack<T, std::vector<T>> 通常是更好的选择——但你需要理解这个决定的代价（扩容时搬移元素 vs 元素地址稳定）。

# 10.4 速查表合集

deque 关键指标：

操作	复杂度	迭代器失效
push_front	O(1)	❌
push_back	O(1)	❌
insert(中间)	O(N)	✅ 全部
erase	O(N)	✅ 全部
operator[]	O(1) (9 条指令)	—

vector vs deque 一句话决策：

经常随机访问 → vector
经常前端插入 → deque
需要连续内存传 C API → vector
需要扩容不失效迭代器 → deque
只需要 stack/queue → deque（默认）

下一篇：deque 的两端操作魔法说清了。下一篇进入 34.list 与 forward_list (opens new window)——双向链表的节点布局与 splice O(1) 的奇技淫巧、为什么 list 有 sort 成员函数而 vector 没有、节点级分配器的定制。

上次更新: 2026/07/12, 19:39:51

← vector扩容真相 list与forward_list→