README

# 第 1 卷｜数据的本质

万物起源——计算机如何用有限的位表示无限的信息？这是所有上层设计的源头。

业务里你天天用 int、String、List、JSON、泛型——但能回答下面这些"小问题"吗？

这一卷不是讲 API，是讲这些数据结构当年是为了什么矛盾被发明的。

序号	文档	核心矛盾
1.1	数据编码设计原理 (opens new window)	全人类文字如何在 0/1 上达成共识？ASCII → Unicode → UTF-8
1.2	整型与位运算原理 (opens new window)	为什么是补码？整数溢出与位运算背后的硬件约束
1.3	浮点型数据设计灵魂 (opens new window)	IEEE 754 是工程妥协而非数学真理
1.4	字符串设计的灵魂 (opens new window)	为何字符串要不可变？常量池、StringBuilder 的真正动机
1.5	值类型与引用设计 (opens new window)	值传递、引用传递、共享可变状态的本源
1.6	泛型设计灵魂思想 (opens new window)	类型擦除 vs 单态化——同一个目标的两条工程路线
1.7	集合容器设计原理 (opens new window)	数组 / 链表 / 哈希 / 树——一组关于时间空间的根本权衡
1.8	序列化数据的思想 (opens new window)	JSON / XML / Protobuf / Thrift 的体积与可读性 trade-off
1.9	数据解析设计思想 (opens new window)	词法 / 语法 / SIMD —— 解析器为何能差出 100 倍

数据从最底层的 0/1 编码出发，一路抽象到泛型与容器，再以序列化"压扁"回字节流，最后由解析器"还原"——这是一条完整的数据生命周期回路。

上次更新: 2026/06/28, 17:55:19