编程进阶网 编程进阶网
首页
  • 计算机原理
  • 操作系统
  • 网络协议
  • 数据库原理
  • 面向对象
  • 设计原则
  • 设计模式
  • 系统架构
  • 性能优化
  • 编程原理
  • 方案设计
  • 稳定可靠
  • 工程运维
  • 基础认知
  • 线性结构
  • 树与哈希
  • 工业级实现
  • 算法思想
  • 实战与综合
  • 算法题考核
  • C语言入门
  • C综合案例
  • C专栏博客
  • C标准集库
  • C++入门教程
  • C++综合案例
  • C++专栏博客
  • C++开发技巧
  • Java入门教程
  • Java综合案例
  • Java专栏博客
  • Go入门教程
  • Go综合案例
  • Go专栏博客
  • Go开发技巧
  • JavaScript入门
  • JavaScript高级
  • Android库解读
  • Android专栏
  • Android智能硬件
  • iOS ObjC入门
  • iOS Swift入门
  • iOS入门精通
  • Web之Html手册
  • Web之TypeScript
  • Web之Vue高级进阶
  • Linux之QML入门
  • Linux之QT核心库
  • Linux实践开发
  • Python教程
  • Shell&Bash教程
  • 工具脚本
  • 自动化脚本
  • 质量保障
  • 产品思考
  • 软实力
  • 开发流程
  • Git应用
  • 技术模版
  • 技术规范
  • Markdown
  • Mermaid
  • 开源协议
  • JSON工具
  • 文本工具
  • 图片处理
  • 文档转化
  • 代码压缩
  • 关于我
  • 自我精进
  • 职场管理
  • 职场面试
  • 心情杂货
  • 友情链接

杨充

专注编程 · 终身学习者
首页
  • 计算机原理
  • 操作系统
  • 网络协议
  • 数据库原理
  • 面向对象
  • 设计原则
  • 设计模式
  • 系统架构
  • 性能优化
  • 编程原理
  • 方案设计
  • 稳定可靠
  • 工程运维
  • 基础认知
  • 线性结构
  • 树与哈希
  • 工业级实现
  • 算法思想
  • 实战与综合
  • 算法题考核
  • C语言入门
  • C综合案例
  • C专栏博客
  • C标准集库
  • C++入门教程
  • C++综合案例
  • C++专栏博客
  • C++开发技巧
  • Java入门教程
  • Java综合案例
  • Java专栏博客
  • Go入门教程
  • Go综合案例
  • Go专栏博客
  • Go开发技巧
  • JavaScript入门
  • JavaScript高级
  • Android库解读
  • Android专栏
  • Android智能硬件
  • iOS ObjC入门
  • iOS Swift入门
  • iOS入门精通
  • Web之Html手册
  • Web之TypeScript
  • Web之Vue高级进阶
  • Linux之QML入门
  • Linux之QT核心库
  • Linux实践开发
  • Python教程
  • Shell&Bash教程
  • 工具脚本
  • 自动化脚本
  • 质量保障
  • 产品思考
  • 软实力
  • 开发流程
  • Git应用
  • 技术模版
  • 技术规范
  • Markdown
  • Mermaid
  • 开源协议
  • JSON工具
  • 文本工具
  • 图片处理
  • 文档转化
  • 代码压缩
  • 关于我
  • 自我精进
  • 职场管理
  • 职场面试
  • 心情杂货
  • 友情链接
  • README
  • 质量保障

  • 产品思考

  • 软实力

  • 开发流程

  • Git应用

  • 技术模版

    • 技术模版
    • 技术设计文档模版
    • 技术复盘专项模版
      • 02.技术复盘专项模版
        • 01.为什么需要复盘
        • 02.事故清晰的描述
        • 03.事故的影响数据
        • 04.事故回放的记录
        • 05.事故的原因分析
        • 06.事故的解决方案
        • 07.复盘的后续改善
        • 08.复盘的相关原则
    • 技术业务分享模版
    • 十分钟分享模版
    • 技术标准化实践
  • 技术规范

  • markdown

  • mermaid

  • license

  • 博客部署

  • 技术招聘

  • 测试经验

  • 技术
  • 技术模版
杨充
2025-02-22
目录

技术复盘专项模版

# 02.技术复盘专项模版

# 01.为什么需要复盘

⼀件事情做完后⽆论成功与否,坐下来把当时预先的想法、中间出现的问题、为什么没达成⽬标等因素整理⼀遍,在下次做同样的事时,⾃然就能吸取上次的经验教训。这就是复盘。

复盘不是⽤于追责,⽽是为了发现和解决问题、积累经验、优化流程,避免再次出现同样问题。

# 02.事故清晰的描述

对事故的具体表现表述清楚,⽐如正常情况下逻辑是什么,出现问题后表现是什么,可以⽤截图⽅式说明。

# 03.事故的影响数据

  1. 数据⼝径要准确,要说明影响数据的计算公式。
  2. 定级是根据受影响功能使用量、受影响⽤户数、资损三个维度来定级,若事故对这三个维度都有影响,那需要把相关数据都统计,以影响最⼤的纬度定级。

# 04.事故回放的记录

  1. 事故时间线不要漏了关键节点,处理⼈、采取对应的⾏动和原因。
  2. 时间线需要完整,包含事前、事中、事后的动作。

# 05.事故的原因分析

  1. 直接原因,是直接导致事故发⽣的原因,常⻅的是代码逻辑问题、分⽀合并、并发等。
  2. 深层原因,是挖掘为什么会出现这个事情深层次原因,也要从事前、事中、事后⻆度分析。

挖掘的⽅法可以在原有问题上在问为什么,⽐如为什么事故持续时间这么⻓?为什么代码逻辑有问题?为什么这个问题没有被发现。

深层原因才是我们要复盘解决的问题,能够避免相同问题再出现。

# 06.事故的解决方案

止损方案:详细描述止损方案

解决方案:详细描述解决方案,决定什么时候解决。要有一个把控进度的能力。

# 07.复盘的后续改善

改善措施⼀定要写切实可落地的,和原因分析得出的结论要相对应,并且要有完成时间和跟进⼈。

# 08.复盘的相关原则

事事总结:敬畏错误,原则上,所有线上问题(含pre发现的严重问题),都有必要复盘,形成wiki

强调意识:违规线上操作或者严重的主观意识问题,升格处理;难以规避的技术问题,特别是由于业务快速发展⽽不得不承担的线上⻛险,酌情降级

流程和技术设计:流程+技术设计类问题,重点关注:遇到基础库导致的线上bug、设计或沟通不到位、代码合并、常犯模块(>2次)、其他明显质量意识或机制,导致的线上问题/测试暴露被投诉的案例

举⼀反三:凡是犯某个具体错误的,都需要承担⼼梳理上下游类似问题/某个技术点更完 整学习,进⾏组⾥分享的责任;把问题,当成学习机会

#复盘#事故分析#技术管理
上次更新: 2026/06/07, 09:20:35
技术设计文档模版
技术业务分享模版

← 技术设计文档模版 技术业务分享模版→

最近更新
01
信号崩溃快速排查
06-15
02
CoreDump破案
06-15
03
perf火焰图实战
06-15
更多文章>
Theme by Vdoing | Copyright © 2019-2026 杨充 | MIT License | 桂ICP备2024034950号 | 桂公网安备45142202000030
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式