图15 重点保障事项时间线
技术链路梳理
技术链路梳理需要得到:
- 该业务场景涉及到的请求接口以及每个接口的链路依赖
- 这些请求接口以及链路依赖的QPS/TPS
故障演练、全链路压测以及后续的SOP、监控都依赖技术链路的梳理结果。根据代码梳理技术链路是常用的方法:
Step1:梳理该业务场景下,涉及哪些用户在什么时机下,在哪些位置上做什么动作,即用户、终端、服务端三者的交互。
Step2:根据交互流程,确定终端和服务端交互的接口。
Step3:下钻每个交互接口的链路。
但在S13中,存在两个问题:
- 时间成本高:根据经验,完成一个场景的技术链路梳理需要0.5d~2d(与场景复杂度/熟悉程度相关),60 场景共需要100d左右。
- 准确性:人都有百密一疏,纯靠人看代码容易存在纰漏。
因此,联同业务架构团队,我们在服务质量保障平台Advisor(下文简称Advisor)上集成了辅助工具:在Advisor上定义S13涉及到的业务场景,通过抓包走一遍该业务场景下用户的行为路径,将抓包结果录入系统,并根据Trace自动输出链路依赖,同时计算链路依赖的放大情况。
定义业务场景 | 抓包结果录入 |
表3 Advisor场景管理