问题3:关于变更机制有哪些?
规范、考试、奖惩:分级规范、时间窗口规范、审批制度等。
问题4:什么是分级发布?
问题5:怎么落地?
- 班车机制:核心服务尽量一天之上1-2次;
- 审批机制:早上10-晚上7点;周一到周五;
- 强制暂停:单实例-30%-100%(按照业务自己调整);
- 人工检查:上线单子里面附带相关监控;
- 一旦发现问题之后,快速回滚,快速切流,快速摘除;
- 自动检查:上线单子之后指标进行批量检查和自动检查;
- 自动处理故障:如果单实例,自动摘除,如果是单机房,自动切流。
问题6:举个例子来说明?
问题7:如何提高效率?
智能检查:
分级发布的一个核心点是,必须要做大量的检查,这样就会给上线效率造成很大的影响,因为可能是多人ci,一个人上线,那么这个上线的同学可以不清楚别人业务的指标是否正常,是否检查完整性会有大打折扣,另外,检查必然会有大量的时间浪费,那么是否可以有一个工具来实现所有指标的自动化和智能化检查呢?智能检查应运而生。
智能在哪里呢,异常指标的判断,一个上线可能有几百上千的指标,不可能去定义每个指标的检查算法,那么这个智能检查就会集成一些默认算法指标,以及上下游的服务。
作者丨sreqing
来源丨公众号:SRE说(ID:SRE_Qing)
dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn
关于我们
dbaplus社群是围绕Database、BigData、AIOps的企业级专业社群。资深大咖、技术干货,每天精品原创文章推送,每周线上技术分享,每月线下技术沙龙,每季度Gdevops&DAMS行业大会。
关注公众号【dbaplus社群】,获取更多原创技术文章和精选工具下载