
初次了解到业务连续性计划还是在wxpay的时候,虽然在dmpt的时候我每年也会针对后台的可用性作一份review报告,但是不怎么系统。而业务连续性计划就是系统性保证系统可用性的方法论。所以它是什么呢?
制定业务连续性计划(Business Continuity Plan, BCP)是一个系统的过程,旨在确保企业在面对突发事件、灾难或其他中断时,能够持续运营或迅速恢复正常运营的关键业务功能。以下是制定有效业务连续性计划的关键步骤:
务连续性计划的步骤
1. 项目启动和管理
确定业务连续性计划的需求,包括获得管理支持,并组织和管理项目以符合时间和预算的限制.
大白话就是说立项得到领导的支持,从而获取资源。
2. 风险评估和控制
识别可能造成机构及其设施中断和灾难的事件和周边环境因素,以及事件可能造成的损失和防止或减少潜在损失影响的控制措施。
机房、网络、第三方依赖、核心岗位人员流失等都是潜在的风险
3. 业务影响分析(BIA)
评估不同业务功能在中断时的影响,确定关键功能、其恢复优先顺序和相关性,以确定恢复时间目标
制定业务连续性策略:基于BIA结果,制定恢复策略,包括恢复时间目标(RTO)和恢复点目标(RPO)

需要分维度制定影响分析报告,然后评估 RTO 和 RPO。根据管理学理论:你不能度量它即是不能管理它,所以可以以这2个指标为牵引来保障业务连续性。
4. 资源和能力评估
评估现有资源和能力,确定是否需要额外资源以支持业务连续性。
保障业务连续性也是一个取舍的过程,比如一个日活100万的应用,它需要支持异地多活吗?是不是保证同城跨可用区级别容灾就行了。如果是一个日活只有几千的应用,业务连续性计划是否需要也是一个问题?
5. 制定应急响应计划
- 应对突发事件的立即行动计划
- 业务恢复计划:制定逐步恢复业务运营的详细计划
- 通信计划:确定内部和外部通信策略,确保信息的有效传递
- 制定测试、培训和演练计划:制定定期测试BCP的计划,并对员工进行培训和演练
- 制定维护和更新计划:确保BCP定期更新,以反映业务变化和新的威胁
- 技术恢复计划:制定IT系统和数据恢复的详细计划
- 法律和合同考虑:考虑BCP对现有合同和法律义务的影响
- 制定财务和资金计划:确保有足够的资金来支持BCP的实施
- 制定危机管理团队和角色分配:确定危机管理团队的成员和他们在业务连续性中的角色
- 文档和记录管理:确保所有BCP文档都是最新的,并且可以被快速访问
- 整合和协调:确保BCP与组织的整体风险管理和战略规划相协调
- 执行和监控:实施BCP并持续监控其有效性
注意
业务连续性计划的制定是一个持续的过程,需要定期审查和更新,以确保其在面对不断变化的风险和业务环境时保持相关和有效。这个计划需要有专门的人力投入来支撑,按照熵增定律,如果不投入人力,这个计划很快就会腐烂掉。
开头总是璀璨,结果却难得辉煌。一般来说立项后的工作很容易被激励到,但是后续的维护需要投入资源却不会收到多少关注,一般人这个时候就会去开另外的坑了,此时就要当心了噢~
参考文章
BCM-BCP-DRP-运维管理之故障管理——故障的分类与处理流程