【环球网科技报道 记者 李文瑶】10月24日消息,近日,阿里云公共云技术服务团队发布了云上企业技术风险共建体系。据了解,该“体系”通过阿里云专家技术服务和云产品能力,共建企业全流程的风险防控机制、故障应急流程,有效帮助企业提升故障预警和处理能力,降低真实故障影响。
阿里云技术服务产品负责人程哲桥表示,企业上云能够更便捷的建设技术风险体系,但“上好云”并不是整个体系的全部。从云产品的高可用到客户业务的高可用,依旧存在着复杂的业务链路和应用架构需要企业关注。另外,技术风险体系并不单纯依赖技术能力的建设,还需要权责分明、协调有序的组织保障。“体系”强调对于风险和故障的持续运营,将技术风险的意识贯彻到企业文化中。
在他看来,企业和云厂商联合的故障演练机制是一个良好的契机。通过梳理适合的演练场景,低成本模拟偶发的生产故障,不光可以验证企业应对技术风险时系统的鲁棒性,还可以验证故障到来时应急机制的有效性,让企业在面临真实生产故障时更加有条不紊。
从实践效果看,通过一年以上的 “体系”建设,联合演练,某金融行业客户实现了历史故障0复发,全年高可用总故障减少50%。30分钟故障恢复率也从原先的9%,提升到43%。
程哲桥表示,客户应对技术风险的能力,不是单点问题的一次性解决,也不是管理机制的一蹴而就。尤其是云时代的技术风险体系,需要企业和云厂商共同、持续、多层次的合作建设。