混沌工程:Netflix系统稳定性之道

联合创作 · 2023-09-29 10:58

在一个由很多微服务组成的分布式系统中,我们永远难以全面掌握发生什么事件会 导致系统局部不可用,甚至全面崩溃。但我们却可以尽可能地在这些不可用的情况发生 之前找出系统中的脆弱点。《混沌工程:Netflix系统稳定性之道》介绍了 Netflix 的工程师团队是如何根据多年实践经验 主动发现系统中脆弱点的一整套方法。这套方法现在已经逐渐演变成计算机科学的一门 新兴学科,即“混沌工程”。通过一系列可控的实验和执行实验的原则,混沌工程将揭 示出分布式系统中随时发生的各类事件是如何逐步导致系统整体不可用的。

《混沌工程:Netflix系统稳定性之道》既适合研发、测试人员用来了解如何构建健壮的系统,也适合软件架构师用来 了解设计创建高可用微服务体系的前沿方法,同时更适合在大型互联网或技术组织中专 门负责系统稳定性的工程团队阅读。

译者介绍

侯杰,美利金融集团技术副总裁,TGO鲲鹏会会员,毕业于南京大学;曾就职于IBM中国、IBM澳大利亚和iClick(爱点击);在多个行业的大型组织机构中负责过研发和管理工作,拥有十多年大规模分布式信息系统的设计、研发和实施经验。

技术审校者

周洋,花名中亭,阿里巴巴高可用架构团队高级技术专家,混沌工程布道师,开源项目ChaosBlade发起人。具有多年高可用保障、产品研发和系统架构经验,曾担任2015年双11稳定性负责人。目前负责高可用技术云化输出,并担任应用高可用服务(AHAS)及集团突袭演练负责人。

浏览 1
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报