产品类
更新时间 2026-02-11 10:46:44
最近更新时间: 2026-02-11 10:46:44
本章节主要介绍故障演练服务产品类问题。
故障演练服务解决什么问题?
故障演练服务是云原生混沌工程平台,深度融合云原生应用产品体系,提供标准化引导、正确性约束和自动化运行的实验管理,支持大规模、低成本、影响可控、形式多样的应用故障演练,帮助企业增强应用系统的容错能力和恢复能力,提升客户应用云上运行的稳定性。
产品能力:
标准化流程管理:固化演练流程,提供组织、人员、应用、资源等多维度的数据与权限管理规范。
丰富的故障场景:实现涵盖应用不同分层的原子故障注入能力,并提供具备业务含义的故障场景组合。
完备的演练防护:实现隔离与熔断双重演练防护,包括权限隔离、环境隔离和范围隔离,以及主动熔断、指标熔断和超时熔断等多种保护机制。
一站式接入管理:深度整合现有应用体系,自动导入组织权限、应用架构和关联资源,实现一站式可编排、可控制、可观测。
解决痛点:
技术要求高:异构的故障源,从基础设施到操作系统,从容器环境到应用进程,以及依赖的中间件,都需要理解其原理才能模拟故障。
实施难度大:跨团队、长流程、多权限,故障演练不仅是技术问题,更涉及组织流程与制度,需要建立相应规范。
影响不可控:故障是已知的,影响是未知的。如何感知并最小化“爆炸半径”,既要有处置预案,又要有工具支持。
故障演练服务支持哪些故障场景?
故障演练服务目前支持计算、网络、中间件、云容器、数据库等多种场景,具体请参考用户指南-故障动作库文档列表。
故障演练服务与其他云产品的关系?
故障演练服务协同其他云产品,通过内部自研工具或云产品OpenAPI模拟触发故障场景。