活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      应用编排服务_相关内容
      • 计费说明
        本文为您说明资源编排ROS的计费方式 计费项及计费方式 计费项 计费说明 计费方式 资源编排服务 资源编排服务本身完全免费 无 资源编排创建的云资源 由资源编排创建的云资源遵循对应云产品的标准计费规则,与天翼云平台其他创建方式费用一致 按照各云产品实际计费方式进行收费,具体请参考对应产品的计费说明 费用预览功能 资源编排服务提供费用预览功能,在资源栈执行计划阶段会展示预计产生的费用详情,帮助您在资源创建前清晰了解相关成本,便于进行预算规划和管理。 说明 1. 资源编排服务为免费服务,不收取任何服务费用 2. 实际产生的费用为通过资源编排创建的云资源费用,收费标准与各云产品官方定价保持一致 3. 费用结算遵循天翼云平台统一的计费规则和结算流程 4. 建议在执行资源栈前仔细查看费用预估,确保符合预算预期 5. 如需了解具体云产品的详细计费信息,请参考天翼云官方产品文档或联系客服咨询。
        来自:
        帮助文档
        资源编排ROS
        计费说明
        计费说明
      • 业务流程
        本文为您介绍多活容灾服务平台业务流程。 多活容灾服务平台业务流程分为四个阶段:资源管理阶段、容灾环境搭建部署阶段、预案编排阶段、容灾演练/应急切换阶段。如下图所示: 资源管理 1. 用户同步天翼云资源或纳管三方资源至MDR平台侧。 2. 若预案编排需要执行脚本,需对脚本进行创建验证和脚本发布。 容灾环境搭建部署阶段 1. 用户需要确认业务所需的容灾形态。 2. 根据容灾形态创建和部署容灾架构。 3. 接入对应的业务应用与相关资源。 4. 日常运维监控。 预案编排阶段 1. 用户根据业务需求创建预案阶段。 2. 基于不同任务类型进行预案阶段设计。 3. 基于不同预案阶段编排预案。 容灾演练/应急切换阶段 容灾演练阶段 1. 用户根据业务需求关联相关预案。 2. 基于演练场景配置演练方式与超时时间。 3. 执行演练,查看预案流程、任务列表与演练记录。 故障切换阶段 1. 故障恢复失败,确认需要执行切换。 2. 确认切换范围,选择切换预案。 3. 执行应急切换,查看执行详情与切换状态。
        来自:
        帮助文档
        多活容灾服务
        产品介绍
        业务流程
      • 入门实践
        本文为您介绍多活容灾服务常见的容灾实践,帮助您更好地使用多活容灾服务。 实践 描述 :: 创建命名空间 命名空间是一个逻辑租户的概念,实现对MDR管控配置和数据的逻辑隔离,承载整个多活项目的资源集合,包括了流量入口,多活分区,数据同步,数据监控等内容。用户可以创建多个命名空间,用于逻辑隔离不同的资源。 创建容灾管理中心 在多活容灾服务控制台创建容灾管理中心,容灾管理中心以实例的形式独立运行,所有的操作都是在实例内进行,不同实例间的资源相互隔离。 应用接入 帮助用户将应用接入到已经创建好的云主机中,并可对用户的应用端口和绑定的数据库、存储等资源进行监控告警。 预案编排 用户以预案阶段为单位进行编排,形成完整的预案流程。容灾切换模块中通过关联预案创建容灾演练或应急切换以实现容灾的日常演练或故障发生后的应急响应。 容灾切换 容灾切换包括容灾演练和应急切换。容灾演练旨在确保灾难发生后能够快速恢复业务而进行的一系列的演练任务。应急切换用于灾难发生后为了快速恢复业务而进行的一系列切换或恢复任务,涉及的演练任务来源于相应的预案流程。 同步/纳管资源 在多活容灾服务平台使用资源之前,用户需通过资源管理模块对当前资源进行同步操作,以便MDR侧能够实现统一管理。
        来自:
        帮助文档
        多活容灾服务
        快速入门
        入门实践
      • 入门简介
        本文带您快速入门多活容灾服务。 使用条件 1. 已经注册并开通天翼云账号。 2. 当前账号已开通多活容灾服务,拥有使用多活容灾服务的权限。 3. 已经完成实名认证。 使用流程 多活容灾服务使用流程如图所示。 1. 开通多活容灾服务。 2. 若生产中心为三方数据中心时,需新增三方数据中心。 3. 创建命名空间。在控制台命名空间页面创建命名空间,用户可以创建多个命名空间,用于逻辑隔离不同的资源。 4. 同步/纳管资源。在多活容灾服务平台使用相关资源之前,用户需通过资源管理模块对资源进行同步或新增操作,以便MDR侧能够实现资源的统一管理。 5. 创建容灾管理中心。用户可以根据业务需要使用一个或若干个容灾管理中心,容灾管理中心与命名空间为一对十绑定关系。 6. 接入应用(可选)。应用接入可帮助用户对容灾管理中心的云主机资源进行流量配比与健康检查监控,云主机资源健康情况可在监控大盘中查看。同时,可以帮助用户进一步将容灾管理中心的资源(如云主机、存储、数据库)按应用维度进行细粒度划分,提升资源管理便捷性。 7. 预案编排。预案编排涵盖预案阶段和预案管理两方面。预案阶段模块中,帮助用户以任务为单位进行串行或并行编排成预案阶段。预案管理模块中,用户可根据多个预案阶段互相衔接组成整体预案流程,预案流程为后续灾备演练和应急切换提供整体流程方案。 8. 容灾演练。容灾演练旨在确保灾难发生后能够快速恢复业务而进行的一系列的演练任务,涉及的演练任务来源于相应的预案流程,演练时演练任务为实战演练。 9. 应急切换。应急切换用于灾难发生后为了快速恢复业务而进行的一系列切换或恢复任务,涉及的演练任务来源于相应的预案流程。故障切换场景下可根据预设的切换预案流程拉起依次数据库、存储、灾备云主机等相关服务;故障回切场景下可根据预设的回切预案流程执行数据库、存储、容灾云主机的回切操作,以确保业务正常运行。
        来自:
        帮助文档
        多活容灾服务
        快速入门
        入门简介
      • Fluid概述
        本节介绍Fluid功能和概念。 Fluid概述 Fluid是一个开源的云原生的分布式数据集编排和加速引擎,为AI和大数据云原生应用提供服务。 它旨在通过透明的数据管理和优化调度,帮助AI和大数据应用高效利用任何存储的数据,而无需修改现有应用。Fluid支持自动化的数据调度、缓存加速和弹性扩展,提升数据访问效率,确保在大规模分布式环境中实现高效的存储和计算协同。 Fluid功能 作为一款开源的云原生基础架构,Fluid为AI与大数据云原生应用提供一层高效便捷的数据抽象,将数据从存储抽象出来,以便实现以下功能: 数据集抽象原生支持:将数据密集型应用所需基础支撑能力功能化,实现数据高效访问并降低多维管理成本。 可扩展的数据引擎插件:提供统一的访问接口,方便接入第三方存储,通过不同的Runtime实现数据操作。 数据弹性和调度:将数据缓存技术和弹性扩缩容 、数据亲和性调度能力相结合,提高数据访问性能。 应用编排:结合Kubernetes调度器,将计算任务优先调度至已缓存数据的节点,减少网络传输开销,提升计算效率。 Fluid基础概念 Dataset:数据集,抽象成逻辑上相关的一组数据的集合,被运算引擎使用。它允许用户定义数据集的位置、格式、版本、数据访问权限等信息。Dataset可以与不同的存储引擎(如Alluxio、JuiceFS等)结合使用,确保数据的统一管理和高效访问。 Dataset Operation:对Dataset执行的数据操作任务,例如数据预热、数据迁移、数据缓存清理等。这些操作通过Fluid的CRD进行定义和管理,帮助用户优化数据访问性能或维护数据生命周期。 Runtime:实现数据集安全性、版本管理和数据加速等能力的执行引擎,定义了一系列生命周期的接口。可以通过实现这些接口,支持数据集的管理和加速。 AlluxioRuntime:作为 Cache Engine Pods 的一种实现,基于开源数据编排框架 Alluxio构建,用于在 Kubernetes 集群中提供高性能的数据缓存与访问加速能力,支持PVC、Hostpath、ZOS加速。
        来自:
        帮助文档
        智算套件
        用户指南
        数据集管理
        数据集加速
        Fluid概述
      • 集群概述
        本节主要介绍集群概述。 随着应用程序开发向基于容器的方向发展,编排和管理资源的需求变得越来越重要。Kubernetes是一个开源的、功能强大的容器编排系统,用于管理容器化应用和服务,它提供了应用部署、规划、更新、维护的一种机制,让部署容器化的应用更加简单并且高效。 云容器引擎(Cloud Container Engine,以下简称CCE)是一种托管的Kubernetes服务,可进一步简化基于容器的应用程序部署和管理,您可以在CCE中方便的创建Kubernetes集群、部署您的容器化应用,以及方便的管理和维护。 集群优势 传统的应用部署方式是通过插件或脚本来安装应用。这样做的缺点是应用的运行、配置、管理、所有生存周期将与当前操作系统绑定,这样做并不利于应用的升级更新/回滚等操作,当然也可以通过创建虚拟机的方式来实现某些功能,但是虚拟机非常重,并不利于可移植性。 新的方式是通过部署容器方式实现,每个容器之间互相隔离,每个容器有自己的文件系统,容器之间进程不会相互影响,能区分计算资源。相对于虚拟机,容器能快速部署,由于容器与底层设施、机器文件系统解耦的,所以它能在不同云、不同版本操作系统间进行迁移。 容器占用资源少、部署快,每个应用可以被打包成一个容器镜像,每个应用与容器间成一对一关系也使容器有更大优势,使用容器可以在build或release的阶段,为应用创建容器镜像,因为每个应用不需要与其余的应用堆栈组合,也不依赖于生产环境基础结构,这使得从研发到测试、生产能提供一致环境。类似地,容器比虚拟机轻量、更“透明”,这更便于监控和管理。 集群(Cluster)是容器运行所需云资源的集合,包含了若干云服务器节点(物理服务器或者虚拟机)、负载均衡、虚拟私有云等云资源,您可以在集群中运行您的应用程序。在CCE中,我们可以创建若干集群,每个集群可以创建多个容器,每个容器里面运行一个应用实例,然后通过内置的负载均衡策略,实现对这一组应用实例的管理、发现、访问,而这些细节都不需要运维人员去进行复杂的手工配置和处理。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        集群管理
        集群概述
      • 名词解释(1)
        本章节介绍故障演练服务的基本名词概念,以帮助您更好地理解和使用本产品。 故障演练服务术语 名词 说明 环境 用于隔离不同应用的逻辑单元。 应用 一组资源的逻辑集合,通常代表一个业务系统。应用是进行演练和管理的核心对象。 资源 构成应用的组件节点,例如云主机、容器、分布式缓存服务Redis版、分布式消息服务Kafka等实例。 演练 通过向应用的特定资源注入指定故障,并观察其影响,从而验证系统稳定性与韧性的过程。 动作 注入到目标资源上的一个原子性故障,例如“CPU高负载”或“网络延迟”。用户可以在一次演练中对多个动作进行自由组合和编排。 动作组 一个或多个动作的逻辑分组,通常代表一个完整的故障场景。在一个演练任务中,不同的动作组之间可以并行执行。 探针 安装在目标资源(如云主机)上,用于执行具体故障注入动作的代理程序(Agent)。 保护策略 一种自动化的安全机制,用于控制演练的“爆炸半径”。当触发预设条件时,系统会依据此策略自动中止演练并回滚故障。
        来自:
      • 名词解释
        名词 说明 环境 用于隔离不同应用的逻辑单元。 应用 一组资源的逻辑集合,通常代表一个业务系统。应用是进行演练和管理的核心对象。 资源 构成应用的组件节点,例如云主机、容器、分布式缓存服务Redis版、分布式消息服务Kafka等实例。 演练 通过向应用的特定资源注入指定故障,并观察其影响,从而验证系统稳定性与韧性的过程。 动作 注入到目标资源上的一个原子性故障,例如“CPU高负载”或“网络延迟”。用户可以在一次演练中对多个动作进行自由组合和编排。 动作组 一个或多个动作的逻辑分组,通常代表一个完整的故障场景。在一个演练任务中,不同的动作组之间可以并行执行。 探针 安装在目标资源(如云主机)上,用于执行具体故障注入动作的代理程序(Agent)。 保护策略 一种自动化的安全机制,用于控制演练的“爆炸半径”。当触发预设条件时,系统会依据此策略自动中止演练并回滚故障。
        来自:
        帮助文档
        应用高可用
        产品简介
        故障演练服务
        名词解释
      • 基础概念类
        资源编排ROS和 Terraform 有什么关系? 资源编排ROS基于 Terraform 引擎进行封装,用户可以通过控制台或 API 使用 Terraform 语法(HCL)来描述云上资源。服务负责资源创建、更新、销毁的生命周期管理,无需用户本地安装 Terraform。 资源编排如何收费 资源编排ROS本身不收取服务费。但是,通过本服务创建和管理的一切天翼云资源(如ECS、EIP、CCSE、Mysql等),都会按照各自产品的标准计费规则进行收费。 服务支持的 Terraform 版本是多少? 当前支持的Terraform版本号是1.5.7 使用资源编排ROS需要哪些权限? 用户需具备对应云资源的创建、查询、删除权限,以及对资源编排ROS本身的访问权限(例如:模板管理、资源栈管理)。 Terraform Provider 的 AK/SK 是如何管理的? 对于AK/SK:控制台会自动使用您当前登录的账号权限,生成委托ak/sk, 以您的权限进行资源的开通,无需在模板中指定。 我的Terraform状态文件存储在哪里? 状态文件由资源编排ROS后端统一托管。您无需关心其存储位置和备份问题。这种机制保证了状态文件的安全性和多用户协作时的一致性。 如何将天翼云上已经存在的资源纳入到资源栈中进行管理? 当前版本暂时不支持,我们正在抓紧迭代中。
        来自:
        帮助文档
        资源编排ROS
        常见问题
        基础概念类
      • 产品定义
        容灾解决的问题 传统的灾备容灾在实际落地中会面临一些问题: 如果选择成本优先策略,灾备中心日常只保留必要的冗余数据,灾难接管时再逐步恢复数据实例和业务系统,操作成本高,恢复时间无法预期,无法保障RTO; 如果选择效率优先策略,灾备中心日常保持完整的业务应用复刻,由于灾备中心平时不提供服务,整个灾备资源处于闲置状态,成本浪费比较严重; 因为灾备中心平时不提供服务,关键时刻不能保证灾备中心能否正确接管业务,灾难真正发生时不一定敢切。 应用容灾多活 是应用高可用服务下的多活容灾解决方案,在架构上比灾备容灾更具优势,能突破单地域资源瓶颈,拥有更高的资源利用率和系统扩展性,具备如下产品优势: 一站接入管控:应用分层管理,接入层、服务层、数据层等统一纳管调度; 快速恢复预期:确定的流程编排,一键容灾切换,分钟级业务恢复能力; 高效运维监控:组件协同管理,全链路监控告警,容灾运维简单高效。
        来自:
        帮助文档
        应用高可用
        产品简介
        应用容灾多活
        产品定义
      • 产品优势
        本章主要介绍产品优势 一站式软件开发生产线 软件开发全流程覆盖:支持需求管理、代码托管、流水线、代码检查、编译构建、部署、测试计划、制品仓库等全生命周期软件开发服务。 开箱即用,云上开发,全流程规范可视,高效异地协作。 研发安全BuiltIn 在应用设计、开发、测试、运行等全流程提供安全规范及防护能力,支撑应用研发供应链安全有效落地。 提供针对于代码质量安全、Web漏洞、主机漏洞、开源漏洞及合规、移动应用安全等多种安全合规检查能力。 高质高效敏捷交付 支持代码检查、构建、测试、部署任务自定义和全面自动化并提供可视化编排的持续交付流水线,一键应用部署,上线发布零等待。 需求管理、代码检查、测试计划、流水线门禁等内置经验规范,有效提升应用研发质量,问题早发现。
        来自:
        帮助文档
        软件开发生产线CodeArts
        产品介绍
        产品优势
      • 产品服务协议
        视频 天翼云媒体存储系统服务协议 企业中间件 天翼云分布式消息服务协议 软件开发生产线CodeArts服务协议 容器与微服务 天翼云云容器引擎服务协议 天翼云容器实例产品服务协议 天翼云Serverless容器服务产品服务协议 容器镜像产品服务协议 天翼云微服务云应用平台服务协议 微服务引擎产品服务协议 天翼云应用编排服务协议 天翼云应用服务网格服务协议 天翼云EasyCoding敏捷开发平台服务协议 天翼云翼飞低代码平台服务协议 天翼云应用性能监控APM服务协议 天翼云容器安全卫士服务协议 天翼云函数计算服务协议
        来自:
        帮助文档
        法律声明
        产品协议
        产品服务协议
      • 什么是云工作流(CloudFlow)
        功能特性 流程编排能力 云工作流可以帮助用户将流程逻辑和任务执行分开,节省编写流程编排相关的代码的时间。例如视频转码场景,用户可以基于云工作流构建出Serverless方案,降低运维成本和编排成本。同时提供了可视化编排工具,可以方便用户快速编排出符合业务处理流程的工作流。 内置错误处理 通过内置错误重试和捕获能力,用户可以自动重试失败或超时的任务,对不同类型错误做出不同响应,并定义回退逻辑。 执行可视化 云工作流提供可视化界面来定义工作流和查看执行状态。状态包括输入和输出等。方便用户快速识别故障位置,并快速排除故障问题。 支持长时间运行流程 除了可支持低延迟的工作流任务, 云工作流也可支持长时间运行流程,例如审批流程场景的应用 流程状态管理 云工作流会管理流程执行中的所有状态,包括跟踪它所处的执行步骤,以及存储在步骤之间的数据传递。用户无需自己管理流程状态,也不必将复杂的状态管理构建到具体任务中。
        来自:
        帮助文档
        函数计算
        用户指南
        云工作流
        功能简介
        什么是云工作流(CloudFlow)
      • RCC停止服务(1)
        本章节介绍注册配置中心服务不可用故障演练。 背景介绍 注册配置中心(RCC)是分布式系统核心基础设施,负责服务注册、配置管理与服务发现,为分布式应用提供统一配置分发及服务治理能力。节点宕机、进程异常等多种因素易导致RCC集群不可用,进而引发应用注册失败、服务调用中断甚至集群业务瘫痪。本演练可验证系统对注册配置中心的应急与恢复能力,优化故障处理流程,提升分布式系统稳定性。 基本原理 通过调用RCC停止集群OpenAPI,模拟RCC集群服务故障。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择注册配置中心,然后单击添加资源。 3. 在弹出的对话框中,勾选目标注册配置中心实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择注册配置中心。 添加实例 :单击添加实例 ,勾选上一步中添加的注册配置中心实例。 添加故障动作 :单击立即添加 ,在列表中选择停止服务动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。
        来自:
      • RCC停止服务
        本章节介绍注册配置中心服务不可用故障演练。 背景介绍 注册配置中心(RCC)是分布式系统核心基础设施,负责服务注册、配置管理与服务发现,为分布式应用提供统一配置分发及服务治理能力。节点宕机、进程异常等多种因素易导致RCC集群不可用,进而引发应用注册失败、服务调用中断甚至集群业务瘫痪。本演练可验证系统对注册配置中心的应急与恢复能力,优化故障处理流程,提升分布式系统稳定性。 基本原理 通过调用RCC停止集群OpenAPI,模拟RCC集群服务故障。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择注册配置中心,然后单击添加资源。 3. 在弹出的对话框中,勾选目标注册配置中心实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择注册配置中心。 添加实例 :单击添加实例 ,勾选上一步中添加的注册配置中心实例。 添加故障动作 :单击立即添加 ,在列表中选择停止服务动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        中间件
        注册配置中心RCC
        RCC停止服务
      • 产品定义
        本文介绍公共算力服务的产品定义。 公共算力服务是统一资源调度平台,提供多维度的核心调度能力,支持多方算力,包括裸算力统一接入,实现跨服务商、跨地域、跨架构的统一管理、统一调度,为业务匹配最优算网资源。 产品架构 平台架构分为算网基础设施、算网编排管理和算网运营服务三个层次: 算网基础设施 算网基础设施包括算力基础设施和网络基础设施,算力包括泛在算力,第三方算力等。具备算力并网接入和协同管理能力。 算网编排管理层 算网编排管理层是算网调度的关键,具备统一编排和跨域调度能力,包括算力标识度量、算网感知、算网调度,业务调度等多项技术。 算网运营服务层 运营服务层是面向场景化的算力交易的入口,面向业务高质量服务需求的计算、存储、网络等资源实现一体化供给。
        来自:
        帮助文档
        公共算力服务
        产品介绍
        产品定义
      • 功能特性
        本节主要介绍功能特性 堆栈管理 堆栈是应用程序、云服务资源的集合。堆栈将应用、云服务作为一个整体来进行创建、升级、删除等。 在AOS中,通过创建堆栈可以把应用程序一键式部署到天翼云上,并有序的管理所依赖的云服务资源。 模板管理 AOS模板是一个YAML或JSON格式的文本描述文件,用于描述您想要的云对象(云对象包括应用、资源、服务等所有云上的对象)。AOS服务根据描述文件帮助您完成各种云对象的创建。 任何一种自动化的过程,都需要一种描述语言来控制其执行流程。 例如,shell脚本(文本文件)描述如何自动执行command命令,AOS模板也一样,用来描述各种云对象的创建、销毁等流程。以Shell脚本为例,其执行逻辑如下: Shell脚本特点大致为: •脚本是一个文本文件。 •若脚本写的好,可以重复执行。 AOS模板也是一样的逻辑,AOS服务就是模板的解释器,根据模板要求,执行对应动作。您可以把AOS看作是云上自动化标准。 一个良好定义输入、编排和输出的模板就会更加的通用。使用这个模板,就可以方便的进行传递和分享。
        来自:
        帮助文档
        应用编排服务
        产品简介
        功能特性
      • 产品类
        本章节主要介绍故障演练服务产品类问题。 故障演练服务解决什么问题? 故障演练服务是云原生混沌工程平台,深度融合云原生应用产品体系,提供标准化引导、正确性约束和自动化运行的实验管理,支持大规模、低成本、影响可控、形式多样的应用故障演练,帮助企业增强应用系统的容错能力和恢复能力,提升客户应用云上运行的稳定性。 产品能力: 标准化流程管理:固化演练流程,提供组织、人员、应用、资源等多维度的数据与权限管理规范。 丰富的故障场景:实现涵盖应用不同分层的原子故障注入能力,并提供具备业务含义的故障场景组合。 完备的演练防护:实现隔离与熔断双重演练防护,包括权限隔离、环境隔离和范围隔离,以及主动熔断、指标熔断和超时熔断等多种保护机制。 一站式接入管理:深度整合现有应用体系,自动导入组织权限、应用架构和关联资源,实现一站式可编排、可控制、可观测。 解决痛点: 技术要求高:异构的故障源,从基础设施到操作系统,从容器环境到应用进程,以及依赖的中间件,都需要理解其原理才能模拟故障。 实施难度大:跨团队、长流程、多权限,故障演练不仅是技术问题,更涉及组织流程与制度,需要建立相应规范。 影响不可控:故障是已知的,影响是未知的。如何感知并最小化“爆炸半径”,既要有处置预案,又要有工具支持。
        来自:
        帮助文档
        应用高可用
        常见问题
        故障演练服务
        产品类
      • 同城容灾(双活模式)最佳实践
        步骤四:接入云内应用 1. 在【应用管理】页面,单击【应用接入】。 2. 在【应用接入>基础配置】页面,选择已创建的容灾管理中心,选择分区云主机资源,配置各个分区业务流量配比,输入应用名称,配置应用端口号,健康检查策略等信息,点击【下一步:数据库配置】。 3. 在【应用接入>数据库配置】页面,选择已创建的数据库类型和实例,点击【下一步:存储配置】。 4. 在【应用接入>存储配置】页面,选择存储类型和对应的内外网域名,点击【下一步:确认配置】。 5. 在【应用接入>确认配置】页面,确认应用接入的基础配置、流量配比、数据库配置、存储配置等信息,如有错误可点击对应“”按钮跳转修改。 6. 配置完成后检查无误后,单击【确认】完成天翼云云内资源的接入,返回应用管理页面,列表展示出对应已接入应用实例信息。 步骤五:预案编排 1. 在【预案编排>预案阶段】页面,选择已创建好的命名空间后,单击【创建预案阶段】。 2. 填写预案阶段名称、描述后,单击【确定】,完成预案阶段创建。 3. 预案阶段列表页中单击预案阶段名称对应的【预案阶段设计】。 4. 通过拖拽开始节点、普通任务、条件任务、结束节点绘制预案阶段流程。 5. 单击预案阶段设计页面的【保存】按钮,完成预案阶段设计。 6. 预案阶段列表页中单击预案阶段名称对应的【启用】按钮。 7. 在【预案编排>预案管理】页面,选择已创建好的命名空间后,单击【创建预案】。 8. 填写预案名称、描述后,单击【确定】,完成预案创建。 9. 预案列表页中单击预案名称对应的【预案设计】。 10. 通过拖拽开始节点、普通任务、条件任务、结束节点绘制预案流程。 11. 单击预案设计页面的【保存】按钮,完成预案设计。 12. 预案列表页中单击预案名称对应的【启用】按钮。
        来自:
        帮助文档
        多活容灾服务
        最佳实践
        同城容灾(双活模式)最佳实践
      • Harbor服务不可用
        本章节介绍容器镜像Harbor服务不可用故障演练。 背景介绍 容器镜像服务是云原生环境中镜像存储与分发的核心,负责业务Pod部署所需镜像的拉取、推送及版本管理。Harbor服务不可用(如进程异常、网络中断、存储故障等导致)会阻碍集群Pod创建与重建,引发业务部署失败、扩容失效等问题。本演练可验证系统对该故障的应急响应与业务恢复能力,优化处理流程,提升集群可靠性。 基本原理 通过调用容器镜像服务OpenAPI,停止Harbor服务,模拟容器镜像仓库不可用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择容器镜像服务,然后单击添加资源。 3. 在弹出的对话框中,勾选目标容器镜像服务实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择容器镜像服务。 添加实例 :单击添加实例 ,勾选上一步中添加的容器镜像服务实例。 添加故障动作 :单击立即添加 ,在列表中选择Harbor服务不可用动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        容器镜像服务
        Harbor服务不可用
      • Harbor服务不可用(1)
        本章节介绍容器镜像Harbor服务不可用故障演练。 背景介绍 容器镜像服务是云原生环境中镜像存储与分发的核心,负责业务Pod部署所需镜像的拉取、推送及版本管理。Harbor服务不可用(如进程异常、网络中断、存储故障等导致)会阻碍集群Pod创建与重建,引发业务部署失败、扩容失效等问题。本演练可验证系统对该故障的应急响应与业务恢复能力,优化处理流程,提升集群可靠性。 基本原理 通过调用容器镜像服务OpenAPI,停止Harbor服务,模拟容器镜像仓库不可用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择容器镜像服务,然后单击添加资源。 3. 在弹出的对话框中,勾选目标容器镜像服务实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择容器镜像服务。 添加实例 :单击添加实例 ,勾选上一步中添加的容器镜像服务实例。 添加故障动作 :单击立即添加 ,在列表中选择Harbor服务不可用动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。
        来自:
      • 监控概览
        应用提供服务 因用户访问该应用而产生的数据,例如用户在浏览器中访问该应用。 应用提供服务请求量:筛选时间段内,用户向该应用发起的请求数量。 应用提供服务平均响应时间:响应时间是指从用户发起请求到服务端给予反馈的时长,平均响应时间是筛选时间段内,所有请求的响应时间的平均值。 应用依赖服务 因该应用访问其他服务而产生的数据,例如该应用访问数据库。 应用依赖服务请求量:筛选时间段内,该应用向其他服务发起的请求数量。 应用依赖服务平均响应时间:响应时间是指从该应用发起请求到其他服务给予反馈的时长,平均响应时间是筛选时间段内,所有请求的响应时间的平均值。 应用实例数:筛选时间段内,有调用行为的应用实例数量。 HTTP状态码统计。 5xx:服务器异常,服务器在处理请求的过程中发生错误。 4xx:客户端异常,请求包含语法错误或无法完成请求。 3xx:重定向问题,需要进一步操作。 2xx:成功,服务器成功接收请求并执行。 200:请求成功。 慢调用 该应用访问其他服务时,其他服务响应时间大于等于500ms(默认500ms,可在URL采集设置中修改阈值)的调用,定义为慢调用。显示饼图和详情表,表头显示如下。 时间:判定为慢调用的时间点。 服务名:被调用的服务名称。 IP:被调用的服务的IP地址。 耗时(ms):具体响应时间。 响应码:200表示请求成功,03表示调用时长超过最大监听时长15秒。 TraceID:Trace表示一个完整的请求链路,一个Trace包含了多个调用过程span,TraceID是该请求链路的唯一标识。
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        应用列表
        监控概览
      • 流式文件处理
        本章节主要介绍如何使用函数流实现流式大文件处理。 背景与价值 Serverless Workflow由于自身可编排、有状态、持久化、可视化监控、异常处理、云服务集成等特性,适用于很多应用场景,比如: 复杂度高需要抽象的业务(订单管理,CRM 等) 业务需要自动中断 / 恢复能力,如多个任务之间需要人工干预的场景(人工审批,部署流水线等) 业务需要手动中断 / 恢复(数据备份 / 恢复等) 需要详细监控任务执行状态的场景 流式处理(日志分析,图片 / 视频处理等)当前大部分 Serverless Workflow 平台更多关注控制流程的编排,忽视了工作流中数据流的编排和高效传输,上述场景创建函数流触发器中,由于数据流相对简单,所以各大平台支持都比较好,但是对于文件转码等存在超大数据流的场景,当前各大平台没有给出很好的解决方案。FunctionGraph函数工作流针对该场景,提出了 Serverless Streaming 的流式处理方案,支持毫秒级响应文件处理。 技术原理 FunctionGraph函数工作流提出 Serverless Streaming 的流式可编排的文件处理解决方案,步骤与步骤之间通过数据流驱动,更易于用户理解。本章通过图片处理的例子解释该方案的实现机制。 如果需要驱动一个工作流执行,工作流系统需要处理两个部分: 控制流:控制工作流的步骤间流转,以及步骤对应的 Serverless 函数的执行。确保步骤与步骤之间有序执行。 数据流:控制整个工作流的数据流转,通常来说上一个步骤的输出是下一个步骤的输入,比如上述图片处理工作流中,图片压缩的结果是打水印步骤的输入数据。 在普通的服务编排中,由于需要精准控制各个服务的执行顺序,所以控制流是工作流的核心部分。然而在文件处理等流式处理场景中,对控制流的要求并不高,以上述图片处理场景举例,可以对大图片进行分块处理,图片压缩和加水印的任务不需要严格的先后顺序,图片压缩处理完一个分块可以直接流转到下一个步骤,而不需要等待图片压缩把所有分块处理完再开始加水印的任务。 基于上述理解,FunctionGraph工作流的 Serverless Streaming 方案架构设计如下图所示: 在 Serverless Streaming 的流程中,弱化控制流中步骤之间的先后执行顺序,允许异步同时执行,步骤与步骤之间的交互通过数据流驱动。其中数据流的控制通过 Stream Bridge 组件来实现。同时函数 SDK 增加流式数据返回接口,用户不需要将整个文件内容返回,而是通过 gRPC Stream 的方式将数据写入到 Stream Bridge,Stream Bridge 用来分发数据流到下一个步骤的函数 Pod 中。
        来自:
        帮助文档
        函数工作流
        用户指南
        函数流管理
        流式文件处理
      • 应用托管
        应用托管是一站式应用服务平台,免运维底层资源,提供“资源平台服务模型组件MCP”等一体化AI应用配套,覆盖应用构建、部署,交付和全生命周期管理,构建了AI应用支撑体系。
        来自:
        帮助文档
        应用托管
      • Redis节点故障(1)
        本章节介绍Redis节点故障演练。 背景介绍 Redis 高可用依赖主备同步与故障切换。主/备节点进程因缺陷、配置或误操作停止时,可能触发切换或影响应用:主节点停触发主备切换,备节点停影响读能力和冗余。本演练模拟核心进程停止,验证高可用切换和客户端故障转移,帮助您评估业务影响。 基本原理 通过调用Redis停止Redis服务OpenAPI,模拟Redis节点故障,故障会触发Redis HA机制进行自动恢复。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择Redis节点停止动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 故障节点 :注入故障的目标节点(主节点或备节点)。
        来自:
      • Kafka Broker节点主机宕机(1)
        本章节介绍Kafka Broker节点主机宕机故障演练。 背景介绍 高性能高可靠的分布式消息服务 Kafka 在复杂分布式环境中仍可能因 Broker 节点宕机引发数据丢失、集群可用性下降、请求延迟升高、副本同步滞后等严重问题,本演练可测试业务系统应对此类核心组件故障的响应能力、高可用切换机制及数据一致性保障效果。 基本原理 指定或随机一个Broker节点进行关机。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式消息服务Kafka,然后单击添加资源。 3. 在弹出的对话框中,勾选目标分布式消息服务Kafka实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式消息服务Kafka。 添加实例 :单击添加实例 ,勾选上一步中添加的分布式消息服务Kafka实例。 添加故障动作 :单击立即添加 ,在列表中选择Broker宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:可选择随机一个节点或者特定的节点。
        来自:
      • Proxy节点故障
        本章节介绍Redis的Proxy节点故障演练。 背景介绍 在分布式缓存 Redis Proxy 集群中,Proxy 负责路由转发和故障转移,保障高可用并简化客户端逻辑。本演练通过模拟 Proxy 节点故障,验证客户端的重连与多 Proxy 负载均衡机制,帮助您评估单点故障对业务的影响。 基本原理 通过调用Redis停止Proxy服务OpenAPI,模拟Proxy节点不可用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择Proxy节点故障动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:注入故障的目标节点。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        数据库
        分布式缓存服务Redis版
        Proxy节点故障
      • Redis主从切换(1)
        本章节介绍Redis主从切换故障演练。 背景介绍 Redis 高可用性依赖自动主备切换机制。当主节点故障时,备节点会被提升为新主节点,以保障服务连续性,但切换期间可能出现短暂中断或只读窗口。本演练通过主动触发可控主备切换,帮助您验证客户端故障转移与自动重连能力以及评估切换对业务的瞬时影响。 基本原理 通过调用Redis主从切换OpenAPI,触发Redis集群实例进行主从切换。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择主从切换动作。 4. 单击确定完成动作添加,此故障动作无需配置额外参数。
        来自:
      • Proxy节点故障(1)
        本章节介绍Redis的Proxy节点故障演练。 背景介绍 在分布式缓存 Redis Proxy 集群中,Proxy 负责路由转发和故障转移,保障高可用并简化客户端逻辑。本演练通过模拟 Proxy 节点故障,验证客户端的重连与多 Proxy 负载均衡机制,帮助您评估单点故障对业务的影响。 基本原理 通过调用Redis停止Proxy服务OpenAPI,模拟Proxy节点不可用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择Proxy节点故障动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:注入故障的目标节点。
        来自:
      • Redis节点故障
        本章节介绍Redis节点故障演练。 背景介绍 Redis 高可用依赖主备同步与故障切换。主/备节点进程因缺陷、配置或误操作停止时,可能触发切换或影响应用:主节点停触发主备切换,备节点停影响读能力和冗余。本演练模拟核心进程停止,验证高可用切换和客户端故障转移,帮助您评估业务影响。 基本原理 通过调用Redis停止Redis服务OpenAPI,模拟Redis节点故障,故障会触发Redis HA机制进行自动恢复。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择Redis节点停止动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 故障节点 :注入故障的目标节点(主节点或备节点)。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        数据库
        分布式缓存服务Redis版
        Redis节点故障
      • Redis节点主机宕机
        本章节介绍Redis节点主机宕机故障演练。 背景介绍 Redis 高可用性依赖主备切换机制,以应对主节点突发故障。当承载主节点的物理机或虚拟机宕机(如硬件故障、电源中断)时,服务能否快速恢复取决于备用节点能否迅速升级为新主节点。本演练模拟主机宕机场景,检验 Redis 实例的自动高可用切换能力,并验证客户端应用在灾难情况下的韧性。 基本原理 通过关闭节点主机,模拟节点宕机。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择主机宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        数据库
        分布式缓存服务Redis版
        Redis节点主机宕机
      • Redis节点主机宕机(1)
        本章节介绍Redis节点主机宕机故障演练。 背景介绍 Redis 高可用性依赖主备切换机制,以应对主节点突发故障。当承载主节点的物理机或虚拟机宕机(如硬件故障、电源中断)时,服务能否快速恢复取决于备用节点能否迅速升级为新主节点。本演练模拟主机宕机场景,检验 Redis 实例的自动高可用切换能力,并验证客户端应用在灾难情况下的韧性。 基本原理 通过关闭节点主机,模拟节点宕机。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择主机宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。
        来自:
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • ...
      • 532
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      镜像服务 IMS

      轻量型云主机

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      AI Store

      公共算力服务

      模型推理服务

      推荐文档

      android端

      环境准备

      文档下载

      接入机集群管理

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号