活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      应用编排服务_相关内容
      • 产品咨询类
        本节介绍云安全中心产品咨询类问题。 云安全中心是否只是对其他云安全产品日志进行采集分析? 云安全中心产品除了采集其他安全产品的日志进行统一管理外,还提供编排响应以及处置的能力,能够对告警形成自己的处置流程,并进行自动化处置。云安全中心打通了云上的各类安全产品形成联动响应处置,帮助用户提升威胁响应处置效率。 云安全中心如何帮助客户满足等保合规要求? 云安全中心提供的插件管理、威胁运营、编排响应等功能,可以满足等保的“边界防护”、“访问控制”、“入侵防范”、“恶意代码和垃圾邮件防范”、“安全审计”、“恶意代码防范”、“集中管控”等要求。具体可参见等级保护测评解读。 云安全中心支持采集云上哪些安全日志? 云安全中心目前支持采集云上安全产品的安全告警日志,包括Web应用防火墙(原生版)、服务器安全卫士(原生版)、云等保专区、数据库审计、云堡垒机(原生版)企业版等产品。具体的日志类型请参见支持的日志类型。 短信使用余量是否会进行提醒? 云安全中心会在短信剩余500条时、以及短信全部使用完时,提醒用户短信剩余量。
        来自:
        帮助文档
        云安全中心
        常见问题
        产品咨询类
      • 云容器ETCD集群节点故障
        本章节介绍云容器ETCD节点宕机故障演练。 背景介绍 云容器引擎(CCE)中,Etcd 节点是集群的分布式数据存储核心。硬件故障、系统内核异常、软件组件崩溃、网络中断及数据同步异常等因素,均可能导致 Etcd 节点故障。Etcd 节点故障会造成集群配置读写失败、状态同步异常,进而导致 Master 节点管控功能受限,Pod 调度、扩缩容等操作失效,影响上层业务稳定性,本演练可测试系统应对 Etcd 节点故障的恢复能力。 基本原理 通过停止Etcd 节点上的服务,模拟Etcd 节点故障。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择Etcd节点故障动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:故障动作的目标节点。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器ETCD集群节点故障
      • 批量创建云主机
        操作说明 本方案基于 天翼云 ROS(资源编排服务)控制台,实现云主机批量快速创建与销毁,有效提升资源交付效率,降低人工运维成本。 方案内置两类标准化编排模板,分别支持同配置批量创建 与多规格差异化创建两种场景,用户可根据业务规模与实例需求灵活选用,快速完成批量资源部署。 适用场景 云主机批量快速搭建 多环境标准化批量部署 临时业务资源快速创建与释放 操作步骤 1. 登录控制中心。 2. 在控制台首页搜索“资源编排ROS”,或在左侧产品导航栏选择“管理工具 > 资源编排ROS”,进入资源编排控制台。 3. 在左侧导航栏选择 模板管理。 4. 在模板管理页面,单击创建模板, 可参考创建模板完成模板配置。 5. 模板默认基于华东1资源池, 可以根据需要可以进行调整。 模板1:创建多台相同配置云主机,模板使用count语法实现 java terraform { requiredproviders { ctyun { source "ctyunit/ctyun" version "2.1.0" } } } provider "ctyun" { azname var.azname } variable "azname" { type string default "cnhuadong1jsnj1Apublicctcloud" description "可用区名称" } variable "instancename" { type string default "testecs" description "云主机名称" } variable "instancecount" { type number default 4 description "云主机数量" } variable "imageid" { type string default "f9415853b07d4dd8afb7f48e10de151e" description "镜像ID" } variable "flavorname" { type string default "c7.xlarge.2" description "规格名称" } variable "systemdisktype" { type string default "SAS" description "系统盘类型" } variable "systemdisksize" { type number default 40 description "系统盘大小" } variable "password" { type string sensitive true description "密码" } variable "bandwidth" { type number default 10 description "公网带宽" }
        来自:
        帮助文档
        资源编排ROS
        最佳实践
        批量创建云主机
      • 配置说明
        应用设置可以让您对具体某个应用进行单独管理,包括agent开关、阈值、调用链采样率等等。 功能入口 1. 选择目标资源池,并登录APM组件控制台。 2. 在左侧导航栏中选择「应用监控 」「应用列表」。 3. 在应用列表中选择您想查看的应用,点击「应用名称」打开新的应用详情链接。 4. 在左侧导航栏中选择「应用设置」,您可以在应用设置中修改各项可配置信息。 设置项 设置项 说明 Agent开关设置 用于控制Agent总开关和插件开关,由此控制是否监控该应用,以及对哪些指标集进行监控 调用链采集设置 用于控制是否采集调用链,采样率是多少,限流阈值是多少 Java方法设置 用于设置Java拦截方法 Kafka设置(即将上线) 用于设置Kafka消费类 URL采集设置 用于设置URL采集。包括URL拦截、黑名单、慢请求响应阈值设置、code定义 SQL设置 用于设置慢SQL查询阈值 日志开启设置 用于设置是否关联日志。在已购买云日志服务的情况下,开启关联日志可以查看trace的日志详情 设置操作 默认编辑状态,所有修改要点击【保存】按钮后生效。
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        应用列表
        应用设置
        配置说明
      • 什么是多活容灾服务
        本文为您介绍多活容灾服务的定义。 定义 天翼云多活容灾服务(Multiactive Disaster Recovery Service Platform)衍生于用户对数据、应用和业务的多活、高可用需求。通过预案编排、资源同步、智能调度、故障切换等能力组合确保故障场景下用户业务的连续性,实现业务恢复与故障恢复的相互解耦,满足用户对容灾能力的建设要求。产品通过纳管在不同地理位置的云上云下资源,实现数据的分布式存储和处理,从而提高系统的容错能力和抗灾能力,其主要目的是在生产故障发生时,能够迅速地恢复业务运行,减少停机时间和数据丢失,满足用户对RTO和RPO的要求。 特性 产品形态:目前支持3种产品形态,同城多活、同城主备、异地主备。 统一入口:作为云上的统一入口,可基于IaaS和PaaS云产品搭建多活容灾业务系统。 资源隔离:通过命名空间和容灾管理中心实现业务隔离、故障隔离。 故障隔离:通过演练空间实现容灾演练故障隔离,演练过程不影响生产业务。 监控告警:提供网络、应用、云主机、数据库、存储等资源的容灾监控告警功能。 容灾切换:故障监控和容灾切换预案管理,提供不同灾难场景下的自动或手动切换和回切。 容灾演练:故障演练验证容灾架构的可靠性,满足容灾审计要求和验证系统RTO。
        来自:
        帮助文档
        多活容灾服务
        产品介绍
        什么是多活容灾服务
      • 云容器ETCD集群节点故障(1)
        本章节介绍云容器ETCD节点宕机故障演练。 背景介绍 云容器引擎(CCE)中,Etcd 节点是集群的分布式数据存储核心。硬件故障、系统内核异常、软件组件崩溃、网络中断及数据同步异常等因素,均可能导致 Etcd 节点故障。Etcd 节点故障会造成集群配置读写失败、状态同步异常,进而导致 Master 节点管控功能受限,Pod 调度、扩缩容等操作失效,影响上层业务稳定性,本演练可测试系统应对 Etcd 节点故障的恢复能力。 基本原理 通过停止Etcd 节点上的服务,模拟Etcd 节点故障。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择Etcd节点故障动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:故障动作的目标节点。
        来自:
      • 云主机DNS篡改(1)
        本章节介绍云主机DNS篡改故障演练。 背景介绍 DNS 篡改是一种常见的攻击手段或配置错误,它会导致域名被错误地解析到非预期的IP地址,从而引发流量劫持、服务中断或数据泄露等风险。本演练通过模拟 DNS 篡改场景,帮助您检验系统的安全防护机制、验证监控告警的有效性,并评估业务在域名解析被劫持时的表现。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是通过修改本地DNS解析文件实现。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择DNS篡改动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 域名:待篡改的域名。 映射IP:将目标域名解析到该IP地址。
        来自:
      • 新增操作连接
        本节主要介绍如何新增操作连接。 含义:操作连接是安全编排流程中,每个插件节点需要使用到的连接域名和鉴权参数。 作用:用于在安全编排的流程执行过程中,每个插件节点运行时,传入需要连接的域名信息,以及在访问该域名时,需要使用到的用户鉴权信息,如用户名/密码、账号AK/SK等。 操作连接与插件的关系:每个插件在运行过程中,需要通过域名调用的方式访问其他云服务或者三方服务,调用过程中需要鉴权,因此,在插件的登录凭证参数中会定义需要的域名参数(Endpoint)和认证参数(用户名/密码、账号AK/SK等)。操作连接则是配置插件登录凭证的参数值,流程中每个插件节点绑定不同的操作连接,支持相同插件的不同节点访问不同的服务。 前提条件 已新增工作空间,具体操作请参见新增工作空间。 操作步骤 1. 登录管理控制台。 2. 单击页面左上方的,选择“安全 > 态势感知(专业版)”,进入态势感知(专业版)管理页面。 3. 在左侧导航栏选择“工作空间 > 空间管理”,并在工作空间列表中,单击目标工作空间名称,进入目标工作空间管理页面。 4. 在左侧导航栏选择“安全编排 > 剧本编排”,进入剧本管理页面后,选择“操作连接”页签,进入连接管理页面。 5. 在操作连接管理页面中,单击“新增”,右侧弹出新增操作连接面板。 6. 在新增操作连接面板中,配置连接参数,参数说明如下表所示。 参数名称 说明 连接名称 输入操作连接名称。名称规则如下: 可输入英文大写字母(A~Z)、英文小写字母(a~z)、数字(0~9)和特殊字符()。 长度不能超过64个字符。 插件 选择资产连接所需的插件。插件详细信息请参见查看插件详情。 描述 可选参数,输入资产描述,描述信息长度不能超过64个字符。 7. 单击“确认”,返回列表,即可查询已经创建的操作连接信息。
        来自:
      • 功能特性
        云工作流支持的功能如下(公测版): 功能集 功能 功能说明 参考文档 基本功能 流程(Flow) 云工作流基于CNCF ServerlessWorkflow Specification 0.8版本进行适配优化作为天翼云云工作流执行流程定义。执行流程时,云工作流执行引擎会根据流程定义解析并驱动执行相关状态流转。 一个流程通常包含若干状态(State),这些状态可以是简单的执行类状态,例如操作(Operation)、暂停(Sleep)、传递(Noop)和失败(Fail)等;也可以是复杂的流程控制类状态,例如条件分支(Switch)、并行(Parallel)和迭代(Foreach)。 流程定义介绍 创建流程 执行流程 基本功能 调度(Schedule) 云工作流调度(即触发器)是触发工作流执行的方式。在事件驱动的计算模型中,事件源是事件的生产者,工作流是事件的处理者。云工作流目前支持比较常见的触发器场景: 定时触发器、HTTP触发器、消息队列类型(Kafka、 RokectMQ)触发器, 云原生网关触发器 工作流调度简介 特性功能 标准(Standard)模式 云工作流支持创建标准(Standard)和快速(Express)两种模式的工作流。 标准(Standard)模式适用于传统意义上的离线业务流程编排执行场景,具备执行步骤状态的持久化存储,支持运行长时间的工作流执行状态流转。 快速工作流和标准工作流 特性功能 快速(Express)模式 云工作流支持创建标准(Standard)和快速(Express)两种模式的工作流。 快速(Express)模式适用于常见的在线业务流程编排和准实时业务流程编排场景,例如微服务API编排、流式数据处理等低延迟和大负载业务场景。 快速工作流和标准工作流 运维及可观测建设 工作流执行监控 工作流执行监控可对工作流的执行启动、执行成功、执行失败、执行超时以及执行过程中的状态转换和执行耗时等指标进行监控和展示。 监控指标 运维及可观测建设 审计事件 云工作流已接入审计服务,可以在云审计中查询用户操作云工作流产生的管控事件, 例如创建工作流、删除工作流以及执行工作流等。 审计事件 流程开发 工作流设计器 云工作流提供一个低代码、可视化的工作流设计器,包含cloudflow studio、 yaml以及工作流设置等功能区。可以基于cloudflow studio进行工作流可视化编排以及相关属性设置, 降低用户对流程定义语言的学习成本。 工作流设计器 集成建设 云服务优化集成 云工作流支持与天翼云多个云服务集成,允许在流程中调用这些云服务的API进行相关资源的操作,完成业务流程构建。 云工作流与云服务的集成类型包括普通集成和优化集成。普通集成是指允许云工作流直接调用云产品的OpenAPI服务接口,不对这些服务接口做任何包装处理和实现优化,基本包括了在天翼云OpenAPI门户注册的云服务OpenAPI服务接口。 优化集成是指对部分高频使用的云产品服务接口进行包装和优化处理,简化接口使用难度,方便用户集成。 集成模式 服务集成模式 函数计算集成 云工作流计集成 集成建设 云服务普通集成 普通集成是指云工作流直接通过在天翼云产品在天翼云OpenAPI门户注册的OpenAPI对外提供的服务接口进行集成调用,不对服务接口做任何特殊处理和优化。 允许云工作流通过调用弹性计算、存储服务、数据库、容器、大数据处理、中间件服务在内的多个天翼云服务的接口实现业务流程编排。 普通集成
        来自:
        帮助文档
        函数计算
        用户指南
        云工作流
        功能简介
        功能特性
      • 产品定义
        本文为您介绍什么是资源编排ROS。 资源编排ROS(ROS,Resource Orchestration Service)是基于Terraform(HCL + Provider)的新一代云资源全生命周期管理平台,您只需通过结构化模板集中定义各类云资源(例如弹性云主机、虚拟私有云、弹性IP等),即可自动、安全、高效地实现“一键创建与管理”云资源。借助 Terraform 的底层引擎能力,ROS 能够自动解析资源依赖关系、校验配置合规性,并通过预置的安全策略规避权限风险与配置冲突,最终实现从资源创建、关联配置到后期扩缩容、版本迭代的 “一键化” 操作。 资源编排ROS聚焦自动化批量创建云资源场景,全面践行“基础设施即代码”理念,帮助用户大幅降低人工操作失误率,同时支持资源的批量管理与自动化运维,让企业在复杂云架构下也能轻松实现资源的高效调度与精益化管理,助力用户高效、安全、一致性交付和运维天翼云服务。 为什么选择资源编排ROS 资源编排ROS可以帮助您高效、安全、轻松地管理一组资源。 强大的Terraform生态:完全兼容Terraform,确保您的现有资源栈无缝迁移。 极简自动化部署:通过模板化编排和自动化引擎,您只需“一次设计”即可“多次部署”。 安全合规:内置评估审核与合规性校验,让变更可知、可控、可追溯。 成本优化:模板可一键复用,变更前可预测资源与费用变更,助力企业降本增效。 友好交互: 企业级可视化交互和丰富API接口。
        来自:
        帮助文档
        资源编排ROS
        产品介绍
        产品定义
      • 云主机DNS篡改
        本章节介绍云主机DNS篡改故障演练。 背景介绍 DNS 篡改是一种常见的攻击手段或配置错误,它会导致域名被错误地解析到非预期的IP地址,从而引发流量劫持、服务中断或数据泄露等风险。本演练通过模拟 DNS 篡改场景,帮助您检验系统的安全防护机制、验证监控告警的有效性,并评估业务在域名解析被劫持时的表现。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是通过修改本地DNS解析文件实现。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择DNS篡改动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 域名:待篡改的域名。 映射IP:将目标域名解析到该IP地址。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机DNS篡改
      • 云主机磁盘IO Hang
        本章节介绍云主机磁盘IO Hang故障演练。 背景介绍 磁盘硬件故障、文件系统损坏、驱动异常或内核I/O调度器卡死,都可能导致磁盘完全无响应,所有读写(I/O)操作被无限期阻塞。这种情况对业务的破坏性极强,通常会导致应用假死、数据不一致甚至服务雪崩。本演练模拟这种极端场景,帮助您检验应用在存储完全不可用时的行为、测试高可用切换机制的有效性,并验证您的灾难应急预案。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是通过fsfreeze命令模拟磁盘夯死表现。 注意 设置磁盘夯死故障注入后,可能会导致应用无法读写文件产出异常,请谨慎使用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择磁盘IO Hang动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。由于此故障的特性,自动恢复无法得到保证。 前置等待时间(秒):执行故障前的等待时间。 磁盘被填充的目录路径:故障将注入到该目录所在的文件系统(挂载点)上。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机磁盘IO Hang
      • 云主机磁盘IO Hang
        本章节介绍云主机磁盘IO Hang故障演练。 背景介绍 磁盘硬件故障、文件系统损坏、驱动异常或内核I/O调度器卡死,都可能导致磁盘完全无响应,所有读写(I/O)操作被无限期阻塞。这种情况对业务的破坏性极强,通常会导致应用假死、数据不一致甚至服务雪崩。本演练模拟这种极端场景,帮助您检验应用在存储完全不可用时的行为、测试高可用切换机制的有效性,并验证您的灾难应急预案。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是通过fsfreeze命令模拟磁盘夯死表现。 注意 设置磁盘夯死故障注入后,可能会导致应用无法读写文件产出异常,请谨慎使用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择磁盘IO Hang动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。由于此故障的特性,自动恢复无法得到保证。 前置等待时间(秒):执行故障前的等待时间。 磁盘被填充的目录路径:故障将注入到该目录所在的文件系统(挂载点)上。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机磁盘IO Hang
      • 基本概念
        本文将为您介绍资源编排ROS基本概念。 概念名称 描述 资源 指可被声明、创建、更新和管理的云上实体,如计算、网络、存储等基础组件,是模板编排和部署的最小管理单元。 模板 模板是一个HCL语法文本描述文件,支持tf、tf.json文件格式,用于描述您的云资源。资源编排根据模板完成各种云资源的创建。 资源栈 资源栈是云服务资源的集合。资源栈将模板描述的所有云服务资源作为一个整体来进行创建、删除、更新、查询等。 地域 地域(Region)是指物理的数据中心的地理区域。地域从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。资源栈隶属于一个地域,完成地域级别的资源创建、删除、更新、查询。 执行计划 执行计划提供对资源栈变化的预览。这个执行计划展示了当前模板与线上资源的对比变化,清晰地展示了资源编排对资源与属性将要执行的操作(如新增、修改、删除等)。用户可以预览这个计划,在确认符合预期后,再执行这个计划。资源编排就会完成模板定义资源的创建、变更等。 资源栈输出 指在模板部署完成后,由资源栈对外暴露的关键结果信息,如资源 ID、访问地址、配置信息等,便于其他系统或后续流程引用和集成。 资源栈事件 执行计划的执行,执行计划/资源栈的部署,销毁等执行过程中产生的关键过程记录,用于展示每一步的状态变化、操作动作及结果,方便排查问题和追踪执行流程。
        来自:
        帮助文档
        资源编排ROS
        产品介绍
        基本概念
      • 创建函数流任务
        本章介绍函数工作流如何创建函数流任务。 本章节主要介绍如何创建函数流任务和编排函数流任务。您可以根据实际业务场景来创建标准函数流或快速函数流。 标准模式面向普通的业务场景,支持长时间任务,支持执行历史持久化和查询,只支持异步调用,在函数流运行记录页面查询执行结果。 快速模式面向业务执行时长较短,需要极致性能的场景,只支持流程执行时长低于5分钟的场景,不支持执行历史持久化,支持同步和异步调用。通过同步执行函数流接口进行函数流的同步执行,接口直接返回函数流执行结果,同时日志页面查看上报到LTS的函数流执行日志。 说明 快速函数流限时免费,欢迎体验! 前提条件 已经在FunctionGraph控制台创建函数。 操作步骤 1、登录FunctionGraph控制台,进入“函数流”页面。 2、在“函数流”页面,单击“创建标准函数流”或“创建快速函数流”,进入新建函数流页面。 3、编排函数流任务,请您根据实际应用进行函数流编排。 在函数流页面,通过拖拽组件进行流程编排。 以下图为例,将开始节点、函数、结束节点拖入编辑框内,并用连接线连接好。 编排函数流 分别单击编辑框中的每个节点进行编辑。配置函数参数,参数说明如下表所示,带参数为必填项。 说明 配置函数前确保已创建好函数,示例中的函数节点选择函数2(函数执行返回result的值为函数调用事件内的input输入值+2的结果值),参见下图配置。 函数节点配置 函数参数说明 参数 说明 应用 函数所属应用,用户创建函数时可以进行分组, 每个函数应用下面可以创建多个函数,在函数创建时可以指定其归属于某个函数应用。 函数 FunctionGraph中对应的函数。 说明 仅对于Go函数支持返回流式数据:在函数详情页的“设置 > 高级设置”下, 打开“返回流式数据”开关即可 版本 FunctionGraph中函数对应的版本。 函数参数 流程中以json格式作为body参数在执行时传入函数。 Key:填写参数 Value:填写参数值 DefaultValue:设置默认值,参数未获取到值时, 默认获取默认值操作:编辑或删除设置的参数 输入过滤表达式(JSONPath) 基于上一个流程的json输出参数, 可以使用JSONPath格式来选择性的过滤出当前流程的输入参数。 输出过滤表达式(JSONPath) 基于当前流程的json输出参数, 可以使用JSONPath格式来选择性的过滤出下一流程的输出参数。 若您的函数流任务中配置了流程控制器,请参见下表进行配置,带参数为必填项。 流程控制器参数说明 类型 参数 说明 ::: 子流程 选择子流程 选择已创建的函数流任务。 子流程 是否等待子流程完成 默认选择“是”。 子流程 输入过滤表达式(JSONPath) 基于上一个流程的json输出参数,可以使用JSONPath格式来选择性的过滤出当前流程的输入参数。 子流程 输出过滤表达式(JSONPath) 基于当前流程的json输出参数,可以使用JSONPath格式来选择性的过滤出下一流程的输出参数。 并行分支 分支执行完成条件 所有分子执行完成:2个或2个以上分支时选择该条件 一个分支执行完成:只有1个分支时选择该条件 指定数目分支执行完成:2个或2个以上分支时其中某个分支可以选择该条件 并行分支 输入过滤表达式(JSONPath) 基于上一个流程的json输出参数,可以使用JSONPath格式来选择性的过滤出当前流程的输入参数。 并行分支 输出过滤表达式(JSONPath) 基于当前流程的json输出参数,可以使用JSONPath格式来选择性的过滤出下一流程的输出参数。 并行分支 指定分支执行完成数目 当“分支执行完成条件”选择指定数目分支执行完成时,支持自定义执行完成的数目。 并行分支 结果输出路径 输入并行分支执行结果输出位置,输入值作为key,并行分支执行结果作为value,以json形式输出。若未填写,默认输出路径为:result。 开始节点 加入触发器 用于标识流程的开始,一个流程只能有一个开始节点。如何创建函数流触发器,请参见创建函数流触发器。 异常处理 是否重试 默认关闭,开启后可以控制函数执行失败后的下一步流程。 重试条件(JSONPath):例如: $.status 500 重试间隔(130秒):默认重试间隔1S 最大重试次数(18):默认重试次数3次 循环节点 遍历数组路径(JSONPath) 需要遍历的数组类型变量地址。 循环节点 迭代变量名称 每次循环迭代,引用数组中元素的参数名称。 循环节点 结果输出路径(JSONPath) 指定全部迭代分支执行结果数组的输出位置。 循环节点 并发迭代数目 并发运行迭代分支的数目,限制0100, 0代表并发拉起的数目无限制。 循环节点 并发迭代时间间隔(秒) 每次迭代间隔的时间。 循环节点 输入过滤表达式(JSONPath) 基于上一个流程的json输出参数,可以使用JSONPath格式来选择性的过滤出当前流程的输入参数。 循环节点 输出过滤表达式(JSONPath) 基于当前流程的json输出参数,可以使用JSONPath格式来选择性的过滤出下一流程的输出参数。 时间等待 延迟时间(秒) 默认1000秒。 服务节点 执行模式 定义服务节点中函数的执行顺序。 串行模式:服务中的函数节点按照连线顺序依次执行,可以严格保证函数的执行顺序 并行模式:服务中的函数节点并行执行,不保证内部函数节点的执行顺序 服务节点 输入过滤表达式 通过JSONPath表达式对节点的输入信息进行过滤。 服务节点 输出过滤表达式 通过JSONPath表达式对节点的输出信息进行过滤。 条件分支 分支类型 条件分支 默认分支 当一个分支选择条件分支时,必须要有一个分支选择默认分支。 条件分支 表达式 选择“条件分支”,需要输入JSONPath类型表达式。 条件分支 输入过滤表达式 通过JSONPath表达式对节点的输入信息进行过滤。 条件分支 输出过滤表达式 通过JSONPath表达式对节点的输出信息进行过滤。 结束节点 流程结束的标志 后面不能接任何节点。 流程中的所有节点参数配置完成后,单击右上角的“保存”。 说明 函数流中的节点改动后,必须先保存信息,再启动函数流任务。 在新建函数流页面,填写相关信息,单击“确定”,函数流保存成功。 输入配置信息 参数 说明 名称 输入函数流名称。 企业项目 选择企业项目。 日志记录 创建快速函数流,保存时需要选择此参数。 ALL:为所有事件启用日志记录 ERROR:仅启用错误日志记录 NONE:关闭日志记录 合并参数 将上一个节点的输出与下一个节点的输入合并为输入。 描述 输入函数流的简要描述。 新建标准函数流 单击“启动”,在弹出的启动执行页面,支持输入定义值或者直接启动。此处选择“输入定义值”。 { "input":3 } 启动执行配置 说明 输入定义值必须是JSON格式的内容。 单击“开始执行”,页面右上角提示“启动函数流xxx成功”。 单击函数流任务名称,进入函数流任务详情,查看函数流执行结果。 查看执行结果
        来自:
        帮助文档
        函数工作流
        用户指南
        函数流管理
        创建函数流任务
      • 一键批量部署 OpenClaw
        操作说明 本方案基于 天翼云 ROS(资源编排服务)控制台,提供 OpenClaw 云主机的一键批量部署与删除能力。用户仅需在 ROS 控制台导入模板并配置参数,即可在分钟级完成环境搭建与资源回收。 方案通过模板化编排,将计算、网络与安全策略统一纳管,实现“自动化部署 + 安全策略一体化”,显著提升资源交付效率,降低运维复杂度。 适用场景 OpenClaw 云主机快速批量搭建 多环境标准化部署(开发、测试、生产) 临时资源快速创建与释放 对网络隔离与安全策略有定制化和合规管理要求的业务场景 方案架构 基于 ROS 模板编排,自动创建以下资源: VPC 私有网络 子网(Subnet) 安全组及访问规则 ECS 云主机(OpenClaw 镜像) 弹性公网 IP(自动分配与绑定) 架构关系如下: VPC ├── Subnet │ └── ECS(OpenClaw实例) × N │ ├── EIP │ └── Security Group 核心能力 在 ROS 控制台中: 导入模板(基于 Terraform 语法适配) 核心参数配置:配置实例数量(instancecount)、可用区选择、镜像、云主机规格等等 一键创建资源栈 即可自动完成: 多台 OpenClaw 云主机创建 自动命名(如 openclaw1、openclaw2) 公网 IP 自动绑定 同时支持一键删除资源栈,实现全量资源自动回收
        来自:
        帮助文档
        资源编排ROS
        最佳实践
        一键批量部署 OpenClaw
      • 一键批量部署 OpenClaw(1)
        操作说明 本方案基于 天翼云 ROS(资源编排服务)控制台,提供 OpenClaw 云主机的一键批量部署与删除能力。用户仅需在 ROS 控制台导入模板并配置参数,即可在分钟级完成环境搭建与资源回收。 方案通过模板化编排,将计算、网络与安全策略统一纳管,实现“自动化部署 + 安全策略一体化”,显著提升资源交付效率,降低运维复杂度。 适用场景 OpenClaw 云主机快速批量搭建 多环境标准化部署(开发、测试、生产) 临时资源快速创建与释放 对网络隔离与安全策略有定制化和合规管理要求的业务场景 方案架构 基于 ROS 模板编排,自动创建以下资源: VPC 私有网络 子网(Subnet) 安全组及访问规则 ECS 云主机(OpenClaw 镜像) 弹性公网 IP(自动分配与绑定) 架构关系如下: VPC ├── Subnet │ └── ECS(OpenClaw实例) × N │ ├── EIP │ └── Security Group 核心能力 在 ROS 控制台中: 导入模板(基于 Terraform 语法适配) 核心参数配置:配置实例数量(instancecount)、可用区选择、镜像、云主机规格等等 一键创建资源栈 即可自动完成: 多台 OpenClaw 云主机创建 自动命名(如 openclaw1、openclaw2) 公网 IP 自动绑定 同时支持一键删除资源栈,实现全量资源自动回收
        来自:
      • 云主机磁盘IO Hang(1)
        本章节介绍云主机磁盘IO Hang故障演练。 背景介绍 磁盘硬件故障、文件系统损坏、驱动异常或内核I/O调度器卡死,都可能导致磁盘完全无响应,所有读写(I/O)操作被无限期阻塞。这种情况对业务的破坏性极强,通常会导致应用假死、数据不一致甚至服务雪崩。本演练模拟这种极端场景,帮助您检验应用在存储完全不可用时的行为、测试高可用切换机制的有效性,并验证您的灾难应急预案。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是通过fsfreeze命令模拟磁盘夯死表现。 注意 设置磁盘夯死故障注入后,可能会导致应用无法读写文件产出异常,请谨慎使用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择磁盘IO Hang动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。由于此故障的特性,自动恢复无法得到保证。 前置等待时间(秒):执行故障前的等待时间。 磁盘被填充的目录路径:故障将注入到该目录所在的文件系统(挂载点)上。
        来自:
      • 应用性能管理
        操作名称 资源类型 事件名称 删除应用 APM clearApps 设置事务别名 APM setAlias 更新虚机服务分组 APM updateVirtualService 更新事务配置 APM updateTxTypeSettings 更新拓扑Apdex阈值 APM updateThresholds 设置事务分组 APM txtypeGroupOperation 删除应用配置 apm deleteAppGroup 更新采集开关配置 apm setAppPpswitcherConfig 更新智能采样配置 apm setAppCallChainConfig 更新内存检测机制配置 apm setAppMwsConfig 更新日志增加TraceID配置 apm setAppLogTransacConfig 更新SQL分析开关配置 apm setAppSqlConfig 更新忽略HTTP响应代码或忽略错误和异常配置 apm setAppIgnoreConfig
        来自:
        帮助文档
        云审计
        用户指南
        支持审计的服务及详细操作列表
        管理与部署
        应用性能管理
      • 弹性伸缩概述
        本文主要介绍弹性伸缩概述。 弹性伸缩是根据业务需求和策略,经济地自动调整弹性计算资源的管理服务。 背景介绍 随着Kubernetes已经成为云原生应用编排、管理的事实标准,越来越多的应用选择向Kubernetes迁移,用户也越来越关心在Kubernetes上应用如何快速扩容面对业务高峰,以及如何在业务低谷时快速缩容节约资源与成本。 在Kubernetes的集群中,“弹性伸缩”一般涉及到扩缩容Pod个数以及Node个数。Pod代表应用的实例数(每个Pod包含一个或多个容器),当业务高峰的时候需要扩容应用的实例个数。所有的Pod都是运行在某一个节点(虚机或裸机)上,当集群中没有足够多的节点来调度新扩容的Pod,那么就需要为集群增加节点,从而保证业务能够正常提供服务。 弹性伸缩在CCE上的使用场景非常广泛,典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度: 工作负载弹性伸缩 : 即调度层弹性,主要是负责修改负载的调度容量变化。例如,HPA是典型的调度层弹性组件,通过HPA可以调整应用的副本数,调整的副本数会改变当前负载占用的调度容量,从而实现调度层的伸缩。 节点弹性伸缩 : 即资源层弹性,主要是集群的容量规划不能满足集群调度容量时,会通过弹出ECS等资源的方式进行调度容量的补充。 两个维度的弹性组件与能力可以分开使用,也可以结合在一起使用,并且两者之间可以通过调度层面的容量状态进行解耦。
        来自:
        帮助文档
        云容器引擎
        用户指南
        弹性伸缩
        弹性伸缩概述
      • 云容器集群节点DNS篡改
        2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎节点。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎节点实例。 添加故障动作 :单击立即添加 ,在列表中选择DNS篡改动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 域名:待篡改的目标域名。 映射IP:将目标域名解析到的IP地址。 3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到DNS篡改动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod,确认访问被篡改域名的流量是否已被重定向。 评估此重定向对业务功能造成的具体影响,例如页面无法访问、API调用失败或连接到错误的服务。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点DNS篡改
      • 云容器集群节点DNS篡改(1)
        2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎节点。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎节点实例。 添加故障动作 :单击立即添加 ,在列表中选择DNS篡改动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 域名:待篡改的目标域名。 映射IP:将目标域名解析到的IP地址。 3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到DNS篡改动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod,确认访问被篡改域名的流量是否已被重定向。 评估此重定向对业务功能造成的具体影响,例如页面无法访问、API调用失败或连接到错误的服务。
        来自:
      • 云主机内存高负载(1)
        本章节介绍云主机内存高负载故障演练。 背景介绍 当云主机的内存被异常占用(例如,由应用内存泄漏、缓存数据无限制膨胀或资源配额不足引起),其内存使用率会飙升。一旦可用内存耗尽,系统可能会频繁进行内存交换,甚至触发 OOM Killer(OutOfMemory Killer)来强制终止进程,导致服务中断。本演练模拟内存资源被持续占用的高负载场景,帮助您检验系统的内存监控告警、评估应用的内控管理能力,并验证 OOM Killer 触发时的系统行为。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是启动自定义程序不断申请内存,模拟主机内存负载升高。 注意 设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择内存高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 内存占用率:取值范围为0100。注意:设置过高的占用率可能出现无法自动恢复的情况,可在云主机控制台操作重启机器恢复。
        来自:
      • 产品定义
        故障演练的业务痛点 技术要求高:异构的故障源,从基础设施到操作系统,从容器环境到应用进程,以及依赖的中间件,都需要理解其原理才能模拟故障。 实施难度大:跨团队、长流程、多权限,故障演练不仅是技术问题,更涉及组织流程与制度,需要建立相应规范。 影响不可控:故障是已知的,影响是未知的。如何感知并最小化“爆炸半径”,既要有处置预案,又要有工具支持。 故障演练的产品功能 标准化流程管理:固化演练流程,提供组织、人员、应用、资源等多维度的数据与权限管理规范。 丰富的故障场景:实现涵盖应用不同分层的原子故障注入能力,并提供具备业务含义的故障场景组合。 完备的演练防护:实现隔离与熔断双重演练防护,包括权限隔离、环境隔离和范围隔离,以及主动熔断、指标熔断和超时熔断等多种保护机制。 一站式接入管理:深度整合现有应用体系,自动导入组织权限、应用架构和关联资源,实现一站式可编排、可控制、可观测。
        来自:
        帮助文档
        应用高可用
        产品简介
        故障演练服务
        产品定义
      • 产品定义(1)
        故障演练的业务痛点 技术要求高:异构的故障源,从基础设施到操作系统,从容器环境到应用进程,以及依赖的中间件,都需要理解其原理才能模拟故障。 实施难度大:跨团队、长流程、多权限,故障演练不仅是技术问题,更涉及组织流程与制度,需要建立相应规范。 影响不可控:故障是已知的,影响是未知的。如何感知并最小化“爆炸半径”,既要有处置预案,又要有工具支持。 故障演练的产品功能 标准化流程管理:固化演练流程,提供组织、人员、应用、资源等多维度的数据与权限管理规范。 丰富的故障场景:实现涵盖应用不同分层的原子故障注入能力,并提供具备业务含义的故障场景组合。 完备的演练防护:实现隔离与熔断双重演练防护,包括权限隔离、环境隔离和范围隔离,以及主动熔断、指标熔断和超时熔断等多种保护机制。 一站式接入管理:深度整合现有应用体系,自动导入组织权限、应用架构和关联资源,实现一站式可编排、可控制、可观测。
        来自:
      • 产品优势
        本文介绍公共算力服务的产品优势。 丰富的场景化能力 支持多种异构算力跨地域的大规模调度能力。 实现不同云服务商、裸算力等多方算力并网能力。 灵活的多维度调度 提供业务调度、编排调度、作业调度的能力,满足不同场景的调度需求。 具备统一编排和跨域调度能力,支持可扩展的调度能力。 精细的可视化运营 算力调度、算力资源的精细化运营管理,提供稳定可靠的算力。 拥有完善的平台和规模化的算力运营经验。 开放的合作生态圈 以算力招募的方式接入社会算力。 提供开放兼容的算力并网接入方式和技术标准,打造开放的合作伙伴生态。
        来自:
        帮助文档
        公共算力服务
        产品介绍
        产品优势
      • 概述
        本文将为您介绍什么是模板。 资源编排ROS 模板是用于创建、更新天翼云 资源编排ROS 资源栈的标准化配置脚本,作为资源部署的核心 “蓝图”,它采用 Terraform 的 HCL(HashiCorp Configuration Language)作为配置语法。 借助 HCL 的结构化语法特性,能够清晰定义资源栈所需的资源类型(如计算实例、存储服务、网络配置等)、具体参数(如实例规格、存储容量、网络地址等)及资源间依赖关系,确保资源部署逻辑具备可追溯性和可读性。 基于模板,用户无需手动逐一配置资源,可快速生成一致性的资源栈,同时支持后续对资源栈进行统一更新与管理,有效简化天翼云资源部署流程,提升操作效率与配置准确性,适配从简单到复杂场景的资源自动化管理需求。
        来自:
        帮助文档
        资源编排ROS
        模板参考
        概述
      • 基础知识
        了解Kubernetes相关的基础知识。 Pod Pod 是Kubernetes中创建和管理的最小单元,是一个或多个容器的组合,Pod中的容器共享存储和网络资源,以及运行容器的规范。 Volume Volume是Pod内部的共享存储资源,生命周期和Pod相同,与容器无关,即使Pod上的容器停止或者重启,Volume也不会受到影响。但如果Pod终止,那么Volume的生命周期也会结束。 Persistent Volume(PV) Volume中的数据无法持久保留,不能满足有状态服务的需求,因此需要Persistent Volume。PV是Kubernetes中的持久存储资源,是一种网络存储,它的生命周期和Pod无关。如果在Kubernetes中运行有状态服务,比如数据库MySQL,MongoDB或者中间件Redis,RabbitMQ等,那么就需要使用PV,这样即使Pod终止也不会丢失数据。 Persistent Volume Claim(PVC) Persistent Volume Claim是PV的声明。在Kubernetes中,直接使用PV作为存储时,需要集群管理员提前创建好PV,使用上不灵活。而PVC可以将Pod和PV解耦,即Pod不直接使用PV,而是通过PVC来使用PV。这样,无需提前创建PV,只要通过StorageClass把存储资源定义好,Kubernetes就会根据使用需要,动态创建PV,这种方式称为动态供应。 StorageClass StorageClass用于描述不同的存储类型。当通过PVC动态创建HBlock 的卷时,需要在StorageClass中配置创建HBlock卷的参数,如卷冗余模式、扇区大小、写策略等信息。 Container Storage Interface(CSI) Container Storage Interface(CSI)是通用存储接口,旨在实现容器编排器和存储提供商之间的互操作。通过CSI,容器编排器能够使用任何存储提供商的存储服务,存储提供商也可以为任何容器编排器提供存储服务。
        来自:
        帮助文档
        存储资源盘活系统
        常用工具
        Container Storage Interface插件
        基础知识
      • 云主机内存高负载
        本章节介绍云主机内存高负载故障演练。 背景介绍 当云主机的内存被异常占用(例如,由应用内存泄漏、缓存数据无限制膨胀或资源配额不足引起),其内存使用率会飙升。一旦可用内存耗尽,系统可能会频繁进行内存交换,甚至触发 OOM Killer(OutOfMemory Killer)来强制终止进程,导致服务中断。本演练模拟内存资源被持续占用的高负载场景,帮助您检验系统的内存监控告警、评估应用的内控管理能力,并验证 OOM Killer 触发时的系统行为。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是启动自定义程序不断申请内存,模拟主机内存负载升高。 注意 设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择内存高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 内存占用率:取值范围为0100。注意:设置过高的占用率可能出现无法自动恢复的情况,可在云主机控制台操作重启机器恢复。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机内存高负载
      • 创建密钥
        section175000605919 " ")。 当密钥为kubernetes.io/dockerconfigjson类型时,输入私有镜像仓库的帐号和密码。 当密钥为IngressTLS类型时,上传证书文件和私钥文件。 说明 1、证书是自签名或CA签名过的凭据,用来进行身份认证。 2、证书请求是对签名的请求,需要使用私钥进行签名。 密钥标签 标签以Key/value键值对的形式附加到各种对象上(如工作负载、节点、服务等)。 标签定义了这些对象的可识别属性,用来对它们进行管理和选择。 1. 单击“添加标签” 。 2. 输入键、值。 步骤 4 方式二:基于YAML文件创建密钥。 说明: 若需要通过上传文件的方式创建资源,请确保资源描述文件已创建。CCE支持json或yaml格式,详细请参见Secret资源文件配置说明.docx section187197531454 " ")。 您可以导入或直接编写文件内容,格式为YAML或JSON。 方式一:导入编排文件。 单击“添加文件”,导入格式为YAML或JSON的文件。编排内容中可直接展示编排内容。 方式二:直接编排内容。 在编排内容区域框中,输入YAML或JSON文件内容。 步骤 5 配置完成后,单击“创建”。 密钥列表中会出现新创建的密钥。 Secret资源文件配置说明 本章节主要介绍Secret类型的资源描述文件的配置示例。 例如现在有一个工作负载需要获取帐号密码,可以通过Secret来实现: yaml文件格式 定义的Secret文件secret.yaml内容如下。其中Value需要用Base64,Base64编码方法请参见如何进行Base64编码.docx
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        配置中心
        创建密钥
      • 云主机磁盘填充(1)
        本章节介绍云主机磁盘填充故障演练。 背景介绍 由失控的日志文件、未经清理的临时数据或异常进程持续写入,都可能导致云主机磁盘空间被耗尽(例如使用率超过95%)。这种情况会直接导致应用无法写入新数据、服务功能异常甚至进程崩溃。本演练模拟磁盘空间被占满的场景,帮助您检验系统的磁盘空间监控告警、日志轮转机制以及应用在无可用存储空间时的处理逻辑。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是通过dd命令将数据写入文件。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择磁盘填充动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 目录:填充文件的写入目标,默认为系统根目录 /。强烈建议指定一个非系统盘的数据目录。 文件大小(MB):填充的文件大小,取值是整数,例如1024。 磁盘使用率:填充至指定的空间占用率(取值 1100),例如50代表50%的使用率。 保留大小(MB):保留的磁盘大小,如果文件大小、磁盘使用率、保留大小参数都存在,优先级是磁盘使用率>保留大小>文件大小。
        来自:
      • 使用限制
        本文将为您介绍资源编排ROS的配额信息。 为确保资源编排产品可以正常为您服务,在使用之前请您务必仔细阅读以下配额限制。 资源编排ROS对用户资源数量限定了配额,如果您需要使用更多资源,请提交工单进行申请。 配额项 默认配额 单个天翼云账号允许创建的最大模板个数 100 单个模板最大版本个数 100 每个模板内容最大值 1MB 每个模板文件内容最大值 128KB 每个模板文件数量最大值 50 每个模板参数个数 100 模板参数默认值长度最大值 5KB 每个模板输出个数 100 资源栈单次执行输出内容最大值 1MB 单个天翼云账号允许创建的最大资源栈个数 100 单个资源栈事件保留 30天/10000条/单条最大2KB
        来自:
        帮助文档
        资源编排ROS
        产品介绍
        使用限制
      • 1
      • ...
      • 3
      • 4
      • 5
      • 6
      • 7
      • ...
      • 543
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云信创专区

      “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      多活容灾服务 MDR

      GPU云主机

      天翼云CTyunOS系统

      应用托管

      科研助手

      一站式智算服务平台

      知识库问答

      人脸检测

      人脸属性识别

      推荐文档

      Windows方程式漏洞ACL策略配置说明

      天翼云进阶之路⑧:sql server内存暴涨如何解决

      概念

      复制备份

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号