爆款云主机低至25.83元/年
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 云聚517 · 好价翼起拼 NEW 爆款云主机低至25.83元/年,参与拼团享更多优惠,拼成得额外优惠券
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 聚力AI赋能 天翼云大模型专项 大模型特惠专区·Token Plan 轻享包低至9.9元起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 企业出海解决方案 NEW 助力您的业务扬帆出海,通达全球!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
Token服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V4-Flash
  • GLM-5.1
  • Qwen3.5-122B-A10B
  • DeepSeek-V3.2(旗舰版)
  • GLM-5(正式版)
智算一体机
  • 智算一体机
智能体引擎
  • 智能体引擎
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2026智能云生态大会
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      应用编排服务_相关内容
      • 集群联邦概述
        本节介绍集群联邦概述。 集群联邦 集群联邦基于多云容器编排能力,旨在管理跨云、跨地域场景下的多集群应用,为您提供多集群统一管理、应用部署、服务发现、弹性伸缩、故障迁移等能力。 功能优势 完全兼容Kubernetes原生API,支持从单集群到多集群零改造升级,无缝集成现有Kubernetes工具链生态。 丰富的多集群调度策略:集群亲和性调度、多集群拆分/再平衡调度,多维度的高可用部署,包括多Region、多AZ、多集群、多云供应商 。提供自动化的多集群故障优雅迁移能力,对故障集群实例进行集中式或分散式的迁移,保证服务实例不跌零 多集群流量分发:多集群Service实现跨集群的服务发现和访问。多集群Ingress提供跨集群的负载均衡和流量路由机制,支持自动切流,可自动摘除故障集群上的流量,保障服务的可用性 。 多集群弹性伸缩:基于工作负载的系统指标变动、自定义指标变动或固定的时间周期,实行多集群统一的负载伸缩策略,提升工作负载的可用性和稳定性 。 全域容器智能分析:实时监控应用及资源,采集各项指标及事件等数据以分析应用健康状态,提供多集群统一的全栈监控视图,对业务提供端到端追踪和可视化,提供集群健康诊断能力,缩短问题分析定位时间 。
        来自:
        帮助文档
        分布式容器云平台 CCE One
        用户指南
        集群联邦
        集群联邦概述
      • 基本概念
        本节主要介绍基本概念。 Kubernetes是业界主流的开源容器编排平台。为了让用户可以方便地在云上使用Kubernetes管理容器应用,推出了基于原生Kubernetes的云容器引擎服务。 云容器引擎(Cloud Container Engine,简称CCE)提供高度可扩展的、高性能的企业级Kubernetes集群,支持运行Docker容器。借助云容器引擎,您可以在云上轻松部署、管理和扩展容器化应用程序。 云容器引擎整合了天翼云的计算、网络、存储等服务,支持多可用区(Available zone,简称AZ)容灾等技术构建高可用Kubernetes集群,并提供高性能可伸缩的容器应用管理能力,简化集群的搭建和扩容等工作,让您专注于容器化应用的开发与管理。 名词解释 使用云容器引擎服务,会涉及到以下基本概念: 集群:是指容器运行所需云资源的集合,包含了若干台云服务器、负载均衡器等云资源。 实例(Pod):由相关的一个或多个容器构成一个实例,这些容器共享相同的存储和网络空间。 工作负载:Kubernetes资源对象,用于管理Pod副本的创建、调度以及整个生命周期的自动控制。 Service:由多个相同配置的实例(Pod)和访问这些实例(Pod)的规则组成的微服务。 Ingress:Ingress是用于将外部HTTP(S)流量路由到服务(Service)的规则集合。 Helm应用:Helm是管理Kubernetes应用程序的打包工具,提供了Helm Chart在指定集群内图形化的增删改查。 镜像仓库:用于存放Docker镜像,Docker镜像用于部署容器服务。 您在使用前可以了解更多Kubernetes相关知识,具体请参见
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        基本概念
      • 云容器集群节点进程挂起
        2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎节点。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎节点实例。 添加故障动作 :单击立即添加 ,在列表中选择进程挂起动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程关键词:例如nginx。 3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到挂起进程动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务请求量、应用提供服务平均响应时间指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod,确认其提供的服务是否已无响应。 核心验证点:检查 Kubernetes 的事件(kubectl get events)或Pod详情(kubectl describe pod),确认 liveness probe 是否因超时而失败,并最终导致 Pod 被重启。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点进程挂起
      • 演练任务
        2.4 编排与并行设置 串行编排 :在一个并行动作 块内,可以单击立即添加多次,以添加多个串行动作。 并行编排: 单击添加并行动作 ,可以在同一个动作组内创建多个并行执行的动作块。 可以创建多个动作组 ,不同的动作组之间同样并行执行。 2.5 配置高级设置 全部注入 :向动作组内所有选定的实例注入故障。 按比例随机注入:根据设定的百分比,在选定的实例中随机选择目标注入故障。 按数量随机注入:根据设定的数量,在选定的实例中随机选择目标注入故障。 执行方式: 手动推进:手动控制整个演练流程的推进,执行故障注入或恢复节点的时机由您决定。 自动推进:依次执行动作组 内的故障注入节点,到达设定的持续时间后,自动执行故障恢复节点。 说明 自动推进模式下,演练出现异常会切换到手动推进模式,您仍然可以手动执行剩余节点。 3、进行全局配置 单击下一步 进入全局配置页面。 配置监控指标:为本次演练关联的应用添加监控指标,方便在演练时观测。 设置演练超时时间 :设定一个总体超时时长,系统会自动为当前演练创建一个超时保护策略。 配置完成后,单击完成 按钮,完成演练任务创建。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        演练管理
        演练任务
      • Redis节点内存高负载
        本章节介绍Redis节点内存高负载故障演练。 背景介绍 Redis 性能受节点可用内存限制。当内存异常占用时,Redis 可能触发内存淘汰、拒绝写入,甚至被操作系统终止。本演练模拟高内存占用场景,帮助您验证内存淘汰策略、应用容错能力及监控告警效果。 基本原理 在节点启动自定义程序不断申请内存,模拟主机内存负载升高。 注意 设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 预留资源 :强烈建议将目标内存占用率设置在90%以下,为操作系统内核和关键系统进程(如SSH服务)预留足够的内存。若内存被完全耗尽,可能导致主机失去响应,需要通过控制台强制重启才能恢复。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择内存高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。 内存占用率:指定内存负载百分比(取值 0100)。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        数据库
        分布式缓存服务Redis版
        Redis节点内存高负载
      • Redis节点内存高负载(1)
        本章节介绍Redis节点内存高负载故障演练。 背景介绍 Redis 性能受节点可用内存限制。当内存异常占用时,Redis 可能触发内存淘汰、拒绝写入,甚至被操作系统终止。本演练模拟高内存占用场景,帮助您验证内存淘汰策略、应用容错能力及监控告警效果。 基本原理 在节点启动自定义程序不断申请内存,模拟主机内存负载升高。 注意 设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 预留资源 :强烈建议将目标内存占用率设置在90%以下,为操作系统内核和关键系统进程(如SSH服务)预留足够的内存。若内存被完全耗尽,可能导致主机失去响应,需要通过控制台强制重启才能恢复。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择内存高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。 内存占用率:指定内存负载百分比(取值 0100)。
        来自:
      • 什么是云容器引擎
        本文主要介绍什么是云容器引擎 。 Kubernetes是主流的开源容器编排平台。为了让用户可以方便地在云上使用Kubernetes管理容器应用,天翼云推出了基于原生Kubernetes的云容器引擎服务。 云容器引擎(Cloud Container Engine,简称CCE)提供高度可扩展的、高性能的企业级Kubernetes集群,支持运行Docker容器。借助云容器引擎,您可以在云上轻松部署、管理和扩展容器化应用程序。 云容器引擎深度整合了高性能的计算(ECS/BMS)、网络(VPC/EIP/ELB)、存储(EVS/OBS/SFS)等服务,并支持CPU、GPU等异构计算架构,支持多可用区(Available zone,简称AZ)、多区域(Region)容灾等技术构建高可用Kubernetes集群,并提供高性能可伸缩的容器应用管理能力,简化集群的搭建和扩容等工作,让您专注于容器化应用的开发与管理。 名词解释 使用云容器引擎服务,会涉及到以下基本概念: 集群: 是指容器运行所需云资源的集合,包含了若干台云主机、负载均衡器等云资源。 实例(Pod): 由相关的一个或多个容器构成一个实例,这些容器共享相同的存储和网络空间。 工作负载: Kubernetes资源对象,用于管理Pod副本的创建、调度以及整个生命周期的自动控制。 Service: 由多个相同配置的实例(Pod)和访问这些实例(Pod)的规则组成的微服务。 Ingress: Ingress是用于将外部HTTP(S)流量路由到服务(Service)的规则集合。 Helm应用: Helm是管理Kubernetes应用程序的打包工具,提供了Helm Chart在指定集群内图形化的增删改查。 镜像仓库: 用于存放Docker镜像,Docker镜像用于部署容器服务。 您在使用前可以了解更多Kubernetes相关知识,具体请参见
        来自:
        帮助文档
        云容器引擎
        用户指南
        什么是云容器引擎
      • Kafka Broker节点磁盘IO高负载(1)
        本章节介绍Kafka Broker节点磁盘IO高负载故障演练。 背景介绍 分布式消息服务 Kafka 集群的性能与稳定性高度依赖底层磁盘 IO 能力,高并发写入、集群数据复制、海量消息存储检索及磁盘故障恢复等场景易导致 Broker 节点磁盘 IO 触达瓶颈,引发消息持久化延迟等问题,本演练可测试业务系统的响应与恢复能力。 基本原理 指定或随机一个Broker节点先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式消息服务Kafka,然后单击添加资源。 3. 在弹出的对话框中,勾选目标分布式消息服务Kafka实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式消息服务Kafka。 添加实例 :单击添加实例 ,勾选上一步中添加的分布式消息服务Kafka实例。 添加故障动作 :单击立即添加 ,在列表中选择Broker 磁盘IO高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 读负载:开启读压力模式,创建一个临时文件并对其进行持续的读取操作。 写负载:开启写压力模式,持续向一个临时文件写入数据。 块大小:控制单次读写操作的数据块大小,单位为MB。增大此值可以提升单次操作的 IO 压力。通常保持默认值即可。
        来自:
      • 功能特性
        本文介绍应用托管的功能特性。 应用全生命周期管理 提供从构建、交付、管理到运维的全生命周期应用管理能力,支持多种方式灵活构建应用、通过模板标准化交付、一站式管理应用访问与资源,提供持续运维能力。 丰富的应用套餐 提供7天体验版、Lite 基础版、Pro 高级版应用套餐,套餐包括应用实例、存储、网络和Token,提供不同的模型、Token 额度和资费梯度,覆盖新用户体验、基础任务到高阶业务的全场景 AI 需求。 高效便捷的应用市场和MCP市场 提供丰富多样的应用资源库,涵盖开源工具、模型算法、AI应用、MCP服务等多种类型,已上架OpenClaw、短剧制作等多款热门应用,满足不同业务场景下的功能扩展与集成需求。支持一键部署,简化传统应用安装与配置的复杂流程,显著提升部署效率。 持久化应用存储 为应用提供持久化存储,支持多种存储类型和性能规格,提供多途径文件接入方式。 全面的网络能力 提供了全面、灵活且安全的网络能力,兼容HTTPS、HTTP及WebSocket协议,支持专属IP和平台访问域名,支持内网互访、提供IP白名单访问控制等为您的应用稳定运行和对外服务提供坚实保障。 灵活资源分配与团队协作 支持完善的项目空间管理能力,实现多项目、多团队的高效协作与资源隔离,灵活配置人员、角色与权限体系,实现对成员访问范围与操作权限的精细化控制。
        来自:
        帮助文档
        应用托管
        产品介绍
        功能特性
      • Redis节点网络丢包
        本章节介绍Redis节点网络丢包故障演练。 背景介绍 当 Redis 节点网络出现拥塞或抖动导致丢包时,数据同步效率下降,主备复制延迟增加,客户端请求可能超时。本演练模拟网络丢包场景,帮助您评估业务对网络抖动的容忍度,并检验应用超时重试逻辑。 基本原理 在节点通过增加TC和Netem规则模拟主机内网络丢包。 注意 只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择网络丢包动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。 丢包率: 网络丢包率(取值 0100)。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        数据库
        分布式缓存服务Redis版
        Redis节点网络丢包
      • Redis节点网络丢包(1)
        本章节介绍Redis节点网络丢包故障演练。 背景介绍 当 Redis 节点网络出现拥塞或抖动导致丢包时,数据同步效率下降,主备复制延迟增加,客户端请求可能超时。本演练模拟网络丢包场景,帮助您评估业务对网络抖动的容忍度,并检验应用超时重试逻辑。 基本原理 在节点通过增加TC和Netem规则模拟主机内网络丢包。 注意 只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择网络丢包动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。 丢包率: 网络丢包率(取值 0100)。
        来自:
      • Redis节点CPU高负载
        本章节介绍Redis节点CPU高负载故障演练。 背景介绍 Redis 是高性能内存数据库,当节点 CPU 被高计算量、大量连接或复杂命令占满时,会出现响应变慢、吞吐下降,甚至主备切换。本演练通过模拟 Redis 主/备节点的高 CPU 负载,验证业务在请求超时、重试等场景下的容错能力,并检查 Redis 实例的高可用切换机制。 基本原理 在节点启动自定义程序,空跑for循环来消耗CPU时间片。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择CPU高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。 CPU占用率:指定CPU负载百分比(取值 0100)。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        数据库
        分布式缓存服务Redis版
        Redis节点CPU高负载
      • 云主机端口占用
        本章节介绍云主机端口占用故障演练。 背景介绍 在服务部署或运行期间,目标端口可能已被一个预期之外的进程(如僵尸进程、配置错误的旧版服务或恶意程序)所占用。这会导致新服务启动失败,并抛出Address already in use的错误。本演练模拟此端口冲突场景,帮助您检验服务启动脚本的错误处理能力、验证部署系统的健康检查和回滚逻辑,以及监控告警的有效性。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是启动自定义程序, 创建Socket对象并绑定到指定端口。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择端口占用动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 指定被占用的端口:目标端口号。 强制占用此端口:先尝试杀掉当前正在使用该端口的进程,然后再占用它。 cgroup根路径:在容器化等复杂环境中,对特定 cgroup 控制组内的进程进行端口占用。通常保持默认值 /sys/fs/cgroup 即可。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机端口占用
      • 云主机端口占用(1)
        本章节介绍云主机端口占用故障演练。 背景介绍 在服务部署或运行期间,目标端口可能已被一个预期之外的进程(如僵尸进程、配置错误的旧版服务或恶意程序)所占用。这会导致新服务启动失败,并抛出Address already in use的错误。本演练模拟此端口冲突场景,帮助您检验服务启动脚本的错误处理能力、验证部署系统的健康检查和回滚逻辑,以及监控告警的有效性。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是启动自定义程序, 创建Socket对象并绑定到指定端口。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择端口占用动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 指定被占用的端口:目标端口号。 强制占用此端口:先尝试杀掉当前正在使用该端口的进程,然后再占用它。 cgroup根路径:在容器化等复杂环境中,对特定 cgroup 控制组内的进程进行端口占用。通常保持默认值 /sys/fs/cgroup 即可。
        来自:
      • 云主机宕机(1)
        本章节介绍云主机宕机故障演练。 背景介绍 云主机运行过程中,硬件故障、系统内核崩溃、资源耗尽或网络异常等因素均可能引发主机宕机,进而造成业务服务中断、请求无法响应、数据处理停滞及集群负载失衡等问题,本演练可帮助验证系统的故障感知、自动切换与业务恢复能力,检验监控告警机制的有效性,为优化应急预案提供实践依据。 基本原理 通过调用云主机关机OpenAPI触发关机。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择主机宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。
        来自:
      • 云主机DNS不可用(1)
        本章节介绍云主机DNS不可用故障演练。 背景介绍 DNS 服务器故障、网络配置错误或网络分区等问题,都可能导致云主机无法解析域名,进而引发服务间调用失败、无法访问外部依赖等严重后果。本演练模拟 DNS 不可用的场景,帮助您评估业务对 DNS 服务的依赖程度和系统的容错能力,提前检验和完善应急预案。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是修改本地DNS解析文件或安全组(防火墙)禁用端口实现。 注意 该动作风险较大,请谨慎操作。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择DNS不可用动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 排除的域名:故障白名单,多个域名使用逗号分隔,例如test1.com,test2.com。
        来自:
      • 应用场景
        本节主要介绍智能视图服务产品的应用场景。 智慧城市 适用于对城市安全、应急管理、交通调度有迫切需求的城市。一方面可以进行实时的智能监管,从而及时发现问题;另一方面,可以快速协同调度资源,进行视频数据、结构化数据等多维度大数据的统一管理和应用,实现高效的城市治理。智能视图服务具备以下优势: 大规模部署推流接入点,就近接入,保证各场合稳定推流。 提供AI内容审核增值服务,如人脸识别,人员聚集检测、车辆牌号检索等。 支持多种播流格式,支持全网加速分发。 整合多渠道数据信息,智能统计与分析,丰富数据资产,助力城市管理数字化转型。 智慧教育 适用于校园内及多校园间多摄像头统一纳管的场景,通过实时预览、录像回溯方便管理校园内视频点位,提供安全隐患识别、人员管理分析等一站式智能管理服务,实现平安智慧校园。智能视图服务具备以下优势: 建设周期短,成本低廉,适合需要快速上云的学校或者教育机构。 支持设备接入、存储和分发一体化解决方案,按需扩容,提升资源利用率。 支持AI算法仓库统一管理,GPU算力智能调度,AI算法统一编排。 教育监管机构、学生家长等多方可便捷的通过 APP和PC客户端实时观看视频。
        来自:
        帮助文档
        智能视图服务
        产品介绍
        应用场景
      • 产品概述
        本文主要介绍产品概述 应用运维遇到挑战 在云时代微服务架构下应用日益丰富,纷杂的应用异常问题接踵而来。应用运维面临巨大挑战: 分布式应用关系错综复杂,应用性能问题分析定位困难,应用运维面临如何保障应用正常、快速完成问题定位、迅速找到性能瓶颈的挑战。 应用体验差导致用户流失。运维人员如果无法实时感知并追踪体验差的业务,不能及时诊断应用异常,将严重影响用户体验。 业务系统的应用多、分布广,跨系统、跨区域、跨应用的调用频繁,如何降低应用的管理和运维成本,提升应用运维的效率是迫切需要解决的问题。 APM帮您解决 应用性能管理服务(Application Performance Management,简称APM)帮助运维人员快速发现应用的性能瓶颈,以及故障根源的快速定位,为用户体验保驾护航。 您无需修改代码,只需为应用安装一个APM Agent,就能够对该应用进行全方位监控,帮助您快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈,从而大幅提升线上问题诊断的效率。目前支持JAVA应用,具体的应用监控能力概览如下表。 表 APM监控能力 场景能力 说明 非侵入的应用性能数据采集 用户无需更改应用代码,只需要部署APM Agent包,修改相应的应用启动参数,就可以实现应用监控。 应用指标监控 无须配置,自动监控应用相关大量监控指标,如JVM、JavaMethod、URL、Exception、Tomcat、httpClient、Mysql、Redis、kafka等。 应用拓扑 通过对RPC调用信息进行动态分析、智能计算,自动生成分布式应用间拓扑关系。 调用链追踪 多个应用接入APM后,自动针对某一些请求进行采样,采集单个请求的服务之间调用关系以及中间调用的健康情况,实现全局调用链路的自动跟踪。 常用诊断场景的指标下钻分析 根据应用响应时间、请求数、错误率等指标下钻分析,按应用、组件、环境、数据库和中间件等多维度查看。 异常URL跟踪和慢URL跟踪捕捉 基于调用URL跟踪的超时和异常分析,并有效自动关联到对应的接口调用,如 SQL、MQ 等。 1. 接入APM:应用通过APM自身的AK/SK鉴权进行接入。 2. 数据采集:APM可以通过非侵入方式采集APM Agent提供的应用数据、基础资源数据、用户体验数据等多项指标。 3. 业务实现:APM支持应用指标监控、应用拓扑、调用链追踪和智能告警功能。 4. 业务拓展: 1. 通过APM的应用拓扑、调用链追踪等快速诊断应用性能异常,并结合AOM(应用运维管理)的应用运维指标进行综合判断。 2. 找到应用性能瓶颈后,可以通过CPTS(云性能测试服务 )关联分析生成性能报表。 3. 通过智能算法学习历史指标数据,APM多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,通过聚类分析找到问题根因。
        来自:
        帮助文档
        应用性能管理
        产品介绍
        产品概述
      • 集群基本信息
        本文主要介绍 集群基本信息。 Kubernetes是一个很容易地部署和管理容器化的应用软件系统,使用Kubernetes能够方便对容器进行调度和编排。 对应用开发者而言,可以把Kubernetes看成一个集群操作系统。Kubernetes提供服务发现、伸缩、负载均衡、自愈甚至选举等功能,让开发者从基础设施相关配置等解脱出来。 Kubernetes可以把大量的服务器看做一台巨大的服务器,在一台大服务器上面运行应用程序。无论Kubernetes的集群有多少台服务器,在Kubernetes上部署应用程序的方法永远一样。 Kubernetes集群架构 Kubernetes集群包含Master节点(控制节点)和Node节点(计算节点/工作节点),应用部署在Node节点上,且可以通过配置选择应用部署在某些特定的节点上。 说明 CCE集群的Master节点由云容器引擎服务创建并托管,您只需创建Node节点。 Kubernetes集群的架构如下所示: 图 Kubernetes集群架构 Master节点 Master节点是集群的控制节点,由API Server、Scheduler、Controller Manager和ETCD四个组件构成。 API Server:各组件互相通讯的中转站,接受外部请求,并将信息写到ETCD中。 Controller Manager:执行集群级功能,例如复制组件,跟踪Node节点,处理节点故障等等。 Scheduler:负责应用调度的组件,根据各种条件(如可用的资源、节点的亲和性等)将容器调度到Node上运行。 ETCD:一个分布式数据存储组件,负责存储集群的配置信息。 在生产环境中,为了保障集群的高可用,通常会部署多个Master,如CCE的集群高可用模式就是3个Master节点。
        来自:
        帮助文档
        云容器引擎
        用户指南
        集群管理
        集群概述
        集群基本信息
      • 应用场景
        适用场景 众所周知,将传统的单体应用拆分为一个个微服务固然带来了各种好处,包括更好的灵活性、可伸缩性、重用性,但微服务也同样面临着特殊的安全需求,如下所示: 为了抵御中间人攻击,需要用到流量加密。 为了提供灵活的服务访问控制,需要用到TLS和细粒度访问策略。 为了决定哪些人在哪些时间可以做哪些事,需要用到审计工具。 面对这些需求应用服务网格提供全面的安全解决方案,包括身份验证策略,透明的TLS加密以及授权和审计工具。 价值 默认的安全性:无需修改即可保证应用程序代码和架构的安全性。 纵深防御:与现有的安全系统结合并提供多层防御。 零信任网络:在不受信任的网络上构建安全解决方案。 优势 非侵入安全:应用服务网格是以一种安全基础设施的方式向用户提供透明的安全能力,让不涉及安全问题的代码安全运行,让不太懂安全的人可以开发和运维安全的服务,不用修改业务代码就能提供服务访问安全。应用服务网格提供了一个透明的分布式安全层,并提供了底层安全的通信通道,管理服务通信的认证、授权和加密,提供Pod到Pod、服务到服务的通信安全。开发人员在这个安全基础设施层上只需专注于应用程序级别的安全性。 细粒度授权:在认证的基础上,就可以进行服务间的访问授权管理,可以控制某个服务,或者服务的一个特定接口进行授权管理。如只开放给特定的一个Namespace下的服务,或者开放给某个特定的一个服务。源服务和目标服务可以在不同的集群,甚至源服务的不同实例在不同的集群,目标服务的不同实例在不同的集群。 服务运行监控
        来自:
        帮助文档
        应用服务网格
        产品简介
        应用场景
      • Redis节点磁盘IO高负载(1)
        本章节介绍Redis节点磁盘IO高负载故障演练。 背景介绍 Redis 的高可用性和数据持久性依赖磁盘 IO。当高并发写入、数据复制或硬件瓶颈导致 IO 达到极限时,可能引起持久化延迟、主备复制滞后,甚至阻塞主进程。本演练模拟磁盘IO高负载,帮助您验证业务容错能力及 Redis 在存储瓶颈下的表现。 基本原理 在节点先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择磁盘IO高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。 块大小:控制单次读写操作的数据块大小,单位为MB。增大此值可以提升单次操作的IO压力,通常保持默认值即可。
        来自:
      • Kafka Broker节点磁盘IO高负载
        本章节介绍Kafka Broker节点磁盘IO高负载故障演练。 背景介绍 分布式消息服务 Kafka 集群的性能与稳定性高度依赖底层磁盘 IO 能力,高并发写入、集群数据复制、海量消息存储检索及磁盘故障恢复等场景易导致 Broker 节点磁盘 IO 触达瓶颈,引发消息持久化延迟等问题,本演练可测试业务系统的响应与恢复能力。 基本原理 指定或随机一个Broker节点先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式消息服务Kafka,然后单击添加资源。 3. 在弹出的对话框中,勾选目标分布式消息服务Kafka实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式消息服务Kafka。 添加实例 :单击添加实例 ,勾选上一步中添加的分布式消息服务Kafka实例。 添加故障动作 :单击立即添加 ,在列表中选择Broker 磁盘IO高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 读负载:开启读压力模式,创建一个临时文件并对其进行持续的读取操作。 写负载:开启写压力模式,持续向一个临时文件写入数据。 块大小:控制单次读写操作的数据块大小,单位为MB。增大此值可以提升单次操作的 IO 压力。通常保持默认值即可。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        中间件
        分布式消息服务Kafka
        Kafka Broker节点磁盘IO高负载
      • 快速工作流和标准工作流
        云工作流支持创建标准和快速两种模式的工作流。 本文主要介绍快速工作流和标准工作流的特点和差异, 用户可根据这些内容的介绍针对业务流程选择不同模式的工作流。 基本概念 标准(Standard)工作流具备执行步骤状态的持久化存储,支持运行长时间的工作流执行状态流转,适用于传统意义上的离线业务流程编排执行场景 快速(Express)工作流适用于流程结构简单、需要低延迟执行的工作流场景, 适用于常见的在线业务流程编排和准实时业务流程编排场景,例如微服务API编排、流式数据处理等低延迟和大负载业务场景。 工作流模式对比 执行指标 标准工作流 快速工作流 最长执行时长 365天 5分钟 执行语义 异步执行,遵循至少执行一次(At least once)语义,支持持久化,但是在特殊条件下可能会导致数据被重复处理。 同步执行 执行历史 可通过API查询指定工作流执行历史、工作流执行详情。 可通过API查询指定工作流执行历史、工作流执行详情。 服务集成 云服务集成调用模式支持如下三种集成模式。更多信息,请参见服务集成模式。 请求响应模式(RequestComplete) 等待系统回调(WaitForSystemCallback) 等待任务令牌(WaitForTaskToken) 仅支持请求响应模式(RequestComplete)
        来自:
        帮助文档
        函数计算
        用户指南
        云工作流
        流程定义
        工作流概述
        快速工作流和标准工作流
      • 功能特性
        本节介绍云等保专区产品的功能特性。 云安全中心 云安全中心系统主要包含安全态势、资产中心、风险管理、威胁管理、分析中心、告警管理、编排响应、报表中心、集成配置以及数据源监控等功能。 主机安全 为云服务器提供基于客户端的防护,提供主机系统防护与加固、主机网络防护与加固等功能,具备业界领先的勒索专防专杀、网页防篡改、网络隔离与防护、补丁修复、外设管控、文件审计、违规外联检测与阻断等主机安全能力,帮您快速发现网站潜在安全隐患。 Web应用防火墙 精准覆盖各类Web应用攻击,为客户识别恶意请求,防御未知威胁,分钟级接入实现防入侵、防扫描、防攻击、防数据泄露、防CC攻击等防护,等保必备。 下一代防火墙 提供云上互联网边界和VPC边界的防护,包括:实时入侵检测与防御、全局统一访问控制、全流量分析可视化、日志审计与溯源分析。 堡垒机 4A统一安全管控平台,为企业提供集单点登录、统一资产管理、多终端访问协议、文件传输、会话协同等功能于一体的运维管理服务。 漏洞扫描 能够对Web应用的资产进行识别分类以及对Web应用进行深度弱点探测。通过漏洞产生的原理和渗透测试的方法,快速分析出被测目标所开放的端口服务和对应的协议信息,发现资产暴露面。漏洞库覆盖国内外常见CMS、中间件、操作系统等严重漏洞,帮助用户全面分析Web应用网络环境中存在的安全弱点。
        来自:
        帮助文档
        云等保专区
        产品介绍
        功能特性
      • 云容器集群节点宕机
        本章节介绍云容器集群节点节点宕机故障演练。 背景介绍 云容器引擎(CCE)节点是集群的业务承载核心。硬件故障、系统内核异常、资源耗尽等因素,均可能导致通用节点故障。通用节点宕机会造成其上运行的业务 Pod 异常中断或漂移重建,引发业务请求失败、服务响应延迟,甚至局部服务不可用,本演练可测试系统的故障转移与业务自愈能力,提升集群及业务的整体稳定性。 基本原理 通过关闭云容器引擎纳管的节点主机,模拟节点宕机(支持Worker节点或专有版容器Master节点)。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择节点宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:故障动作的目标节点。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点宕机
      • Redis节点CPU高负载(1)
        本章节介绍Redis节点CPU高负载故障演练。 背景介绍 Redis 是高性能内存数据库,当节点 CPU 被高计算量、大量连接或复杂命令占满时,会出现响应变慢、吞吐下降,甚至主备切换。本演练通过模拟 Redis 主/备节点的高 CPU 负载,验证业务在请求超时、重试等场景下的容错能力,并检查 Redis 实例的高可用切换机制。 基本原理 在节点启动自定义程序,空跑for循环来消耗CPU时间片。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择分布式缓存服务Redis版 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标Redis 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择分布式缓存服务Redis版。 添加实例 :单击添加实例 ,勾选上一步中添加的Redis实例。 添加故障动作 :单击立即添加 ,在列表中选择CPU高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点 :注入故障的目标节点(主节点或备节点)。 CPU占用率:指定CPU负载百分比(取值 0100)。
        来自:
      • 基本概念
        关键词 说明 集群 集群指容器运行所需要的云资源组合,关联了若干服务器节点、负载均衡、专有网络等云资源。 专有版集群:需要创建1个Master(非高可用),或者3/5个Master(高可用)节点,以及若干Worker节点,可对集群基础设施进行更细粒度的控制,需要自行规划、维护、升级服务器集群。 托管版集群:只需创建Worker节点,Master节点由CCSE创建并托管,具备操作简单、低成本无需运维等特点。 节点 一台服务器(可以是虚拟机实例或者物理服务器)已经安装了Docker Engine,可以用于部署和管理容器。容器的Agent程序会被安装到节点上并注册到一个集群上。 专有网络VPC 专有网络VPC是您自己独有的云上私有网络。您可以完全掌控自己的专有网络,例如选择IP地址范围、配置路由表和网关等,您可以在自己定义的专有网络中使用天翼云资源如云服务器、云数据库和负载均衡等。 安全组 安全组是一种虚拟防火墙,具备状态检测和数据包过滤能力,用于在云端划分安全域。安全组是一个逻辑上的分组,由同一地域内具有相同安全保护需求并相互信任的实例组成。 应用目录 应用目录功能集成了Helm,提供了Helm的相关功能,并进行了相关功能扩展,例如提供图形化界面。 编排模板 编排模板是一种保存Kubernetes YAML格式编排文件的方式。 Kubernetes Kubernetes是一个开源平台,具有可移植性和可扩展性,用于管理容器化的工作负载和服务,简化了声明式配置和自动化。 容器(Container) 打包应用及其运行依赖环境的技术,一个节点可运行多个容器。 镜像(Image) 容器镜像是容器应用打包的标准格式,封装了应用程序及其所有软件依赖的二进制数据。 镜像仓库(Image Registry) 容器镜像仓库是一种存储库,用于存储Kubernetes和基于容器应用开发的容器镜像。 管理节点(Master Node) 管理节点是Kubernetes集群的管理者,运行着的服务包括kubeapiserver、kubescheduler、kubecontrollermanager、etcd组件,和容器网络相关的组件。 工作节点(Worker Node) 工作节点是Kubernetes集群中承担工作负载的节点,可以是虚拟机也可以是物理机。工作节点承担实际的Pod调度以及与管理节点的通信等。一个工作节点上的服务包括Docker运行时环境、kubelet、KubeProxy以及其它一些可选的组件。 命名空间(Namespace) 命名空间为Kubernetes集群提供虚拟的隔离作用。Kubernetes集群初始有3个命名空间,分别是默认命名空间default、系统命名空间kubesystem和kubepublic,除此以外,管理员可以创建新的命名空间以满足需求。 容器组(Pod) Pod是Kubernetes部署应用或服务的最小的基本单位。一个Pod封装多个应用容器(也可以只有一个容器)、存储资源、一个独立的网络IP以及管理控制容器运行方式的策略选项。 副本控制器(ReplicationController,RC) RC确保任何时候Kubernetes集群中有指定数量的Pod副本在运行。通过监控运行中的Pod来保证集群中运行指定数目的Pod副本。指定的数目可以是多个也可以是1个;少于指定数目,RC就会启动运行新的Pod副本;多于指定数目,RC就会终止多余的Pod副本。 副本集(ReplicaSet,RS) ReplicaSet(RS)是RC的升级版本,唯一区别是对选择器的支持,RS能支持更多种类的匹配模式。副本集对象一般不单独使用,而是作为Deployment的理想状态参数使用。 工作负载(Workload) 工作负载是在Kubernetes上运行的应用程序。 标签(Label) Labels的实质是附着在资源对象上的一系列Key/Value键值对,用于指定对用户有意义的对象的属性,标签对内核系统是没有直接意义的。标签可以在创建一个对象的时候直接赋予,也可以在后期随时修改,每一个对象可以拥有多个标签,但key值必须唯一。 服务(Service) Service是Kubernetes的基本操作单元,是真实应用服务的抽象,每一个服务后面都有很多对应的容器来提供支持,通过KubeProxy的ports和服务selector决定服务请求传递给后端的容器,对外表现为一个单一访问接口。 路由(Ingress) Ingress是授权入站连接到达集群服务的规则集合。您可以通过Ingress配置提供外部可访问的URL、负载均衡、SSL、基于名称的虚拟主机等。通过POST Ingress资源到API Server的方式来请求Ingress。Ingress Controller负责实现Ingress,通常使用负载均衡器,它还可以配置边界路由和其他前端,这有助于以高可用的方式处理流量。 配置项(ConfigMap) 配置项可用于存储细粒度信息如单个属性,或粗粒度信息如整个配置文件或JSON对象。您可以使用配置项保存不需要加密的配置信息和配置文件。 保密字典(Secret) 保密字典用于存储在Kubernetes集群中使用一些敏感的配置,例如密码、证书等信息。 卷(Volume) 和Docker的存储卷有些类似,Docker的存储卷作用范围为一个容器,而Kubernetes的存储卷的生命周期和作用范围是一个Pod。每个Pod中声明的存储卷由Pod中的所有容器共享。 存储卷(Persistent Volume,PV) PV是集群内的存储资源,类似节点是集群资源一样。PV独立于Pod的生命周期,可根据不同的StorageClass类型创建不同类型的PV。 存储卷声明(Persistent VolumeClaim,PVC) PVC是资源的使用者。类似Pod消耗节点资源一样,而PVC消耗PV资源。 存储类(StorageClass) 存储类可以实现动态供应存储卷。通过动态存储卷,Kubernetes将能够按照用户的需要,自动创建其所需的存储。 弹性伸缩(Autoscaling) 弹性伸缩是根据业务需求和策略,经济地自动调整弹性计算资源的管理服务。典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 可观测性(Observability) Kubernetes可观测性体系包含监控和日志两部分,监控可以帮助开发者查看系统的运行状态,而日志可以协助问题的排查和诊断。 Helm Helm是Kubernetes包管理平台。Helm将一个应用的相关资源组织成为Charts,然后通过Charts管理程序包。 节点亲和性(nodeAffinity) 节点亲和性指通过Worker节点的Label标签控制Pod部署在特定的节点上。 污点(Taints) 污点和节点亲和性相反,它使节点能够排斥一类特定的Pod。 容忍(Tolerations) 应用于Pod上,允许(但并不要求)Pod调度到带有与之匹配的污点的节点上。 应用亲和性(podAffinity) 应用亲和性决定应用Pod可以和特定Pod部署在同一拓扑域。例如,对于相互通信的服务,可通过应用亲和性调度,将其部署到同一拓扑域(例如同一个主机)中,以减少它们之间的网络延迟。 应用反亲和性(podAntiAffinity) 应用反亲和性决定应用Pod不与特性Pod部署在同一拓扑域。例如,将一个服务的Pod分散部署到不同的拓扑域(例如不同主机)中,以提高服务本身的稳定性。 服务网格(Istio) Istio是一个提供连接、保护、控制以及观测服务的开放平台,兼容社区Istio开源服务网格,用于简化服务的治理,包括服务调用之间的流量路由与拆分管理、服务间通信的认证安全以及网格可观测性能力。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        产品介绍
        基本概念
      • 产品动态
        时间节点 功能名称 功能描述 相关文档 2022.12.10 应用市场 应用市场,是一项对桌面内应用进行统一管理与全面管控的服务,既能帮助企业管理员对桌面内应用进行有效监管,也为企业统一分发应用、用户轻松获取应用提供了便捷的渠道。
        来自:
        帮助文档
        天翼云电脑(政企版)
        产品动态
        产品动态
      • 云主机宕机
        本章节介绍云主机宕机故障演练。 背景介绍 云主机运行过程中,硬件故障、系统内核崩溃、资源耗尽或网络异常等因素均可能引发主机宕机,进而造成业务服务中断、请求无法响应、数据处理停滞及集群负载失衡等问题,本演练可帮助验证系统的故障感知、自动切换与业务恢复能力,检验监控告警机制的有效性,为优化应急预案提供实践依据。 基本原理 通过调用云主机关机OpenAPI触发关机。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择主机宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机宕机
      • 云主机DNS不可用
        本章节介绍云主机DNS不可用故障演练。 背景介绍 DNS 服务器故障、网络配置错误或网络分区等问题,都可能导致云主机无法解析域名,进而引发服务间调用失败、无法访问外部依赖等严重后果。本演练模拟 DNS 不可用的场景,帮助您评估业务对 DNS 服务的依赖程度和系统的容错能力,提前检验和完善应急预案。 基本原理 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令。 原理是修改本地DNS解析文件或安全组(防火墙)禁用端口实现。 注意 该动作风险较大,请谨慎操作。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云主机 ,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云主机 实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云主机。 添加实例 :单击添加实例 ,勾选上一步中添加的云主机实例。 添加故障动作 :单击立即添加 ,在列表中选择DNS不可用动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 排除的域名:故障白名单,多个域名使用逗号分隔,例如test1.com,test2.com。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机DNS不可用
      • 产品功能
        分类 功能点 功能说明 总览 资源概览 可视化资源概览,全局资源统计和审计日志 注册集群 天翼云集群 一键关联天翼云容器集群,支持跨区域、跨地域集群 注册集群 三方云集群 纳管三方公有云上的 Kubernetes 集群,如阿里云(ACK)、腾讯云(TKE)、GCP (GKE)、AWS(EKS)等 注册集群 本地集群 纳管本地满足CNCF标准的IDC自建或私有云上的 Kubernetes 集群 集群管理 接入配置 通过应用 YAML 文件到目标集群,快速实现云上纳管 集群管理 操作日志 注册集群的业务日志、施工日志等关键日志信息 集群管理 集群控制台 统一管理控制台,云上云下一致性操作体验 容器舰队 集群编排 根据业务自定义舰队,一键编排,实现多集群批量管理 集群联邦 负载分发 标准 Kubernetes 及CDR的多集群动态分发 集群联邦 联邦伸缩 集群联邦可根据业务负载进行弹性伸缩
        来自:
        帮助文档
        分布式容器云平台 CCE One
        产品介绍
        产品功能
      • 通过云工作流和函数计算对视频分片转码
        方案架构 在以上操作中,我们通过应用中心创建了3个函数与1个云工作流,3个函数都挂载了Nas作为本地存储。工作流对3个函数做了编排,首先通过splitVideo函数将视频分片,随后使用foreach状态遍历分片列表,调用Transcode函数并行转码,foreach结束后,调用MergeVideo函数聚合分片。 该方案中,函数完成了视频处理的具体逻辑,工作流定义了对函数的编排和数据流转。用户只需要维护ZOS和Nas资源,ZOS作为持久化存储,Nas作为临时存储,其它资源均为serverless资源,相比传统自建方案,减少了运维成本。 此外,该方案还降低了开发难度与迭代周期,以添加通知逻辑为例,只需要在画布上简单拖动,添加通知节点即可实现。
        来自:
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • ...
      • 570
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      云聚517 · 好价翼起拼

      爆款云主机低至25.83元/年,参与拼团享更多优惠,拼成得额外优惠券

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      聚力AI赋能 天翼云大模型专项

      大模型特惠专区·Token Plan 轻享包低至9.9元起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      企业出海解决方案

      助力您的业务扬帆出海,通达全球!

      天翼云信创专区

      “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      产品推荐

      弹性云主机 ECS

      GPU云主机

      镜像服务 IMS

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      天翼云CTyunOS系统

      训推服务

      公共算力服务

      Token服务

      推荐文档

      备案信息需真实有效

      篡改防护

      还原参数组

      应用场景

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 息壤智算平台
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号