云主机开年特惠28.8元/年,0元秒杀等你来抢!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 天翼云新春焕新季 NEW 云主机开年特惠28.8元/年,0元秒杀等你来抢!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      天翼云云容器引擎_相关内容
      • 系统策略
        容器与中间件 云服务名称 作用范围 系统策略名称 系统策略描述 分布式消息服务Kafka 全局 KAFKA viewer 只读用户 分布式消息服务Kafka 全局 KAFKA user 管理员 分布式消息服务Kafka 全局 KAFKA admin 超级管理员 分布式消息服务RabbitMQ 全局 AMQP viewer 只读用户 分布式消息服务RabbitMQ 资源池 AMQP user 管理员 分布式消息服务RabbitMQ 全局 AMQP admin 超级管理员 分布式消息服务RabbitMQ 全局 RabbitMQ4.0只读管理员 4.0只读管理员 分布式消息服务RabbitMQ 全局 RabbitMQ4.0超级管理员 4.0超级管理员 分布式消息服务RabbitMQ 全局 RabbitMQ4.0普通管理员 4.0普通管理员 分布式消息服务RocketMQ 全局 MQ2 viewer 只读用户 容器云服务引擎CCSE 全局 MQ2 user 管理员 容器云服务引擎CCSE 全局 MQ2 admin 超级管理员 容器云服务引擎CCSE 全局 RocketMQMQ2 viewer 只读访问分布式消息服务RocketMQMQ2的权限 容器云服务引擎CCSE 全局 RocketMQMQ2 admin 分布式消息服务RocketMQMQ2管理权限 容器云服务引擎CCSE 全局 CCSE admin CCSE超级管理员权限 容器云服务引擎CCSE 全局 CCSE user CCSE管理员权限 容器云服务引擎CCSE 全局 CCSE viewer CCSE只读用户权限 微服务应用平台MSAP 全局 MSAP管理员 管理员策略 微服务应用平台MSAP 全局 MSAP普通用户 MSAP普通用户策略
        来自:
        帮助文档
        统一身份认证(一类节点)
        产品概述
        系统策略
      • POD联网使用案例
        本节介绍了POD联网使用案例的用户指南。 本文介绍如何在容器集群创建的pod中,实现访问公网。 准备工作 已创建云服务引擎集群; 已在容器集群中创建pod,该pod需要进行公网访问。 操作步骤 步骤一:确定要访问公网的pod ip,确定其所属vpc的子网网段; 步骤二:购买弹性IP; 步骤三:购买NAT网关及配置路由; 步骤四:配置SNAT规则; 步骤五:pod内测试连通性。 步骤一:确定要访问公网的pod ip,确定其所属vpc的子网网段 1、首先确定容器集群部署所用网络插件类型,步骤如下 登录天翼云“云容器引擎”管理控制台; 选择指定资源池,进去集群列表; 点击进入指定集群; 在“集群信息”“基本信息”中查看网络插件; 2、确定访问公网的pod所属vpc子网网段 以无状态部署为例: “工作负载”“无状态”,选择命名空间,进入指定deployment; 进入deployment实例详情,查看pod列表; 如果网络插件是calico,那么记录实例所在节点ip: 如果网络插件是cubecni,那么记录pod ip: 在“虚拟私有云”“子网” 中,查看上述记录ip所属ip网段;
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        网络
        POD联网使用案例
      • 容器集群网络规划
        本文介绍容器集群网络规划最佳实践。 在创建云容器引擎集群时,您需要指定虚拟私有云VPC、子网、Pod CIDR和Service CIDR。因此建议您提前规划Worker节点地址、Pod地址和Service地址。本文将介绍云容器引擎下的网络规划的规则与策略。 各网段说明 虚拟私有云VPC:提供一个逻辑隔离的区域,构建一个安全可靠、可配置和管理的虚拟网络环境。可创建子网、设置安全组。VPC和子网需要提前在VPC的创建界面创建好,之后创建云容器引擎集群时,为集群指定VPC和子网。Worker节点的内网IP,最终为子网下的一个IP地址。 Pod CIDR:Pod是Kubernetes层的容器资源,每个Pod都具有一个容器网络IP地址。创建云容器引擎集群时可以指定Pod CIDR。 Service CIDR:Service是Kubernetes的网络资源,每个Service具有一个IP地址。创建云容器引擎集群时可以指定Service CIDR。 约束与限制 当前云容器引擎采用Calico和Flannel两种网络插件,所涉及的三个网段:虚拟私有云VPC的网段、Pod CIDR所在网段,以及Service CIDR所在网段,不可重复。 网络规划 场景 1 : 单 VPC+ 单集群 这是最简单的场景,VPC和子网网段在创建时已明确,需要确认Pod CIDR、Service CIDR互不重叠,且和VPC不冲突即可。 场景 2 : 单 VPC+ 多集群 VPC和子网网段在创建时已确定,不同集群可根据用户自己的网络规划,放置在同一个子网或者多个子网里。 多个集群之间Pod CIDR不可以重叠,但是Service CIDR可以重叠。
        来自:
        帮助文档
        云容器引擎(旧版)
        最佳实践
        容器集群网络规划
      • 升级集群
        为减少安全隐患和稳定性风险,云容器引擎建议用户及时升级kubernetes版本。用户使用云容器引擎控制台升级集群的Kubernetes版本,本文介绍集群升级前后的注意事项、升级流程、操作步骤等。 升级集群的好处 云容器引擎使用kubernetes的原生v . . 版本语义,目前尚只支持4个次要版本,分别为v1.23.3, v1.25.6, v1.27.8, v1.29.3版本。云容器引擎会定期发布支持的Kubernetes版本并逐步停止对过期版本的技术支持。建议使用v1.23.3版本的用户建议尽快升级到更高版本kubernetes,已获得更好的使用体验。 主动升级集群有以下好处: 降低安全和稳定性风险:随着Kubernetes版本迭代,会不断优化及修复发现的安全及稳定性漏洞,长久使用过期版本集群会给业务带来安全和稳定性风险。 享受更好的维护支持:对于过期Kubernetes版本,云容器引擎不再提供安全补丁和问题修复,也无法保证过期版本的技术支持质量。使用新版本能够让您享受更好的技术支持和答疑服务。 使用新版本的新功能:随着社区Kubernetes版本的演进,新版本包含新的功能和改进,云容器引擎也将适配新版本,为您带来更好的开发和运维体验。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        集群
        升级集群
      • 资源管理
        本章节介绍在微服务云应用平台使用中可能会涉及的相关资源 概述 资源管理内容与环境详情里面资源列表类似,展示了已导入环境的资源信息,在导入资源列表点击导入按钮可导入新的资源,点击移除按钮可移除已导入资源,对于导入失败的资源可通过重试按钮进行重试,日志按钮可查看导入过程的详细日志。 云容器引擎 左侧导航栏,选择资源管理 > 云容器引擎。在云容器引擎列表展示了当前环境下已导入的云容器引擎资源。 点击导入按钮,列表会展示与当前环境同VPC的云容器引擎列表,勾选云容器引擎,再选择对应的部署单元,点击保存就可将资源导入。 导入失败可点击日志查看具体失败原因,也可点击重试按钮进行重试。 点击移除按钮,可移除选择的云容器引擎,在移除之前需要删除对应云容器引擎下的容器应用实例。 若云容器引擎进行节点扩容,有节点对应新的可用区,可通过编辑部署单元,修改云容器引擎与部署单元的对应关系。 ECS集群 左侧导航栏,选择资源管理 > ECS集群。在ECS集群列表展示了当前环境已创建的ECS集群资源。 集群列表界面,点击创建集群,输入集群名称后保存即可在当前环境下创建ECS集群。 集群列表界面,点击ECS集群名称,进入ECS集群详情页面,ECS集群详情页面展示了导入到集群的ECS实例列表,以及发布到ECS集群的应用列表。在ECS实例列表,点击上方导入按钮,可导入已订购的ECS实例。点击购买ECS扩容,可跳转到ECS订购界面,进行订购操作。点击操作栏移除按钮,可移除已导入的ECS实例,点击购买相同配置按钮,可跳转到ECS订购界面,自动选择与当前ECS实例同配置机器。 集群列表界面,点击操作栏删除按钮,可删除对应ECS集群,删除集群前需要先删除发布到此集群的ECS应用实例。 注意 一台ECS机器只能部署一个应用,订购ECS时根据部署应用所需资源选择规格订购。目前支持ECS发布的资源池如下:华东1、华北2、华南2、西南1、西安7。
        来自:
        帮助文档
        微服务云应用平台
        用户指南
        环境规划
        资源管理
      • 镜像加速器
        本节介绍了镜像加速器的用户指南。 概述 通过镜像加速器,用户可以拉取Docker Hub上的容器镜像。天翼云容器镜像服务提供了镜像下载加速功能,对部分常用的开源镜像下载进行加速。 前提条件 已开通天翼云弹性云主机 注意 1. 镜像加速器仅限于支持个人开发场景使用,不允许有再次封装或商业用途。 2. 仅支持通过镜像加速器拉取常用的开源镜像,不保证能够加速所有镜像,生产环境请谨慎使用。不保证百分比能拉取成功。 23 生产环境中慎重配置使用Docker Hub容器镜像地址,建议先拉取到本地,再同步到天翼云容器镜像服务。 配置Docker 1. 编辑 /etc/docker/daemon.json (如果文件不存在,则新建)。增加以下内容(注意符合 JSON 格式)后保存。 plaintext { "registrymirrors": [" } 2. 重启 Docker。 plaintext systemctl restart docker 3. 执行docker info 结果出现配置的地址则配置成功。 4. 拉取一个镜像验证,例如 docker pull nginx。 配置Containerd 针对云容器引擎主机 1. 编辑 /etc/containerd/certs.d/docker.io/hosts.toml ,替换成以下内容 : plaintext server " [host." capabilities ["pull", "resolve", "push"] 2. 重启 containerd:。 plaintext systemctl restart containerd 3. 拉取Docker Hub镜像验证是否生效。 plaintext ctr images pull docker.io/library/nginx:latest —hostsdir /etc/containerd/certs..d —plainhttp
        来自:
        帮助文档
        容器镜像服务
        用户指南
        分发交付
        镜像加速器
      • 订购智算集群
        本节介绍订购智算集群。 集群开通 您可以通过云容器引擎控制台快速创建云容器引擎(智算版)集群。 云容器引擎(智算版)集群支持GPU等异构节点的部署,基于高性能网络模型提供全方位、多场景、安全稳定的容器运行环境,您可以实现多种场景的混合部署。 约束与限制 创建节点过程中会使用域名方式从OBS下载软件包,需要能够使用云上内网DNS解析OBS域名,否则会导致创建不成功。为此,节点所在子网需要配置为 内网DNS地址,从而使得节点使用内网DNS。在创建子网时DNS默认配置为内网DNS,如果您修改过子网的DNS,请务必确保子网下的DNS服务器可以解析OBS服务域名,否则需要将DNS改成内网DNS。 集群一旦创建以后,不支持变更以下项: 变更集群类型。 变更企业项目。 变更集群的网络配置,如所在的虚拟私有云VPC、子网、容器网段、服务网段、IPv6、kubeproxy代理(转发)模式。 变更网络模型,例如“容器隧道网络”更换为“VPC网络”。 操作步骤 登录云容器引擎控制台 1. 登录云容器引擎控制台,在左侧导航栏选择集群。 2. 在集群列表页面,单击页面右上角的创建集群。 3. 选择智算版标签页。
        来自:
        帮助文档
        云容器引擎 智算版
        快速入门
        订购智算集群
      • 操作类
        本章节介绍MSAP操作类常见问题 已经订购了云容器引擎,新增环境选择不到云容器引擎? 选择不到云容器引擎可能有如下两种情况: 1、云容器引擎正在开通中或者开通失败了,需要到开通界面或云容器引擎控制台检查容器状态是否是已开通或运行中。 2、新增环境时选择的VPC和云容器引擎所属VPC不一致,需要到云容器引擎控制台,找到对应集群,进入集群信息界面查看集群所属VPC。再到新增环境界面选择和集群所属VPC一致的VPC。 删除环境不成功,提示:环境下存在部署单元,请先删除部署单元? 此提示说明要删除的环境下有应用实例、部署单元、导入资源,需要该环境的对应实例、部署单元和导入资源清理之后才能删除环境。 1. 登录微服务云应用控制台,左侧菜单栏选择“环境规划>环境管理”,点击要删除的环境,进入到环境详情。 2. 选择“资源列表”,依次切换该环境下的资源,如果存在该资源,则点击该资源复选框,点击移除,删除资源。 3. 选择“部署单元>编辑单元”,点击对应部署单元删除。 4. 最后回到“环境管理”,选择对应环境,点击右侧删除。
        来自:
        帮助文档
        微服务云应用平台
        常见问题
        操作类
      • 基本概念
        本文介绍镜像仓库基本概念。 镜像仓库是用于存储、管理docker容器镜像的场所,可以让使用人员轻松存储、管理、部署 docker 容器镜像。镜像仓库包括如下内容: 天翼云官方镜像:展示了天翼云平台上的公开镜像,您可以基于公开镜像创建应用; 我的镜像:展示了用户创建的所有镜像仓库。 本章节将为用户介绍容器镜像仓库的基本使用方法,说明【创建】>【上传】>【管理】的仓库使用流程,用户完成镜像上传后,即可在应用创建流程中通过选择【我的镜像】,使用用户自己上传的私有镜像部署应用。 注意事项 镜像仓库不扫描用户上传的镜像,不负责对用户上传的镜像进行安全性验证。上传的镜像中请不要包含未加密的口令,密码等隐私信息,以避免隐私泄露。用户从第三方网站下载公有镜像时,应确定数据来自于可信的仓库源,以避免下载到恶意软件; 如果使用自定义镜像,请确保镜像来源可信,不在容器镜像内安装不必要的软件,在升级时使用安全补丁升级镜像。使用第三方镜像,造成的后果(例如:环境不可用)用户需自己承担; 磁盘满将会导致无法上传镜像到仓库,将会有异常提示信息告知,但并不会影响其他服务;为防止其它业务(例如日志)把磁盘占满,导致仓库无法上传,建议对仓库的存储独立挂盘。 在使用之前,您需要了解以下基本概念: 镜像仓库: 提供docker容器镜像管理功能,用户在创建容器应用前,需要将应用所需的镜像上传到镜像仓库。docker镜像是一个模板,用于创建docker容器。docker提供了一个简单的机制来创建新的镜像或更新已有镜像。 (仓库)属性: 属性分为公有和私有两种。公有:任何租户、用户均可以下载。私有:仅当前租户或租户下的用户可用。
        来自:
        帮助文档
        云容器引擎(旧版)
        用户指南
        镜像仓库
        基本概念
      • DeepSeek专题导航
        图解:DeepSeek与公有云深度融合 从基础设施到智能中枢:DeepSeek如何重塑公有云服务价值链 高性能GPU云主机助力DeepSeek深度应用 天翼云SDWAN与DeepSeek超强联动,开启云上高效互联新时代 实践指南:DeepSeek驱动高效能云生态 GPU云主机/弹性云主机:零基础搭建DeepSeek云端环境指南 GPU物理机:物理机搭建DeepSeek指南 SDWAN跨境:SDWAN助力DeepSeek模型定向加速 智算容器:云容器引擎与DeepSeek融合实践 函数计算:天翼云函数计算与DeepSeek大模型 Q&A:典型问题解析与策略应对 常见问题解答
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        DeepSeek专题
        DeepSeek专题导航
      • 安全容器与普通容器
        本文主要介绍安全容器与普通容器。 安全容器和普通容器相比,它最主要的区别是每个容器(准确地说是pod)都运行在一个单独的微型虚拟机中,拥有独立的操作系统内核,以及虚拟化层的安全隔离。因为云容器引擎CCE的容器安全隔离比独立拥有私有Kubernetes集群有更严格的要求。通过安全容器,不同容器之间的内核、计算资源、网络都是隔离开的,保护了Pod的资源和数据不被其他Pod抢占和窃取。 CCE Turbo集群下单节点支持普通容器和安全容器,您可以根据业务需求选择使用,两者的区别如下: 分类 安全容器 Docker普通容器 Containerd普通容器 容器所在节点类型 物理机 虚拟机 虚拟机 容器引擎 Containerd Docker Containerd 容器运行时 Kata runC runC 容器内核 独占内核 与宿主机共享内核 与宿主机共享内核 容器隔离方式 轻量虚拟机 Cgroups和Namespace Cgroups和Namespace 容器引擎存储驱动 Device Mapper OverlayFS2 OverlayFS Pod Overhead 内存:100MiBCPU:0.1CorePod Overhead为安全容器本身资源占用。比如Pod申请的limits.cpu 0.5Core和limits.memory 256MiB,那么该Pod最终会申请0.6Core的CPU和356MiB的内存。 无 无 最小规格 内存:256MiBCPU:0.25Core安全容器的CPU核数(单位为Core)与内存(单位为GiB)配比建议在1:1至1:8之间。例如CPU为0.5Core,则内存范围建议在512MiB4GiB间。 无 无 容器引擎命令行 crictl docker crictl Pod的计算资源 CPU和内存的request和limit必须一致 CPU和内存的request和limit可以不一致 CPU和内存的request和limit可以不一致 hostnetwork 不支持 支持 支持
        来自:
        帮助文档
        云容器引擎
        用户指南
        节点管理
        节点概述
        安全容器与普通容器
      • 使用ZOS静态存储卷
        验证数据持久化 登录“云容器引擎”管理控制台; 在集群列表页点击进入指定集群; 进入主菜单“工作负载”——“有状态”,进入负载详情; 在Pod列表页,选择“远程登录”,进入到容器内执行以下命令: 1、向/ccetmp 目录下写一个文件,执行echo "Hello World" > /ccetmp/test.log 2、查看/ccetmp目录下文件,执行ls /ccetmp,预期结果如下: plaintext test.log 退出“远程登录”,对上一步中的Pod执行“销毁重建”,等待Pod重新运行正常; 对新建Pod,继续执行“远程登录”,进入到容器内查看数据。执行cat /ccetmp/test.log,预期结果如下: plaintext Hello World 登录“天翼云对象存储”管理控制台,根据PV名称查看bucket,进入bucket——文件管理,可以看到在容器内创建的文件: 下载文件并查看内容,预期结果与容器内写入数据一致。 以上步骤说明,pod删除重建后,重新挂载对象存储卷,数据仍然存在;从对象存储下载数据并与写入数据一致, 说明对象存储中的数据可持久化保存。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        存储
        对象存储(CT-ZOS)
        使用ZOS静态存储卷
      • 应用高可用部署推荐
        本节介绍云容器引擎的最佳实践: 应用高可用部署推荐。 基本原则 可参考如下几点,实现容器应用高可用部署: 1. 集群控制节点高可用,控制节点数大于等于3; 2. 集群需有多个属于不同可用区的节点,业务根据自身需求合理配置调度策略,以实现多可用区部署及资源均匀分配; 3. 创建多个在不同可用区的节点池,通过节点池做节点伸缩; 4. 工作负载实例数需大于等于2; 5. 配置工作负载的亲和性规则,让Pod尽量分布在不同可用区、不同节点上。 操作步骤 假设集群3个控制节点和3个工作节点,工作节点可用区分布如下所示: $ kubectl get node L topology.kubernetes.io/zone grep v master NAME STATUS ROLES AGE VERSION ZONE ccseagent1b54ffbc17 Ready 40m v1.25.6 cnxinan11A ccseagent59ab9e7689 Ready 38m v1.25.6 cnxinan12A ccseagenta7527e3e80 Ready 36m v1.25.6 cnxinan13A 创建工作负载,如下所示,定义两条podAntiAffinity反亲和性规则: 工作负载多实例配置可用区反亲和,参数设置如下: 权重weight:权重值越高会被优先调度,本示例设置为50; 拓扑域topologyKey:为节点标签,用于指定调度时的作用域,下述示例为topology.kubernetes.io/zone,该标签用于识别节点在哪个可用区。 标签选择labelSelector:选择Pod的标签,与工作负载本身反亲和。 工作负载多实例配置节点反亲和,参数设置如下: 权重weight:设置为50; 拓扑域topologyKey:为标签kubernetes.io/hostname,该标签值为节点名; 标签选择labelSelector:即工作负载多个实例Pod的标签,实例间反亲和。 kind: Deployment apiVersion: apps/v1 metadata: name: demo namespace: default spec: replicas: 2 selector: matchLabels: app: demo template: metadata: labels: app: demo spec: containers: name: container0 image: nginx:latest resources: limits: cpu: 300m memory: 512Mi requests: cpu: 400m memory: 512Mi affinity: podAntiAffinity: preferredDuringSchedulingIgnoredDuringExecution: weight: 50 podAffinityTerm: labelSelector:
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        容灾
        应用高可用部署推荐
      • 子账号授权
        操作步骤:为子账号授权或调整子账号权限。 注意 请提前创建好子用户,并需子用户登陆天翼云后才可以同步到云容器引擎控制台。 1、登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页。 2、在集群列表中点击需要授权的集群,进入集群管理页面。 3、在集群管理页面导航栏中选择安全管理 > 授权,进入角色授权页面。 4、点击管理权限操作单个子账号权限,或选择多个子账号后点击添加权限为多个子账号批量授权,点击后进入集群RBAC配置页面。 5、在集群RBAC配置页面中,可以对子账号已有的用户权限进行调整或为子账号新增权限,权限可以限定单个命名空间或不限制命名空间(集群权限),子账号可设置的权限有内置权限(管理员、运维人员、开发人员、受限人员)和自定义权限,选择自定义权限可选择集群中创建的任意Cluster Role进行授权。 6、点击下⼀步完成授权。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        安全管理
        子账号授权
      • 云容器集群Pod Java方法抛自定义异常(1)
        本章节介绍云容器集群Pod Java方法抛自定义异常。 背景介绍 在 CCE 环境中,业务系统多以 Java 应用运行在资源 Pod 中。本演练通过在 Pod 内注入 Java 方法自定义异常,模拟生产中的调用异常故障。 基本原理 通过Java Agent拦截指定JVM进程内方法,增加thow操作模拟抛出异常。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的pod列表。 5. 在弹出的对话框中,单击添加pod。 6. 勾选您希望进行故障演练的一个或多个Pod ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎Pod。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎Pod实例。 添加故障动作 :单击立即添加 ,在列表中选择JAVA类方法抛自定义异常动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程关键词:java进程的关键词。 类名:注入延迟的类名,带全包名。 方法名:注入延迟的方法名。 延迟时间:注入的延迟时间,单位是毫秒。 容器名称:java进程所在容器名称。
        来自:
      • 免密拉取容器镜像服务CRS镜像
        本文将介绍如何免密拉取CRS镜像。 ECI支持从天翼云容器镜像服务CRS私有镜像仓库中免密拉取镜像,以提升效率和安全性。创建ECI实例前,需要将镜像上传到对应仓库中。本文介绍如何免密拉取CRS镜像。 背景信息 天翼云容器镜像服务CRS分为个人版和企业版。其中,企业版是企业级云原生应用制品管理平台,提供容器镜像、Helm Chart以及符合OCI规范制品的生命周期管理,适用于业务大规模部署场景,帮助企业降低交付复杂度。 创建工作负载时,如果要拉取的镜像属于CRS镜像,当使用内网地址时,ECI支持免密拉取,提升效率,同时避免密码泄露的风险,加强安全性。 前提条件 确保您已经创建Serverless集群,具体操作请参阅创建Serverless集群。 确保kubectl工具已经连接目标集群。 操作步骤 1. 登录云容器引擎控制台,在控制台的左侧导航栏中点击“集群” 。 2. 在集群列表页面中单击目标集群的名称。 3. 在左侧选择“工作负载”,选择“无状态”,在右上角单击“创建Deployment”。 4. 按需配置工作负载的信息。 5. 按需配置容器,容器信息Pod中可以配置多个容器,您可以单击右侧“添加容器”为Pod配置多个容器。 1. 容器名称:为容器命名。 2. 镜像更新策略:选择是否总是拉取镜像。 3. 镜像名称:选择容器使用的镜像,支持多种镜像来源。 4. 镜像版本:选择需要部署的镜像版本。 6. 点击选择镜像,从CRS镜像仓库选择私有镜像,选择内网地址。 7. 创建完成后,进入工作负载的无状态页面,可以看到新建的k8ssidecar应用出现在无状态列表下。
        来自:
        帮助文档
        云容器引擎 Serverless版
        用户指南
        镜像
        免密拉取容器镜像服务CRS镜像
      • 内置保留字段
        内置保留字段 数据格式 说明 tagtopic 字符串 采集配置名称 tagfileName 字符串 采集路径与文件名称 tagpodIp 字符串 云容器引擎接入场景下,pod的IP地址 tagpodName 字符串 云容器引擎接入场景下,pod的名称 tagappName 字符串 工作负载名称 tagcontainerName 字符串 容器名称 taghostIp 字符串 云容器引擎宿主机IP tagnamespace 字符串 工作负载所在命名空间 taghostName 字符串 云容器引擎宿主机名称 ts 整型,Unix时间戳(毫秒) 日志采集时间 message 字符串 日志原文
        来自:
        帮助文档
        云日志服务
        用户指南
        查询与分析
        内置保留字段
      • DeepSeek专题导航
        图解:DeepSeek与公有云深度融合 从基础设施到智能中枢:DeepSeek如何重塑公有云服务价值链 高性能GPU云主机助力DeepSeek深度应用 天翼云SDWAN与DeepSeek超强联动,开启云上高效互联新时代 实践指南:DeepSeek驱动高效能云生态 GPU云主机/弹性云主机:零基础搭建DeepSeek云端环境指南 GPU物理机:物理机搭建DeepSeek指南 SDWAN跨境:SDWAN助力DeepSeek模型定向加速 智算容器:云容器引擎与DeepSeek融合实践 函数计算:天翼云函数计算与DeepSeek大模型 Q&A:典型问题解析与策略应对 常见问题解答
        来自:
        帮助文档
        天翼云SD-WAN
        DeepSeek专题
        DeepSeek专题导航
      • 云容器集群节点磁盘填充(1)
        本章节介绍云容器集群节点磁盘填充故障演练。 背景介绍 失控的日志文件、未经清理的临时数据或异常进程持续写入,都可能导致云容器引擎(CCE)节点的磁盘空间被耗尽。这种情况会直接导致Pod无法写入新数据、服务功能异常,甚至因 ephemeralstorage 压力过大而被kubelet驱逐。本演练模拟磁盘空间被占满的场景,帮助您检验系统的磁盘空间监控告警、日志轮转机制以及应用在无可用存储空间时的处理逻辑。 基本原理 通过dd命令将数据写入文件。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
      • Spark组件优化后TPC-DS测试结果
        本章节主要介绍翼MapReduce服务中Spark组件性能优化后的TPCDS测试结果。 背景介绍 集群环境 天翼云翼MapReduce Spark版本/开源Spark3.3.3版本 USED Processors/Cores/Threads: 1001+30 YARN Cores(Threads) USED Memory: 5001+60 GB YARN Memory Total Processors/Cores/Threads: (40+6)/(1040+168)/(1040+336) 关闭超线程 Total Memory: 7680+384 GBYARN Memory Master节点(3台): Processors: 2 Intel(R) Xeon(R) Gold 6348 CPU @ 2.60GHz, 28 Cores Memory: 128 GB Network: Bandwidth: 40 Gbps Storage Device: 2 480 GB SSD Disk (boot disk) 12 8 TB HDD Core节点(20台): Processors: 2 Intel(R) Xeon(R) Gold 5320 CPU @ 2.20GHz, 26Cores Memory(3 Types): 384GB(13台 16 GB 24,16台32 GB 12,1台16 GB 4+32 GB 8) Network: Bandwidth: 25 Gbps Storage Device: 2 480 GB SSD (Boot disk) 2 3.2 TB PCIE NVMe SSD (Data disk) 8 12 TB HDD 操作系统: CTyunOS 2.0.1 测试目的及重点 本测试旨在测试天翼云翼MapReduce服务下Spark计算引擎的性能。重点测试Spark引擎进行10T数据量标准TPCDS测试的QphDS@SF分数,对比开源Spark3.3.3版本的分数。 QphDS@SF分数计算公式 参数名称 计算方式 单位 已确认数值 :::::: Sq 自定义(需≥4) Stream 4 SF 测试数据量的大小 GB 10000 Q Sq 99 Queries 396 Tload 数据导入的时间 Second Tld 0.01 Sq Tload Hour Tpower Power Test时间(99条SQL运行) Second Tpt Tpower Sq /3600 Hour Ttt1 Throughput Test 1时间(并行4个99条SQL) Second Ttt2 Throughput Test 2时间(并行4个99条SQL) Second Tdm1 Maintenance Test 1时间(事务操作) Second Tdm2 Maintenance Test 2时间(事务操作) Second Ttt ( Ttt1+Ttt2 )/3600 Hour Tdm ( Tdm1+Tdm2 )/3600 Hour 测试步骤
        来自:
        帮助文档
        翼MapReduce
        组件性能
        Spark组件优化后TPC-DS测试结果
      • 基于Anything LLM实现云主机外挂Embedding模型、向量数据库的最佳实践指南
        指定宿主机核容器内服务到的端口映射,可自主选择 capadd SYSADMIN Docker 命令中的一个选项,用于给容器添加额外的 Linux 内核能力 v ${STORAGELOCATION}:/app/server/storage 服务启动数据宿主机目录和容器目录的映射 v ${STORAGELOCATION}/.env:/app/server/.env 服务启动环境变量配置文件,宿主机和容器的映射 e STORAGEDIR"/app/server/storage" 容器内的环境变量,指定服务数据在容器内存放目录 mintplexlabs/anythingllm 4. 登录Anything LLM 接入GPU物理机提供的DS模型 1. 登录Anything LLM,选择设置LLM首选项。 2. 设置“Local AI Base URL",其中”Local AI Base URL“填充GPU物理机DS地址和端口,然后保存。 Embedding模型 不同的任务需要不同的模型和数据库支持。如信息检索任务,需要 embedding 模型能准确捕捉文本语义信息,向量数据库具备高效的检索功能;对于推荐系统任务,模型要能挖掘用户和物品的潜在特征,数据库要支持快速的相似性计算。 Anything LLM支持多种Embedding模型引擎,包括AnythingLLM Native Embedder (default)、OpenAI、Azure OpenAI、LocalAi (all)、Ollama (all)、LM Studio (all)、Cohere。下面以LocalAi (all)使用BGE M3模型为例说明,其他请参考对应软件官网安装使用。 1. 创建GPU云主机并开放安全组规则。 BGE M3 是一款文本嵌入模型,在部署使用时,云主机配置会受任务类型(如推理、训练)、数据规模、并发请求数量等因素影响。如果是训练任务建议使用1张A100,其他任务可根据实际需求创建规格。创建步骤请参考创建配备GPU驱动的GPU云主机(Linux)GPU云主机用户指南创建GPU云主机 天翼云。 安全组放开Anything LLM云主机弹性IP+端口8000,参考添加安全组规则弹性云主机用户指南安全安全组配置安全组规则 天翼云。 2. 下载模型 2.1.安装依赖包 参考文档在天翼云使用vLLM运行DeepSeek的最佳实践32B等版本自定义部署DeepSeek步骤三:手动部署DeepSeek > 1.安装依赖包。 2.2.下载BGE M3模型 将以下内容保存为 modeldownload.py 文件,参数 cachedir 为模型的下载路径,您可以按需修改,需确保存储空间足够存放模型。 plaintext from modelscope import snapshotdownload modeldir snapshotdownload('BAAI/bgem3', cachedir'/root/modelpath', revision'master') 运行该文件,启动模型下载。 plaintext python modeldownload.py 2.3.运行模型 plaintext vllm serve BAAI/bgem3 servedmodelname bgem3 gpumemoryutilization 0.95 enforce 3. 配置Embedding模型引擎 4. 使用Embedding模型引擎
        来自:
        帮助文档
        弹性云主机 ECS
        最佳实践
        AIGC实践
        基于Anything LLM实现云主机外挂Embedding模型、向量数据库的最佳实践指南
      • 云容器集群Pod Java方法抛自定义异常
        本章节介绍云容器集群Pod Java方法抛自定义异常。 背景介绍 在 CCE 环境中,业务系统多以 Java 应用运行在资源 Pod 中。本演练通过在 Pod 内注入 Java 方法自定义异常,模拟生产中的调用异常故障。 基本原理 通过Java Agent拦截指定JVM进程内方法,增加thow操作模拟抛出异常。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的pod列表。 5. 在弹出的对话框中,单击添加pod。 6. 勾选您希望进行故障演练的一个或多个Pod ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎Pod。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎Pod实例。 添加故障动作 :单击立即添加 ,在列表中选择JAVA类方法抛自定义异常动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程关键词:java进程的关键词。 类名:注入延迟的类名,带全包名。 方法名:注入延迟的方法名。 延迟时间:注入的延迟时间,单位是毫秒。 容器名称:java进程所在容器名称。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群Pod Java方法抛自定义异常
      • 云容器ETCD集群节点故障
        本章节介绍云容器ETCD节点宕机故障演练。 背景介绍 云容器引擎(CCE)中,Etcd 节点是集群的分布式数据存储核心。硬件故障、系统内核异常、软件组件崩溃、网络中断及数据同步异常等因素,均可能导致 Etcd 节点故障。Etcd 节点故障会造成集群配置读写失败、状态同步异常,进而导致 Master 节点管控功能受限,Pod 调度、扩缩容等操作失效,影响上层业务稳定性,本演练可测试系统应对 Etcd 节点故障的恢复能力。 基本原理 通过停止Etcd 节点上的服务,模拟Etcd 节点故障。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择Etcd节点故障动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:故障动作的目标节点。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器ETCD集群节点故障
      • 云容器集群节点DNS篡改
        本章节介绍云容器集群节点DNS篡改故障演练。 背景介绍 DNS 篡改是一种常见的攻击手段或配置错误,它会导致域名被错误地解析到非预期的IP地址,从而在云容器引擎(CCE)环境中引发节点间流量劫持、服务访问异常或数据泄露等风险。本演练通过模拟 DNS 篡改场景,帮助您检验集群的安全防护机制、验证监控告警的有效性,并评估业务在域名解析被劫持时的表现。 基本原理 通过修改本地DNS解析文件实现。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点DNS篡改
      • 云容器集群节点磁盘填充
        本章节介绍云容器集群节点磁盘填充故障演练。 背景介绍 失控的日志文件、未经清理的临时数据或异常进程持续写入,都可能导致云容器引擎(CCE)节点的磁盘空间被耗尽。这种情况会直接导致Pod无法写入新数据、服务功能异常,甚至因 ephemeralstorage 压力过大而被kubelet驱逐。本演练模拟磁盘空间被占满的场景,帮助您检验系统的磁盘空间监控告警、日志轮转机制以及应用在无可用存储空间时的处理逻辑。 基本原理 通过dd命令将数据写入文件。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点磁盘填充
      • 云容器集群节点DNS篡改(1)
        本章节介绍云容器集群节点DNS篡改故障演练。 背景介绍 DNS 篡改是一种常见的攻击手段或配置错误,它会导致域名被错误地解析到非预期的IP地址,从而在云容器引擎(CCE)环境中引发节点间流量劫持、服务访问异常或数据泄露等风险。本演练通过模拟 DNS 篡改场景,帮助您检验集群的安全防护机制、验证监控告警的有效性,并评估业务在域名解析被劫持时的表现。 基本原理 通过修改本地DNS解析文件实现。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
      • 容器镜像服务企业版使用Helm Chart发布工作负载到容器集群
        本节介绍了容器镜像服务:容器镜像服务企业版使用Helm Chart发布工作负载到容器集群。 操作场景 将应用打包成Helm Chart,推送到容器镜像服务仓库后,发布到容器集群。 前提条件 已开通容器镜像服务企业版实例 已开通云容器引擎集群 操作步骤 准备Helm Chart 用户可以根据自身的业务需求,将涉及的Deployment、ConfigMap、Secret、Service等打包成一个Helm Chart。 使用一个nginx的helm chart作为示例。 plaintext nginxchartdemo ├── Chart.yaml ├── templates │ ├── deployment.yaml │ └── service.yaml └── values.yaml 创建Helm Chart命名空间 登录容器镜像服务控制台,选择企业版实例进入,左侧菜单Helm Chart 命名空间 ,点击创建命名空间按钮。 推送Helm Chart到容器镜像仓库。 plaintext 登录容器镜像服务 helm registry login myinstanceregistryhuabei2.crs.ctyun.cn 推送Chart helm push nginxchartdemo0.1.0.tgz oci://myinstanceregistryhuabei2.crs.ctyun.cn/mychartns 推送成功后,可以在容器镜像服务控制台查看到Chart。 在云容器引擎部署Helm Chart 登录云容器引擎控制台,点击菜单模板市场我的模板,选择容器镜像服务实例和命名空间,可以看到上一步骤上传的Helm Chart。 选择Chart指定版本后,点击发布,选择容器集群和集群的命名空间,即可把Chart部署到云容器引擎集群中。 发布后可以在模板市场模板实例看到发布后的Chart实例。
        来自:
        帮助文档
        容器镜像服务
        最佳实践
        容器镜像服务企业版使用Helm Chart发布工作负载到容器集群
      • 云容器集群节点CPU高负载
        本章节介绍云容器集群节点CPU高负载故障演练。 背景介绍 在云容器引擎(CCE)环境中,节点(Node)的 CPU 资源是所有运行其上的 Pod 的共享基础。当计算密集型应用、资源限制配置不当、或异常进程(如死循环)消耗大量 CPU 时,会导致节点 CPU 使用率持续处于高位。本演练模拟节点 CPU 资源被持续占用的高压场景,帮助您主动评估业务 Pod 在资源争抢下的表现、检验 HPA(水平Pod自动伸缩)的有效性,并为优化资源配置和应急预案提供数据支持。 基本原理 启动自定义程序,空跑for循环来消耗CPU时间片。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点CPU高负载
      • 容器组
        本节介绍了容器组的用户指南。 基本概念 容器组(Pod)是Kubernetes中最小的可部署单元。一个Pod(容器组)包含了一个应用程序容器(某些情况下是多个容器)、存储资源、一个唯一的网络IP地址、以及一些确定容器该如何运行的选项。Pod容器组代表了Kubernetes中一个独立的应用程序运行实例,该实例可能由单个容器或者几个紧耦合在一起的容器组成。 操作场景 Kubernetes集群中的Pod存在如下两种使用途径: 一个Pod中只运行一个容器。"onecontainerperpod" 是Kubernetes中最常见的使用方式。此时,您可以认为Pod容器组是该容器的wrapper,Kubernetes通过Pod管理容器,而不是直接管理容器。 一个Pod中运行多个需要互相协作的容器。您可以将多个紧密耦合、共享资源且始终在一起运行的容器编排在同一个Pod中,可能的情况有: 1、Content management systems,file and data loaders, local cache managers等 2、log and checkpoint backup,compression, rotation, snapshotting等 3、data change watchers, logtailers, logging and monitoring adapters, event publishers等 4、proxies, bridges, adapters等 5、controllers, managers,configurators, and updaters 您可以在云容器引擎中方便的管理容器组(Pod),如查看YAML、远程登录、销毁重建等操作。 前提条件 您需要存在一个可用集群,若没有可用集群,请参照集群开通中内容创建。 操作步骤及说明 1、查看YAML 1)登录云容器引擎控制台,在左侧导航栏中选择“工作负载 > 容器组” 2)单击实例列表中后的“查看YAML” 2、销毁重建 1)登录云容器引擎控制台,在左侧导航栏中选择“工作负载 > 容器组” 2)单击实例列表中后的“销毁重建 请仔细阅读系统提示,删除操作无法恢复,请谨慎操作。 说明 若Pod所在节点不可用或者关机,负载无法删除时可以在详情页面实例列表选择强制删除。请确保要删除的存储没有被其他负载使用,导入和存在快照的存储只做解关联操作。 3、远程登录 1)登录云容器引擎控制台,在左侧导航栏中选择“工作负载 > 容器组” 2)单击实例列表中后的“远程登录” 3)在弹出的对话框中点击“登录”
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        工作负载(旧版)
        容器组
      • 云容器集群节点进程挂起
        本章节介绍云容器集群节点进程挂起故障演练。 背景介绍 在云容器引擎(CCE)环境中,有时进程并不会被直接终止,而是因系统调试、资源冻结或异常信号而进入挂起状态。这同样会导致其提供的服务中断,并且比直接终止更隐蔽,因为它不会释放占用的内存等资源。本演练模拟节点上的任意进程被挂起的场景,帮助您检验 Kubernetes 的健康检查能否发现这种假死状态,并评估业务系统对服务无响应的容错能力。 基本原理 通过kill STOP挂起节点上的指定进程。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点进程挂起
      • 云容器集群节点进程挂起(1)
        本章节介绍云容器集群节点进程挂起故障演练。 背景介绍 在云容器引擎(CCE)环境中,有时进程并不会被直接终止,而是因系统调试、资源冻结或异常信号而进入挂起状态。这同样会导致其提供的服务中断,并且比直接终止更隐蔽,因为它不会释放占用的内存等资源。本演练模拟节点上的任意进程被挂起的场景,帮助您检验 Kubernetes 的健康检查能否发现这种假死状态,并评估业务系统对服务无响应的容错能力。 基本原理 通过kill STOP挂起节点上的指定进程。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
      • 云容器ETCD集群节点故障(1)
        本章节介绍云容器ETCD节点宕机故障演练。 背景介绍 云容器引擎(CCE)中,Etcd 节点是集群的分布式数据存储核心。硬件故障、系统内核异常、软件组件崩溃、网络中断及数据同步异常等因素,均可能导致 Etcd 节点故障。Etcd 节点故障会造成集群配置读写失败、状态同步异常,进而导致 Master 节点管控功能受限,Pod 调度、扩缩容等操作失效,影响上层业务稳定性,本演练可测试系统应对 Etcd 节点故障的恢复能力。 基本原理 通过停止Etcd 节点上的服务,模拟Etcd 节点故障。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择Etcd节点故障动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 故障节点:故障动作的目标节点。
        来自:
      • 1
      • ...
      • 7
      • 8
      • 9
      • 10
      • 11
      • ...
      • 330
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      天翼云新春焕新季

      云主机开年特惠28.8元/年,0元秒杀等你来抢!

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      GPU云主机

      轻量型云主机

      弹性高性能计算 E-HPC

      训推服务

      公共算力服务

      应用托管

      一站式智算服务平台

      推荐文档

      支持的监控指标

      云间高速的优势

      导入数据

      全面了解天翼云⑨:远程桌面无法复制粘贴

      配置目的端

      完成授权

      概念

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号