活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      专属云容器引擎_相关内容
      • 应用运维
        本文介绍如何应用运维。 云容器引擎提供从部署到运维的应用生命周期管理,应用创建完成后,您可以查看应用的运行状态、指标趋势等。 操作前提 已完成集群及应用的创建。 操作步骤 1.单击左侧导航栏的【工作负载】>【无状态】,进入无状态应用列表; 2.单击新建的nginx应用,进入应用详情页面; 3.点击【监控】页签,在监控页签下,可查看到应用实例的CPU使用量、内存使用量、网络输入输出速率。只有实例处于运行状态时,才可以查看 CPU 使用量、内存使用量。
        来自:
        帮助文档
        云容器引擎(旧版)
        快速入门
        应用运维
      • 应用场景
        本文介绍云容器引擎Serverless版的应用场景。 应用托管 Serverless集群无需购买节点即可轻松部署容器应用,无需对集群进行节点维护和容量规划,大大降低业务的基础设施管理和运维成本,提供高效的应用托管服务。 突发业务 面对有明显波峰波谷特征的业务负载,Serverless集群的秒级伸缩能力能够以最低的成本代价平滑应对流量高峰,保证业务的高可用和性能。 数据计算 面对数据分析或机器学习训练等任务,Serverless集群可以提供快速、灵活的计算资源,快速启动大量Pod实例在短时间内运行特定的计算任务,计算结束后释放自动停止计费,极大降低了整体的计算成本。 CI/CD Serverless集群可以轻松搭建各种持续集成环境,帮助用户快速构建测试环境和自动化的部署流程,同时为各种持续集成任务之间提供隔离性和安全性。
        来自:
        帮助文档
        云容器引擎 Serverless版
        产品简介
        应用场景
      • Calico网络插件
        应用场景 Calico IPIP隧道容器网络适用如下场景: 1. 性能要求不高:由于引入了额外的IPIP隧道封包解包,相对于cubecni容器网络存在大约5%15%性能损失,适用于对性能要求不是特别高的业务场景,例如访问量不大的管理后台服务等; 2. 大规模组网:由于构建的覆盖(overlay)容器网络不占用任何VPC资源,所以在容器网络层面,集群节点数不受VPC资源限制;BGP Peer默认使用全互联模式,为减少节点数上升对BGP连接数的指数级消耗,当节点数大于100时,可使用路由反射模式,引入中心化的路由反射节点,将BGP连接数增长降为O(N)增长,最大可支持1000节点规模。 容器IP地址段分配 订购使用Calico容器网络插件的集群时,由于pod网段限制了节点和pod规模,建议选择使用一个大网段。如下所示,把172.16.0.0/12作为Pod网段: 集群创建时,云容器引擎使用该网段作为Calico的私有IP地址池,如下所示: 节点网段由kubecontrollermanager分配,默认每个节点会分配到一个掩码为24的地址段,可分配网段数直接决定集群节点规模上限,例如pod网段为172.16.0.0/18,则支持添加256个节点。若不考虑其它资源限制,单个节点理论上最多可创建256个Pod。 可以通过以下方式查看节点分配的pod网段: [root@CCSEAGENTvmAggbkVfL paasdp]
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        网络
        容器网络插件
        Calico网络插件
      • 创建VPC终端节点(1)
        本章节介绍故障演练服务中创建VPC终端节点相关功能。 概述 在为弹性云主机 和云容器引擎 安装探针之前,需要先建立故障演练服务控制面与目标实例间的网络连通性,具体是通过创建VPC终端节点实现。 创建步骤 1. 登录VPC终端节点控制台。 2. 单击左侧菜单栏终端节点 ,点击页面右上角创建终端节点。 3. 服务类型 选择按服务实例ID查找服务。 4. 可用服务 中,填入故障演练专属服务实例ID (见下表),点击验证。 5. 虚拟私有云 选择目标故障演练资源所属VPC ,子网选择目标资源相关的子网。 6. 点击下一步确认订单 ,开通VPC终端节点。 服务列表 资源池 服务实例ID 服务实例名称 华东1 endpserjraeobv2mr vpcectgchaosserverhd1 西南1 endpserh1ti3dqy70 vpcectgchaosserverxn1 华北2 endpser1k6c0s0fdc vpcectgchaosserverhb2 西安7 endpserq2im8cy7tj vpcectgchaosserverxa7
        来自:
      • 创建VPC终端节点
        本章节介绍故障演练服务中创建VPC终端节点相关功能。 概述 在为弹性云主机 和云容器引擎 安装探针之前,需要先建立故障演练服务控制面与目标实例间的网络连通性,具体是通过创建VPC终端节点实现。 创建步骤 1. 登录VPC终端节点控制台。 2. 单击左侧菜单栏终端节点 ,点击页面右上角创建终端节点。 3. 服务类型 选择按服务实例ID查找服务。 4. 可用服务 中,填入故障演练专属服务实例ID (见下表),点击验证。 5. 虚拟私有云 选择目标故障演练资源所属VPC ,子网选择目标资源相关的子网。 6. 点击下一步确认订单 ,开通VPC终端节点。 服务列表 资源池 服务实例ID 服务实例名称 华东1 endpserjraeobv2mr vpcectgchaosserverhd1 西南1 endpserh1ti3dqy70 vpcectgchaosserverxn1 华北2 endpser1k6c0s0fdc vpcectgchaosserverhb2 西安7 endpserq2im8cy7tj vpcectgchaosserverxa7
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        应用管理
        探针管理
        创建VPC终端节点
      • Service实现灰度发布和蓝绿发布
        本节介绍了云容器引擎的最佳实践;Service实现灰度发布和蓝绿发布 实现云容器引擎的灰度发布,常规做法需要在集群中部署如Nginx Ingress或Traefik这样的开源工具,或者依赖服务网格的功能。这些方案在操作上可能较为复杂,对于只需简单灰度发布且不希望引入过多额外插件或复杂流程的用户来说,可以考虑利用Kubernetes自带的特性来达成目标。这样,我们不仅能实现简单的灰度发布和蓝绿发布,还能保持系统的简洁和高效。 原理介绍 用户在进行业务部署时,通常会选择利用Kubernetes中的无状态负载Deployment和有状态负载StatefulSet等对象,这些对象各自负责管理一组Pod。以Deployment为例,示意图如下: 在Kubernetes中,为了使得工作负载能够被外部访问,用户通常会为每个工作负载创建一个对应的Service。这个Service通过selector机制来匹配后端Pod,从而建立起访问路径。无论是集群内部的其他服务还是集群外部的客户端,只需访问这个Service,就能间接访问到后端Pod所提供的服务。若希望将服务对外暴露,用户只需将Service的类型设置为LoadBalancer,此时,一个弹性负载均衡器(ELB)将作为流量入口,负责将外部请求转发到后端Pod。 灰度发布原理 以Deployment为例,按照上述的方式每个Deployment创建一个Service,Service通过selector匹配后端Pod,通过Service最终访问到业务Pod。使不同Deployment的Pod被同一Service的selector选中,即表示同一Service可以访问不同Deployement的Pod。调整不同版本Deployment的副本数,即可调整路由到不同版本负载的流量比例,实现灰度发布。示意图如下:
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        发布
        Service实现灰度发布和蓝绿发布
      • 创建工作负载及服务
        本节介绍了:创建一个无状态工作负载——创建工作负载及服务的用户指引。 进入云容器引擎控制台,在集群选项卡中选择一个集群进入集群详情界面。选择工作负载 > 无状态 > 新增 选择命名空间,创建一个Deployment 配置项说明 配置项 说明 Deployment名称 工作负载的名称 数据卷(选填) 为容器提供存储,目前支持临时路径、主机路径、配置文件、本地卷(Local PV)、NFS、Ceph,还需挂载到容器的指定路径中。 实例数量 工作负载的副本数,可选择手动设置或自动伸缩。 实例内容器 工作负载中的容器实例配置,可配置一个或多个。 容器名称 容器实例的名称 镜像及镜像版本 支持选择容器镜像服务企业版、容器镜像服务个人版的镜像。 CPU/内存限制 Request用于预分配资源,当集群中的节点没有request所要求的资源数量时,容器会创建失败。Limit用于设置容器使用资源的最大上限,避免异常情况下节点资源消耗过多。 环境变量(选填) 支持配置容器的环境变量。 启动执行(选填) 启动执行命令:对应镜像的ENTRYPOINT命令,将会覆盖镜像的ENTRYPOINT命令;每个输入框仅输入一个命令或参数。 启动执行参数:对应镜像的CMD命令,将会覆盖镜像的CMD命令;每个输入框仅输入一个命令或参数。 启动后处理 容器启动后执行,注意由于是异步执行,无法保证一定在ENTRYPOINT之后运行;每个输入框仅输入一个命令或参数。 停止前处理 容器停止前执行,常用于资源清理;每个输入框仅输入一个命令或参数。 容器健康检查 存活检查:检查容器是否正常,不正常则重启实例。 就绪检查:检查容器是否就绪,不就绪则停止转发流量到当前实例。 特权级容器 容器开启特权级,将拥有宿主机的root权限。 Container安全上下文 为Container设置安全上下文,仅适用于该Container:若Pod、Container层面都设置了用户、用户组、Selinux上下文,Container的设置会覆盖Pod的设置。 访问设置 配置Service访问负载
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        快速入门
        创建一个无状态工作负载
        创建工作负载及服务
      • 获取容器Core Dump
        本节介绍云容器引擎的最佳实践:获取容器Core Dump。 应用场景 Core Dump是指当一个程序发生严重错误导致异常终止时,操作系统将该程序当前的内存状态以及其他相关信息保存到一个特殊的文件中,这个文件通常称为 core 文件或核心转储文件。core文件包含了程序在崩溃时的内存映像、CPU 寄存器状态、堆栈信息等,可以用于分析程序异常终止的原因。 在容器环境中,Core Dump的处理与传统的物理机环境略有不同,因为容器本身是在宿主机上运行的,因此需要一些特殊的配置才能捕获容器内发生的核心转储。本节介绍容器中core文件的一般处理流程和相关概念。 将Core Dump文件输出到主机目录 开启节点Core Dump 设置Core Dump文件的输出路径 echo "/tmp/cores/core.%t.%e.%p" > /proc/sys/kernel/corepattern 上述文件路径中: %t:表示coredump的时间。 %e:表示程序文件名。 %p:表示进程ID。 将Core Dump的输出路径修改为/tmp/cores,后续容器中的应用程序Core Dump文件也将输出到容器的/tmp/cores文件,因为在容器中读取的 /proc/sys/kernel/corepattern文件实质上就是主机的 /proc/sys/kernel/corepattern文件。 配置容器Core Dump和验证 通过kubectl或者控制台完成如下配置: apiVersion: v1 kind: Pod metadata: name: corevolume spec: volumes: name: coredumppath hostPath: 通过hostPath将容器Core Dump持久化在主机 path: /home/coredump containers: name: ubuntu image: ubuntu:12.04 command: ["/bin/sleep","3600"] volumeMounts: mountPath: /tmp/cores name: coredumppath 用上述方式创建Pod并进入,触发当前shell终端的段错误。 $ kubectl get pod NAME READY STATUS RESTARTS AGE corevolume 1/1 Running 0 55s $ kubectl exec it corevolume /bin/bash root@corevolume:/ kill s SIGSEGV $$ 在容器实际运行的主机上查看/home/coredump目录会生成core文件。 ls /home/coredump core.1738160312.corevolume.15
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        容器
        获取容器Core Dump
      • PyTorch分布式训练任务
        本节介绍智算集群部署Pytorch分布式训练任务。 前提条件 已开通包含GPU/NPU的Kubernetes集群。 已安装智算套件。 背景信息 本文演示如何提交一个PyTorch的分布式训练任务,相关的数据已经包含在容器镜像中。若用户自有模型或训练任务可自行下载数据集,通过使用CSI hpfs文件存储,通过PVC方式挂载进容器中使用。 操作步骤 进入云容器引擎控制台。 点击左侧【集群】进入集群列表。 点击使用的集群名称,进入集群。 点击左侧【工作负载】>【自定义资源】,选择资源浏览器,找到kubeflow.org/v1/PyTorchJob ,选择命名空间,点击新增。 在创建yaml中,填入以下信息后点击【创建】。 注意 1.GPU和昇腾NPU申请资源类型不一样,请使用对应的模板; 2.修改对应的镜像仓库地址前缀为对应资源池,可在容器镜像控制台查看,如武汉41,则修改{imagerepo}为registryvpccrswuhan41.ctyun.cn; 3. namespace: 要和界面选择的一致。 GPU模板 xml apiVersion: "kubeflow.org/v1" kind: PyTorchJob metadata: name: pytorchsamplegpu01 namespace: default spec: pytorchReplicaSpecs: Master: replicas: 1 restartPolicy: OnFailure template: spec: containers: name: pytorch image: {imagerepo}/icce/kubeflowexamplespytorchdistmnist:multi
        来自:
        帮助文档
        云容器引擎 智算版
        最佳实践
        PyTorch分布式训练任务
      • 使用限制
        本节介绍了云容器引擎的使用限制,便于用户使用前注意事项。 使用前限制 使用容器实例之前需要注意以下一些限制: 购买实例之前需要实名认证。 实例创建之后,暂不支持以下项:变更集群VPC;变更集群网络插件。 配额限制 集群类型 租户限制集群数量 单集群管理节点数量 单节点最大Pod数 例外申请方式 专有版集群 5 1000 默认110,可订购时配置自定义Kubelet参数 通过工单咨询 智算版集群 5 1000 默认110,可订购时配置自定义Kubelet参数 通过工单咨询 托管版单实例集群 2 10 默认110,可订购时配置自定义Kubelet参数 通过工单咨询 托管版高可用集群 2 几个档次可选:50/200/1000/2000 默认110,可订购时配置自定义Kubelet参数 通过工单咨询 注意 智算版集群只加载智算资源池,如有需求,请联系客户经理或者通过工单咨询。 网络插件支持多子网 cubecni 1.0.7版本支持配置多个子网,若需升级到该版本,请提工单申请。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        产品介绍
        使用限制
      • 使用存储子目录为工作负载提供存储
        本节介绍了云容器引擎的最佳实践:使用存储子目录为工作负载提供存储。 当需要将存储的特定子目录直接挂载至工作负载以实现高效数据存储时,云容器引擎提供了多种实现方式以支持该能力。 需求场景 当用户创建大容量文件存储时,为充分利用现有资源,可将不同子目录分配给多个工作负载使用。 若需实现数据层面的权限控制,可限制容器仅访问指定子目录。 对于习惯开源NFS使用方式的用户,可在已有文件存储基础上,通过为不同子目录创建独立的PVC并分配给对应工作负载,实现资源隔离。 每个工作负载拥有不同的子目录的方式便于管理,且可通过Pod名称区分子目录,提升运维效率。 方案选择 有以下两种方案: (1)复用现有存储:用户已有的存储对应一个PVC,无需额外创建PVC,可将同一PVC下的不同子目录分配给多个工作负载使用。 (2)动态分配子目录:用户使用海量文件存储时,每次可为不同工作负载动态分配一个子目录作为独立PVC。(注:此功能仅海量文件存储支持,其他存储产品不适用于子目录挂载场景。) 方案一:子目录挂载(多个子目录共享同一PVC) 在工作负载的数据存储配置界面,设置挂载路径为 /test,即存储卷将挂载至容器内的 /test 目录。子路径可选择 subPath 或 subPathExpr 模式。 subPath:简单直接,工作负载的所有副本均使用存储卷的同一子目录。 subPathExpr:支持通过环境变量动态调整子目录路径,实现同一工作负载中不同副本使用独立子目录。 若选择 subPath,直接填写子目录名称即可;若目录不存在,K8S会自动创建。若选择 subPathExpr,需按以下方式配置: 在第二个绿色箭头所指的框中,根据实际需求填写路径表达式。例如可使用 $(PODNAMESPACE)/$(PODNAME) 或 $(PODNAME),也支持自定义格式。此处以 $(PODNAMESPACE)/$(PODNAME) 为例,需确保相关变量已在环境变量中预先定义。 根据以上示例,红框处需正确填写变量名,绿框处需选择变量值的来源。即从Pod的metadata.name字段获取PODNAME变量值,从metadata.namespace字段获取PODNAMESPACE变量值,并组合为存储的子目录路径。 例如:一个两副本的无状态工作负载位于命名空间cstor下,Pod名称分别为podA和podB。按此配置后,一个副本会将PVC对应存储下的cstor/podA子目录挂载至容器内的/test路径,另一副本则挂载cstor/podB子目录至相同路径。 若通过工作负载的YAML文件实现,相关字段配置如下: plaintext volumeMounts: name: workdir1 mountPath: /logs subPathExpr: $(PODNAMESPACE)/$(PODNAME) yaml的env的设置如下: plaintext spec: containers: name: container1 env: name: PODNAME valueFrom: fieldRef: apiVersion: v1 fieldPath: metadata.name name: PODNAMESPACE valueFrom: fieldRef: apiVersion: v1 fieldPath: metadata.namespace
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        存储
        使用存储子目录为工作负载提供存储
      • 容器内获取客户端源IP
        本节介绍云容器引擎的最佳实践:容器内获取客户端源IP。 客户端真实源IP地址可以用于分析网站流量和用户行为。通过分析来源IP地址,可以了解用户的地理位置、浏览器偏好和其他用户行为指标。这些数据可以用于优化网站设计、定位目标受众和改善用户体验。 在容器化场景下,客户端和容器服务端之间可能存在多种代理服务器,外部请求在经过多次转发后,容器中服务无法获取到客户端真实源IP。 场景介绍 不同请求类型,获取客户端真实IP说明如下: 类型 说明 HTTP/HTTPS请求 通过在ELB监听器开启XForwardedFor,业务应用可以通过XForwardedFor头部提取到源地址,从而获得客户端真实IP。 TCP请求 通过在后端主机配置TOA插件获取客户端的真实源IP地址。TOA是操作系统的内核模块,需要在ELB后端主机中安装TOA插件,以实现后端主机可获取客户端真实源IP地址的目的。 对于HTTP/HTTPS请求,具体实现分为以下两类: 服务类型 说明 负载均衡 ELB访问方式,是通过弹性负载均衡ELB产品来实现负载均衡。通过创建LoadBalancer SVC时,指定注解方式开启XForwardedFor。当通过ELB访问工作负载时,可以通过XForwardedFor头部提取到源地址。 节点端口(NodePort) NodePort访问方式,是将容器端口映射到节点端口,实现获取客户端源IP有以下方式: 当配置SVC外部流量策略为Local时,表示请求不经过转发,可以获取客户端源ip; 当配置SVC外部流量策略为Cluster时,需要通过手动创建监听器及后端主机组,开启XForwardedFor实现。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        网络
        容器内获取客户端源IP
      • 节点资源预留策略
        本节介绍了:节点资源预留策略的用户指南。 云容器引擎需要占用一定的节点资源来运行相关组件(例如kubelet、kubeproxy、calico、Container Runtime等),从而使节点作为集群的一部分来运行。这会造成节点的资源总数与容器集群中可分配的资源数之间存在差异。本文介绍容器的节点资源预留策略、相关注意事项,以便在部署应用时合理设置Pod的请求资源量和限制资源量。 查询节点可分配资源 执行以下命令,查看节点的资源总量和可分配资源。 plaintext kubectl describe node [NODENAME] grep Allocatable B 7 A 6 预期输出: plaintext Capacity: cpu: 4 节点的CPU总核数。 ephemeralstorage: 123722704Ki 节点的临时存储总量,单位KiB。 hugepages1Gi: 0 hugepages2Mi: 0 memory: 7925980Ki 节点的内存总量,单位KiB。 pods: 64 Allocatable: cpu: 3900m 节点可分配的CPU核数。 ephemeralstorage: 114022843818 节点可分配的临时存储,单位KiB。 hugepages1Gi: 0 hugepages2Mi: 0 memory: 5824732Ki 节点可分配的内存,单位KiB。 pods: 64 计算节点可分配资源 可分配资源的计算公式:可分配资源(Allocatable) 总资源(Capacity)预留资源(Reserved)驱逐阈值(EvictionThreshold)
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        节点与节点池
        节点管理
        节点资源预留策略
      • 接入云容器引擎-应用日志
        本文主要介绍云日志服务如何接入云容器引擎文本日志。 本文将介绍如何在云日志服务控制台配置云容器引擎的日志接入与采集规则配置。 使用场景 云容器引擎业务日志采集功能是为用户提供的天翼云云容器引擎集群内的业务日志采集工具,可以将集群内的业务日志采集至云日志服务中进行统一存储。 日志采集功能需要为云容器引擎集群安装日志采集ctglogoperator插件并配置采集规则。采集插件安装后,日志采集器将会在集群内以 DaemonSet 的形式运行,并根据用户在云日志服务控制台配置的采集规则(包括采集源、日志单元和日志切割方式等),从采集源进行日志采集。 前提条件 已创建日志项目与日志单元,详情请参考创建日志项目与日志单元。 已创建天翼云云容器引擎。 应用日志接入步骤 1. 登录云日志服务控制台。 2. 左侧点击【日志接入】菜单,进入日志接入页面。选择“云容器引擎应用日志”进行容器接入配置。 3. 选择日志单元。 1. 点击“所属日志项目”后的目标框,在下拉列表中选择具体的日志项目,若没有所需的日志项目,点击“所属日志项目”目标框后的“新建”,在弹出的创建日志项目页面创建新的日志项目。 2. 点击“所属日志单元”后的目标框,在下拉列表中选择具体的日志单元,若没有所需的日志单元,点击“所属日志单元”目标框后的“新建”,在弹出的创建日志单元页面创建新的日志单元。 3. 单击“云容器引擎集群”后的目标框,在下拉列表中选择具体的集群。 4. 点击下一步。 4. 检查依赖项。 系统将自动检查以下检查项是否符合要求,若检测不通过,请根据页面指引进行修复。 1. 云容器引擎需要处于正常运行状态。 2. 云容器引擎已安装ctglogoperator插件且插件版本满足要求。 3. 存在名为“ccsegroup集群ID”的主机组。 4. 云容器引擎所在的VPC已创建云日志服务终端节点。 5. 配置采集规则。 对日志采集设置具体的采集规则。具体请参考[采集配置](
        来自:
        帮助文档
        云日志服务
        用户指南
        日志接入
        接入云容器引擎-应用日志
      • 使用限制
        云服务分类 云服务名称 产品控制台创建资源时是否支持绑定标签 产品控制台列表是否支持绑定和解绑标签 标签字符长度限制 标签字符内容限制 单实例默认可绑定标签个数 计算 弹性云主机 是 是 128位 首尾不包含空格 50 计算 GPU云主机 是 是 128位 首尾不包含空格 50 计算 物理机 是 是 128位 首尾不包含空格 50 计算 镜像服务 是 是 128位 首尾不包含空格 50 计算 弹性伸缩服务 是 是 128位 首尾不包含空格 50 计算 云主机快照 是 是 128位 首尾不包含空格 50 计算 SSH秘钥对 是 是 128位 首尾不包含空格 50 存储 云硬盘 是 是 128位 开头不包含空格 50 存储 弹性文件服务 否 是 128位 首尾不包含空格 50 存储 对象存储 是 是 128位 首尾不包含空格 50 存储 并行文件服务HPFS 是 是 128位 首尾不包含空格 50 存储 海量文件服务OceanFS 是 是 128位 首尾不包含空格 50 存储 云硬盘备份 是 是 128位 开头不包含空格 50 存储 云主机备份 是 是 128位 开头不包含空格 50 网络 弹性负载均衡 是 是 128位 首尾不包含空格 50 网络 共享流量包 否 是 128位 首尾不包含空格 50 网络 VPC终端节点 是 是 128位 首尾不包含空格 50 网络 NAT网关 是 是 128位 首尾不包含空格 50 网络 网关负载均衡 是 是 128位 首尾不包含空格 50 网络 内网DNS 否 是 128位 首尾不包含空格 50 网络 弹性IP 否 是 128位 首尾不包含空格 50 网络 共享带宽 否 是 128位 首尾不包含空格 50 网络 虚拟私有云 否 是 128位 首尾不包含空格 50 网络 流量镜像 否 是 128位 首尾不包含空格 50 网络 对等连接 是 是 128位 首尾不包含空格 50 网络 云间高速(标准版) 否 是 128位 首尾不包含空格 50 网络 VPN连接 否 是 128位 首尾不包含空格 50 网络 云专线CDA 是 是 128位 首尾不包含空格 50 专属云 专属云(计算独享型) 是 是 128位 首尾不包括空格 50 云原生 云容器引擎 是 是 128位 首尾不包含空格 50 云原生 容器镜像服务 否 是 128位 首尾不包含空格 50 云原生 云日志服务 否 是 128位 首尾不包含空格 50 云原生 应用性能监控 否 是 128位 首尾不包含空格 20 云原生 微服务云应用平台MSAP 否 是 128位 首尾不包含空格 50 云原生 微服务引擎API网关 否 是 128位 首尾不包含空格 20 云原生 微服务引擎微服务治理 否 是 128位 首尾不包含空格 20 云原生 微服务引擎注册配置中心 否 是 128位 首尾不包含空格 20 云原生 服务网格 否 是 128位 首尾不包含空格 50 云原生 分布式缓存服务Redis版 是 是 128位 首尾不包含空格 50 云原生 分布式消息队列RocketMQ 是 是 128位 首尾不包含空格 50 云原生 分布式消息队列RabbitMQ 是 是 128位 首尾不包含空格 50 云原生 分布式消息队列Kafka 是 是 128位 首尾不包含空格 50 云原生 分布式消息队列MQTT 是 是 128位 首尾不包含空格 50 云原生 弹性容器实例ECI 否 是 128位 首尾不包含空格 50 云原生 分布式容器云平台CCE ONE 是 是 128位 首尾不包含空格 20 云原生 Serverless容器引擎 是 是 128位 首尾不包含空格 50 云原生 函数计算 否 是 128位 首尾不包含空格 50 安全及管理 Web应用防火墙(原生版) 否 是 无限制 首尾不包含空格 50 安全及管理 服务器安全卫士(原生版) 否 是 128位 首尾不包含空格 10 安全及管理 云等保专区 否 是 128位 首尾不包含空格 50 安全及管理 数据库审计 否 是 128位 首尾不包含空格 10 安全及管理 云堡垒机(原生版) 否 是 128位 首尾不包含空格 10 安全及管理 日志审计(原生版) 否 是 128位 首尾不包含空格 10 安全及管理 秘钥管理 否 是 128位 首尾不包含空格 10 安全及管理 云密评专区 否 是 128位 首尾不包含空格 10 数据库 文档数据库服务 是 是 128位 首尾不包含空格 50 数据库 分布式关系型数据库 是 是 128位 首尾不包含空格 10 数据库 关系数据库PostgreSQL版 是 是 128位 首尾不包含空格 50 数据库 关系数据库MySQL版 是 是 128位 首尾不包含空格 50 数据库 云数据库ClickHouse版 是 是 128位 首尾不包含空格 50 数据库 关系数据库SQL Server版 是 是 128位 首尾不包含空格 50 数据库 数据传输服务DTS 否 是 128位 首尾不包含空格 50
        来自:
        帮助文档
        标签管理(一类节点)
        产品介绍
        使用限制
      • 密钥Secret的安全使用
        本节介绍云容器引擎的最佳实践:密钥Secret的安全使用。 在Kubernetes中,您可以使用Secret对象来存储敏感信息,例如密码、OAuth令牌和ssh密钥等。但Secret在etcd中以base64编码格式存储,base64编码不等于加密。因此建议用如下方式使用Secret。 严格限制Secret权限 通过文件挂载的方式使用Secret时,容器内映射的文件权限默认为0644,建议为其配置更严格的权限,例如: apiversion: v1 kind: Pod metadata: name: podauth spec: containers: name: mypod image: nginx volumeMounts: name: example mountPath: "/etc/example" volumes: name: example secret: secretName: mysecret defaultMode: 256 其中“defaultMode: 256”,256为10进制,对应八进制的0400权限。 “隐藏”Secret文件 使用文件挂载的方式时,通过配置Secret的文件名实现文件在容器中“隐藏”的效果: apiVersion: v1 kind: Secret metadata: name: mysecretfile data: .mysecretfile: dmFsdWUtMg0KDQo apiVersion: v1 kind: Pod metadata: name: mysecretfilepod spec: volumes: name: myvolume secret: secretName: mysecretfile containers: name: secretcontainer image: nginx command: ls "1" "/etc/volume" volumeMounts: name: myvolume readOnly: true mountPath: "/etc/volume" 这样.mysecretfile目录在/etc/volume/路径下通过“ls l”查看不到,但可以通过“ls al”查看到。 加密Secret文件内容 用户应在创建Secret前自行加密敏感信息,使用时再解密。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        安全
        密钥Secret的安全使用
      • 容器可观测
        本文主要介绍在云容器引擎CCE集群中,如何接入Prometheus监控以及如何在集群中查看监控大盘与设置告警规则。 前提条件 已开通应用性能监控APM。 已创建云容器引擎集群。 操作指南 步骤一:接入云容器引擎集群 Prometheus监控服务和云容器引擎服务已实现产品能力集成,您可以通过以下方式将Prometheus服务接入容器集群中。 方式1:通过云容器引擎控制台接入 新建集群接入。在创建云容器引擎时,默认会集成Prometheus服务能力,以便给用户提供容器监控能力。 已有集群接入。登录云容器引擎控制台,进入集群列表页面, 点击目标集群名称,在左侧导航栏中选择运维管理 > 监控 。再根据页面指引按步骤完成服务开通与插件安装即可。 方式2:通过Prometheus监控控制台接入 您可以通过Prometheus监控服务控制台接入云容器集群,具体操作如下: 1. 登录Prometheus监控服务控制台,左侧点击接入管理。 2. 在快速接入中,选择“容器集群监控(专有版)”或“容器集群监控(托管版)”。 3. 在配置面板,选择需要接入的集群名称,按照界面指引完成容器集群监控接入。
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        Prometheus监控
        快速入门
        容器可观测
      • (停止维护)CCE发布Kubernetes 1.13版本说明
        本文主要介绍CCE发布Kubernetes 1.13版本说明。 云容器引擎(CCE)严格遵循社区一致性认证。本文介绍CCE发布Kubernetes 1.13版本所做的变更说明。 表 v1.13版本集群说明 Kubernetes版本(CCE增强版) 版本说明 v1.13.10r0 主要特性: 负载均衡支持设置名称 4层负载均衡支持健康检查,7层负载均衡支持健康检查/分配策略/会话保持l CCE集群支持创建物理机节点(容器隧道网络) 支持AI加速型节点(搭载海思Ascend 310 AI处理器),适用于图像识别、视频处理、推理计算以及机器学习等场景 支持配置docker baseSize 支持命名空间亲和调度 支持节点数据盘划分用户空间 支持集群cpu管理策略 支持集群下的节点跨子网(容器隧道网络) v1.13.7r0 主要特性: Kubernetes同步社区1.13.7版本 支持网络平面(NetworkAttachmentDefinition) 参考链接 社区v1.11与v1.13版本之间的CHANGELOG v1.12到v1.13的变化: v1.11到v1.12的变化:
        来自:
        帮助文档
        云容器引擎
        用户指南
        集群管理
        集群概述
        集群Kubernetes版本发布说明
        (停止维护)CCE发布Kubernetes 1.13版本说明
      • 部署多个Nginx Ingress Controller
        本节介绍了云容器引擎的最佳实践:部署多个Nginx Ingress Controller。 背景信息 Nginx Ingress Controller因其开源特性和广泛应用而受到业界的青睐。在处理大型集群环境时,用户往往希望在同一集群内部署多个Nginx Ingress Controller实例,以便对不同流量进行有效管理。例如,某些服务可能需要通过公共网络对外提供服务,而另一些服务则仅供内部使用,不允许通过互联网访问。为了适应这种需求,可以通过设置两组独立的Nginx Ingress Controller,并分别与不同的ELB实例绑定,从而实现流量的精确控制和隔离。这种方法不仅提升了服务的安全性,还增强了流量管理的灵活性。 前提条件 已创建Kubernetes集群 已创建ELB实例,具体操作请参考创建负载均衡 部署新的Nginx Ingress Controller 在开通Kubernetes集群的时候,您可以选择为集群安装Ingress Controller组件,并为Ingress Controller绑定公网ELB实例。您可以通过以下步骤在Kubernetes集群再部署一套完全独立的Nginx Ingress Controller服务。 1. 获取Nginx Ingress Controller模板包 前往社区模板发布页面,选择合适版本的HelmChart包并下载,本文以ingressnginx4.7.5.tgz为例。 2. 上传模板包 登录云容器引擎控制台,进入“模板市场”,点击“我的模板”>“上传模板”。然后选择命名空间,点击“上传文件”,选择要上传的模板包,点击提交。 3. 发布模板实例 上传完模板包之后,在“我的模板”中选择刚上传的模板(ingressnginx),然后选择版本(4.7.5),然后点击发布。 填写“实例名称”,选择“集群名称”和“命名空间”。 在发布yaml文本中导入以下配置,根据说明填写相关参数(参数说明见下表“YAML参数说明”),其他未指定的参数会使用默认配置。 plaintext controller: image: registry: "registryvpccrsxxx.cnspinternal.ctyun.cn"
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        网络
        部署多个Nginx Ingress Controller
      • 插件概述
        本节介绍了插件概述的用户指南。 云容器引擎提供了多种类型的插件,方便用户选择性地安装,满足集群特定的功能需求。类型包括核心组件、应用管理、日志与监控、存储、网络等等。 插件举例: 插件名称 插件类型 插件简介 ccseschedulerplugins 核心组件 自定义调度插件:基于当前集群节点上cpu和内存真实可用的资源进行调度 cubems 应用管理 cubems可以让部署在CCSE Kubernetes集群中的Java应用接入MSE、ARMS。 ccsemonitor 日志与监控 CCSE监控插件,为 CCSE 提供指标的观测能力 ctglogoperator 日志与监控 天翼云自研基于CCSE的一站式日志插件,为CCSE提供的日志采集、存储、检索能力,具有日志数据集中存储,高效压缩,秒级检索等特性。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        插件
        插件概述
      • cstor-csi插件
        本节介绍了: cstorcsi插件的用户指南。 云容器引擎服务提供cstorcsi插件,基于Kubernetes容器存储接口(CSI),深度融合天翼云存储服务云硬盘、弹性文件存储、对象存储、并行文件和海量文件等,并完全兼容Kubernetes原生的存储服务。 插件介绍 cstorcsi插件包括cstorcsiprovisioner和cstorcsinodeplugin两部分。 cstorcsiprovisioner以无状态负载形态部署,通过将云存储服务的功能与 Kubernetes 的存储框架无缝集成,使用户能够通过 Kubernetes API 动态创建和删除存储卷,而无需直接与云存储服务进行交互; cstorcsinodeplugin以守护进程形态部署在所有节点,将存储卷与节点上的容器运行时进行集成,并提供对存储卷的挂载、卸载和快照等操作的支持,以使容器可以方便地使用存储卷提供的持久性存储功能。 版本推荐 目前CSI版本中,4.0及以上版本为新版插件,4.0以下版本为旧版插件。两版插件的实现逻辑存在差异,建议优先采用新版插件。 新版插件完全兼容旧版插件的所有功能,不存在兼容性问题。 插件安装 前提条件 大部分资源池插件安装无需配置用户AK和SK,仅少部分资源池在安装前需要配置。如需配置AK和SK,请先到天翼云门户“用户”“安全设置”“用户AccessKey”中获取AK和SK。 预付费账号请检查天翼云账户余额是否在100元以上,cstorcsi插件开通的存储为按需付费方式,需要账户余额在100元以上才可正常开通。 强烈建议使用CStorCSI的最新版本,至少选择4.0及其以上版本,越高的版本具备更多特性,更好的性能,更好的兼容性。最新CSI版本兼容之前的CSI版本。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        存储
        cstor-csi插件
      • 云容器托管Master节点宕机
        本章节介绍云容器引擎托管Master节点宕机故障演练。 背景介绍 云容器引擎(CCE)Master节点是集群控制核心,负责容器调度、资源管理等关键职责,硬件故障、系统异常、软件故障及网络中断等均可能导致其异常。Master节点宕机可能会造成集群调度失效、管控异常,波及上层业务,本演练可测试系统应对与恢复能力,提升集群及业务高可用性。 基本原理 通过关闭云容器引擎Master节点主机,模拟Master节点宕机(支持托管版本和智算版)。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择托管Master节点宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 Master节点:故障动作的目标节点。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器托管Master节点宕机
      • 云容器托管Master节点宕机(1)
        本章节介绍云容器引擎托管Master节点宕机故障演练。 背景介绍 云容器引擎(CCE)Master节点是集群控制核心,负责容器调度、资源管理等关键职责,硬件故障、系统异常、软件故障及网络中断等均可能导致其异常。Master节点宕机可能会造成集群调度失效、管控异常,波及上层业务,本演练可测试系统应对与恢复能力,提升集群及业务高可用性。 基本原理 通过关闭云容器引擎Master节点主机,模拟Master节点宕机(支持托管版本和智算版)。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择托管Master节点宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 Master节点:故障动作的目标节点。
        来自:
      • 服务条款
        本文提供用相关服务条款。 天翼云云容器引擎服务产品服务协议
        来自:
        帮助文档
        云容器引擎(旧版)
        相关协议
        服务条款
      • 集群规格推荐规划
        本节介绍云容器引擎的最佳实践:集群规格推荐规划。 集群规格规划 Kubernetes集群的稳定性受到两方面因素的影响,一方面是资源对象的数量,另一方面是节点的规格和数量。对于后者而言,选择小数量、大规格的ECS搭建集群或者大数量、小规格的ECS搭建集群都可能存在较大的隐患。因此对集群规格进行合理规划显得尤为重要。 在考虑ECS规格时,需要考虑以下因素: 网络带宽:大规格ECS的网络带宽优于小规格,适用于对带宽需求较大的应用。 网络通信:容器在同一大规格ECS内部建立链路的比例增大,可以避免跨ECS访问,减少网络开销。 容量:ECS系统需要预留一部分CPU、内存、磁盘等节点资源,用于集群管理和基础设施组件的运行。小规格ECS由于抢占资源等因素,使得集群的稳定性和可靠性降低的概率大增。 碎片化:节点资源分配时,小规格ECS更容易被少数甚至一个容器独占,导致不一致或不连续的资源需求难以有效组合,进而造成资源浪费。 镜像拉取:大规格ECS更能有效地利用容器镜像的分层机制,提升拉取镜像的效率。 ECS数量的考量因素: 小数量的ECS,在节点故障时,由于资源冗余不足,可能导致无法及时处理故障节点外排的业务。 大数量的ECS极大地考验Master的性能和稳定性。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        集群
        集群规格推荐规划
      • 续费、到期与欠费
        本节介绍了云容器引擎的续费、到期与欠费说明。 到期前续费 手动续订:对于包年/包月订购的云容器引擎,用户在资源到期前进行续费操作,可以延长原有资源到期时间,避免资源到期后冻结或超过保留期后被系统回收。详细操作请参考费用中心续订管理手动续订。 自动续订:自动续订仅针对采用包月、包年计费模式的资源,详细操作请参考费用中心续订管理自动续订。 到期处理 到期后,云容器引擎进入保留期,您将不能正常访问及使用天翼云云容器引擎。 若您在到期后15天内续费,自资源续订解冻开始,计算新的服务有效期,按照新的服务有效期计算费用; 若到期15天后您仍未续费,云容器引擎将被删除 欠费原因 在按需计费的模式下帐号的余额不足。 欠费停服说明 欠费后云容器引擎会自动停止。 如果您在15天内充值补足欠款,服务会自动启用。 当欠费超过15天,将视为您主动放弃该服务,云容器引擎将会被销毁,销毁后数据不可恢复。因此请您及时关注账户余额并及时续费以保证您的服务不受到影响。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        计费说明
        续费、到期与欠费
      • 云容器集群Pod删除
        本章节介绍云容器集群Pod删除故障演练。 背景介绍 在 CCE 中,Pod 可能因节点异常、资源争抢或误删除被删除,导致业务中断或访问失败。本演练模拟 Pod 删除,评估系统容错及自愈与告警能力。 基本原理 调用云容器引擎K8S API删除Pod。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的pod列表。 5. 在弹出的对话框中,单击添加pod。 6. 勾选您希望进行故障演练的一个或多个pod ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎Pod。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎Pod实例。 添加故障动作 :单击立即添加 ,在列表中选择Pod删除动作。 4. 此动作无需配置参数。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群Pod删除
      • 云容器集群Pod删除(1)
        本章节介绍云容器集群Pod删除故障演练。 背景介绍 在 CCE 中,Pod 可能因节点异常、资源争抢或误删除被删除,导致业务中断或访问失败。本演练模拟 Pod 删除,评估系统容错及自愈与告警能力。 基本原理 调用云容器引擎K8S API删除Pod。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的pod列表。 5. 在弹出的对话框中,单击添加pod。 6. 勾选您希望进行故障演练的一个或多个pod ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎Pod。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎Pod实例。 添加故障动作 :单击立即添加 ,在列表中选择Pod删除动作。 4. 此动作无需配置参数。
        来自:
      • 使用OceanFS动态存储卷(sharePath模式)
        本节介绍了用户指南:使用OceanFS动态存储卷(sharePath模式)。 云容器引擎支持使用天翼云海量文件存储持久卷。cstorcsi插件支持使用海量文件服务动态存储卷和静态存储卷,通过将存储卷挂载到容器指定目录下,以满足数据持久化需求。 sharePath模式是指将完整的海量文件存储作为持久卷使用。当用户挂载持久卷声明时,海量文件的根目录会被挂载到容器中。 前提条件 已创建容器集群 已在插件市场安装存储插件cstorcsi,插件版本>3.6.0,且插件正常运行。(建议使用>4.0的CSI版本) 使用限制 参见海量文件使用限制 通过控制台使用海量文件动态存储卷 1、创建存储类(StorageClass) 登录“云容器引擎”管理控制台; 在集群列表页点击进入指定集群; 进入主菜单“存储”——“存储类”,单击左上角“创建”; 在创建对话框,配置存储类StorageClass的相关参数。配置项说明如下: 配置项 说明 名称 StorageClass的名称。 存储类型 当前支持云盘、弹性文件、对象存储、并行文件、海量文件,这里选择海量文件。 具体创建页中展示的存储类型由当前资源池支持情况决定。 存储驱动 采用默认CSI驱动 模式 新建海量文件:每次创建持久卷申明时,均创建一个新的海量文件与之对应。 新建子目录:基于某个已经存在的海量文件,每次创建持久卷申明时,在这个海量文件上创建一个子目录与之对应。 计费模式 可以选择按需计费或者包年包月 回收策略 回收策略,默认为Deleted。 Retained(保留):用户可以手动回收资源。当 PVC对象被删除时,PV 卷仍然存在,对应的数据卷被视为"已释放(released)"。 Deleted(删除):对于支持 Delete 回收策略的卷插件,删除动作会将 PV对象从 Kubernetes 中移除,同时也会从外部基础设施中移除所关联的存储资产。 如果对数据安全性要求高,推荐使用Retain方式,以免误删数据。 绑定策略 绑定策略,默认为Immediate。 Immediate 模式:表示一旦创建了 PVC,也就完成了卷绑定和动态供应。 对于由于拓扑限制而非集群所有节点可达的存储后端,PV会在不知道 Pod 调度要求的情况下绑定或者制备。 WaitForFirstConsumer模式: 该模式将延迟 PV的绑定和制备,直到使用该 PVC的 Pod 被创建。 PV会根据 Pod 调度约束指定的拓扑来选择或供应。 支持扩容 默认该开关是打开的,一般也建议打开。 如果关闭该开关,则使用该存储类的pvc,无法被扩容。 挂载选项 挂载参数,用户可根据自己的情况实际定制相关参数。 注意 请务必在挂载时使用noresvport参数,该参数可以在网络故障时自动切换端口,保障网络连接,防止文件系统卡住。挂载参数的说明参见 查看这里 参数 存储类型:参数键为type,支持参数值如下: massive :容量型 可用区:选择随机,或者指定具体的某个可用区。建议与存储产品确认,哪些可用区有对应的云硬盘类型,再进行选择。 存储标签:创建存储资源时,给存储资源添加对应的标签,注意,该标签不是K8S的label,而是存储侧的资源标签,需要在存储控制台或者云资源视图查看。 参数配置完成后,点击“确定”。创建成功后,可以在存储类列表查看。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        存储
        海量文件
        使用OceanFS动态存储卷(sharePath模式)
      • 产品功能
        本节介绍了云容器引擎的产品功能。 功能特性 强大的集群管理 单集群支持数千节点规模 高性能自研网络插件,VM与容器直连互通,性能提升20% 丰富的集群插件,开箱即用 一站式容器应用管理 支持原生5种类型工作负载 内置应用模板,支持一键部署Helm应用 支持灰度发布,蓝绿发布,应用弹性伸缩 极致弹性&高效调度 支持HPA/CronHPA伸缩策略 支持基于历史指标/事件驱动的弹性伸缩 提供负载感知调度,解决原生k8s调度不均问题 企业级的安全稳定 支持3Master高可用,镜像服务高可用能力 提供集群备份恢复插件,支持多种存储介质 支持安全容器,提供镜像签名和镜像扫描 功能列表 一级分类 二级分类 功能点 功能点描述 核心功能 集群 一键快速部署 支持界面化订购,自动开通Kubernetes集群,兼容原生Kubernetes 核心功能 集群 节点管理 支持界面化进行扩缩容,支持节点标签、调度设置 核心功能 集群 命名空间 支持资源配额设置、支持网络隔离设置 核心功能 集群 运行时 支持Docker、Containerd 核心功能 工作负载 生命周期管理 支持应用创建、启停、扩缩容、注销等生命周期操作 核心功能 工作负载 工作负载 支持界面化发布有状态、无状态、守护进程、任务、定时任务等工作负载 核心功能 工作负载 多容器 支持一个Pod中发布多个容器,支持设置特权级容器 核心功能 工作负载 探针 支持界面化自定义策略检测应用的可用性 核心功能 工作负载 滚动升级 支持业务不中断平滑升级 核心功能 工作负载 亲和性/反亲和 支持主机及应用的亲和性与反亲和性调度 核心功能 工作负载 资源管控 支持容器级别的资源需求和限额设置,防止资源的浪费 核心功能 弹性调度 Pod弹性伸缩 支持自动伸缩规则设置,基于CPU/内存等资源自动伸缩应用,支持HPA、CronHPA和基于事件的弹性策略 核心功能 弹性调度 节点弹性伸缩 支持节点弹性伸缩 核心功能 弹性调度 负载感知调度 支持调度Pod时考虑节点的实际负载 核心功能 路由 多协议支持 支持TCP、UDP、HTTP以及HTTPS等协议 核心功能 路由 Service支持 支持NodePort、ClusterIP,LB等对外提供访问、支持无头服务 核心功能 路由 Ingress支持 支持Nginx Ingress 核心功能 路由 灰度/蓝绿发布 支持支持灰度/蓝绿发布,支持应用的多个版本在线运行 核心功能 配置管理 配置项 支持配置项 核心功能 配置管理 Secret 支持保密字典、凭证等 核心功能 网络 网络插件 支持高性能网络插件Calico 核心功能 网络 网络插件 支持自研网络插件CubeCNI实现容器与虚拟机网络直通 核心功能 网络 网络策略 支持容器访问策略和流控限制 核心功能 存储 多类型存储 支持Local、NFS、Ceph常见持久存储类;支持csi驱动程序,集成天翼云的云硬盘、弹性文件、对象存储等云存储 核心功能 存储 持久卷声明 支持界面化创建持久卷声明,支持监控存储使用量 核心功能 存储 持久卷 支持界面化创建持久卷,支持持久卷的动态生成 核心功能 日志管理 日志中心 支持容器日志的采集、存储和检索,支持集成三方开源日志解决方案 核心功能 监控与告警 监控中心 支持集群、节点、容器多级别的监控与告警配置,支持审计日志,支持集成三方开源监控解决方案 核心功能 系统管理 接入平台 作为平台组件对外提供服务,支持订单方式进行集群的开通、扩缩容、删除等 核心功能 系统管理 权限管理 多租户支持,租户资源隔离,用户角色授权,支持集群和命名空间的授权 高级功能 应用 插件市场 支持通过Chart对插件打包发布到插件市场,界面化一键部署监控等插件,通过插件与其他产品集成 高级功能 应用 模板市场 支持通过Chart对应用打包发布到模板市场,界面化安装部署等 高级功能 应用 有状态应用 支持挂载持久化存储,实现有状态应用容器化部署 高级功能 能力开放 OpenAPI 支持开放API,对接持续集成和私有部署系统 高级功能 高可用部署 Kubernetes高可用 支持Kubernetes高可用部署 容器镜像服务 镜像 镜像仓库 支持对接多镜像中心,支持界面化创建仓库 容器镜像服务 镜像 租户隔离 支持公开仓库的可见性及私有仓库的不可见性 容器镜像服务 镜像 镜像管理 支持管理海量镜像,支持多版本镜像 容器镜像服务 镜像 镜像收藏 支持快速检索镜像并收藏 容器安全 授权 权限管理 支持基于k8s RBAC授权 容器安全 配置安全 容器安全策略 支持SecurityContext配置
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        产品介绍
        产品功能
      • 云容器集群Pod进程挂起
        本章节介绍云容器集群Pod进程挂起故障演练。 背景介绍 在 CCE 环境中,容器内进程可能因系统调度、资源冻结或异常信号进入挂起状态。此类故障隐蔽且会导致服务中断,同时进程仍占用资源。本演练通过模拟容器内进程挂起,验证业务在此类异常下的表现与容错能力。 基本原理 通过kill STOP挂起节点上的指定进程。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的pod列表。 5. 在弹出的对话框中,单击添加pod。 6. 勾选您希望进行故障演练的一个或多个pod ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎Pod。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎Pod实例。 添加故障动作 :单击立即添加 ,在列表中选择进程挂起动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程名称:例如nginx。 容器选择模式:选择攻击pod中容器,可以“按资源定义的首个容器”,也可以“指定容器名称”,当选择指定容器名称时,需要输入容器的名称。 容器名称:填写攻击目标的容器名称
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群Pod进程挂起
      • 云容器集群Pod进程挂起(1)
        本章节介绍云容器集群Pod进程挂起故障演练。 背景介绍 在 CCE 环境中,容器内进程可能因系统调度、资源冻结或异常信号进入挂起状态。此类故障隐蔽且会导致服务中断,同时进程仍占用资源。本演练通过模拟容器内进程挂起,验证业务在此类异常下的表现与容错能力。 基本原理 通过kill STOP挂起节点上的指定进程。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的pod列表。 5. 在弹出的对话框中,单击添加pod。 6. 勾选您希望进行故障演练的一个或多个pod ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎Pod。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎Pod实例。 添加故障动作 :单击立即添加 ,在列表中选择进程挂起动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程名称:例如nginx。 容器选择模式:选择攻击pod中容器,可以“按资源定义的首个容器”,也可以“指定容器名称”,当选择指定容器名称时,需要输入容器的名称。 容器名称:填写攻击目标的容器名称
        来自:
      • 1
      • ...
      • 4
      • 5
      • 6
      • 7
      • 8
      • ...
      • 445
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      多活容灾服务

      GPU云主机

      镜像服务 IMS

      轻量型云主机

      弹性高性能计算 E-HPC

      训推服务

      AI Store

      推荐文档

      文档下载

      产品规格

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号