活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      Serverless容器服务_相关内容
      • CCE容器存储(everest)
        本文主要介绍CCE容器存储(everest)插件。 插件简介 CCE容器存储(everest)是一个云原生容器存储系统,基于CSI(即Container Storage Interface)为Kubernetes v1.15.6及以上版本集群对接云存储服务的能力。 该插件为系统资源插件,kubernetes 1.15及以上版本的集群在创建时默认安装。 约束与限制 集群版本由v1.13升级到v1.15后,v1.13版本集群中的Flexvolume容器存储插件(storagedriver)能力将由v1.15的CSI插件(Everest,插件版本v1.1.6及以上)接管,接管后原有功能保持不变。 插件版本为1.2.0的Everest优化了使用OBS存储时的 密钥认证功能 ,低于该版本的Everest插件在升级完成后,需要重启集群中使用OBS存储的全部工作负载,否则工作负载使用存储的能力将受影响! v1.15及以上版本的集群默认安装本插件,v1.13及以下版本集群创建时默认安装storagedriver插件。 安装插件 本插件为系统默认安装,若因特殊情况卸载后,可参照如下步骤重新安装。 步骤 1 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件管理”,在右侧找到 everest ,单击“安装”。 步骤 2 该插件可配置“单实例”、“高可用”或自定义规格。 Everest插件包含以下容器,您可根据需求自定义调整规格: everestcsicontroller:由Deployment形式部署,Pod中含有一个everestcsicontroller容器,此容器负责存储卷的创建、删除、快照、扩容、attach/detach等功能。若集群版本大于等于1.19,everestcsidriver组件的Pod还会默认带有一个everestlocalvolumemanager容器,此容器负责管理节点上的lvm存储池及localpv的创建。 说明 选择自定义规格时,everestcsicontroller内存配置推荐如下。 Pod和PVC的数量均小于2000时,everestcsicontroller的内存上限推荐配置为600Mi。 Pod和PVC的数量均小于5000时,everestcsicontroller的内存上限推荐配置为1Gi。 everestcsidriver:由DaemonSet形式部署,Pod中含有一个基本容器everestcsidriver容器,负责PV的挂载、卸载、文件系统resize等功能。若集群所在区域支持nodeattacher,everestcsidriver组件的Pod还会带有一个everestnodeattacher的容器,此容器负责分布式attach EVS,该配置项在部分Region开放。 说明 选择自定义规格时,everestcsidriver内存限制推荐配置不低于300Mi。若该值太小可能导致插件实例容器启动异常,从而导致插件不可用的情况。 步骤 3 参数配置。 everest 1.2.26以上版本针对大批量挂EVS卷的性能做了优化,提供了如下3个参数供用户配置。 csiattacherworkerthreads:everest插件中同时处理挂EVS卷的worker数,默认值为“60”。 csiattacherdetachworkerthreads:everest插件中同时处理卸载EVS卷的worker数,默认值均为“60”。 volumeattachingflowctrl:everest插件在1分钟内可以挂载EVS卷的最大数量,此参数的默认值“0”表示everest插件不做挂卷限制,此时挂卷性能由底层存储资源决定。 上述三个参数由于存在关联性且与集群所在局点的底层存储资源限制有关,当您对大批量挂卷的性能有要求(大于500EVS卷/分钟)时,请联系后台工程师,在指导下进行配置,否则可能会因为参数配置不合理导致出现everest插件运行不正常的情况。 步骤 4 单击“安装”。 版本记录 CCE插件版本记录 插件版本 支持的集群版本 :: 1.3.28 /v1.(192123)./ 1.3.22 /v1.(192123)./ 1.3.20 /v1.(192123)./ 1.3.17 /v1.(192123)./ 1.3.8 /v1.23./ 1.3.6 /v1.23./ 1.2.55 /v1.(15171921)./ 1.2.53 /v1.(15171921)./ 1.2.51 /v1.(15171921)./ 1.2.44 /v1.(15171921)./ 1.2.42 /v1.(15171921)./ 1.2.30 /v1.(15171921)./ 1.2.28 /v1.(15171921)./ 1.2.27 /v1.(15171921)./ 1.2.13 /v1.(151719)./ 1.2.9 /v1.(151719)./ 1.2.5 /v1.(151719)./ 1.1.12 /v1.(1517)./ 1.1.11 /v1.(1517)./ 1.1.8 /v1.(1517)./ 1.1.7 /v1.(1517)./
        来自:
        帮助文档
        云容器引擎
        用户指南
        插件管理
        CCE容器存储(everest)
      • 产品定义
        本文为您介绍容器安全卫士的产品定义及安全能力。 容器安全卫士是作用于容器集群的安全防护产品,提供了对容器环境下,业务动态及静态安全风险的事前发现、事中预警、事后溯源的安全闭环。可方便快捷的解决业务容器化后带来的安全问题。 容器安全卫士产品主要安全能力包括:深度资产清单、实时风险发现、快速安全防护、及时事后溯源。 深度资产清单 对容器集群等基础资产可进行自动清点,在此基础上,还会进一步识别容器进程、容器挂载、容器端口、容器软件等深度资产信息,并会进行全资产的关联,便于分析。 实时风险发现 针对静态风险,会识别漏洞、恶意文件、软件许可、风险软件、敏感信息等全面的风险。针对动态风险,采用触发式的方式,实时监测业务产生的所有行为,并进行智能研判,快速预警。 快速安全防护 基于相关能力可快速定位风险影响范围,同时提供详细的风险信息,帮助用户对风险进行判断,确定风险后,可立即进行加白、隔离等快速安全防护处置。 及时事后溯源 由于容器特性,在容器消逝后,运行过程中的行为数据不再保留。容器安全卫士不但会记录正在运行业务的容器及相关信息,对已经消逝的容器也会对其详细行为信息进行保留,以防止事后发现安全事件无法溯源的问题。
        来自:
        帮助文档
        容器安全卫士
        产品介绍
        产品定义
      • 设置容器生命周期回调
        本文介绍ECI实例如何设置容器生命周期回调。 ECI实例支持为容器配置生命周期回调,主要包括容器类应用的生命周期事件应采取的动作,分为以下两类: 启动后处理(PostStart):在容器被创建之后,此回调会被调用。但是不能保证回调会在容器入口点(ENTRYPOINT)之前执行。 停止前处理(PreStop):在容器被终止之前,此回调会被调用。 如果容器已经处于Terminated或者Finished状态,则对 preStop 回调的调用将失败。在用来停止容器的 TERM 信号被发出之前,回调必须执行结束。容器组的终止宽限周期在 PreStop 回调被执行之前即开始计数, 所以无论回调函数的执行结果如何,容器最终都会在终止宽限期内被终止。 配置说明 1.在弹性容器实例控制台左侧导航栏中选择“容器组”,进入容器组列表页。 2.点击“创建弹性容器组”,进入弹性容器实例订购页。 3.在容器设置的高级设置中设置生命周期回调。其中包括“启动后处理”和“停止前处理”回调,设定当容器被创建后将执行的命令,以及容器被终止之前将执行的命令。
        来自:
        帮助文档
        弹性容器实例
        用户指南
        通过ECI控制台使用ECI
        容器
        设置容器生命周期回调
      • 跨账号实例同步
        本节介绍了跨账号容器镜像实例同步授权及手动和自动方式跨账号实例同步的用户指南。 概述 当您想将一个账号下的镜像同步到另一个账号时,您可以使用跨账号实例同步功能。跨账号实例同步功能不受地域限制,支持手动和自动的方式。 前置条件 使用跨账号实例同步功能,请确保您使用的实例是企业版。个人版实例不支持此功能。 跨账号实例同步授权 本文假设源实例所在账号为A账号,目标实例所在的账号为B账号。创建跨账号实例同步规则和任务前,目标实例所在的B账号需要给源实例所在的A账号授权。 1. 获取A账号ID,登录账号A进入IAM控制台,路径:"概览" "账号信息" "账号ID"。 2. 获取目标实例ID,登录账号B进入容器镜像服务控制台,路径: "容器镜像服务" "实例列表" "实例列表名称/ID"。 3. 创建委托账号,登录账号B进入IAM控制台,在左侧导航栏,选择委托,然后点击创建委托。选择类型 账号委托,点击下一步。 委托名称:crsCrossAccoutSyncRole 委托的账号ID:填写A账号ID 4. 创建跨账号同步委托策略,登录账号B进入IAM控制台。在左侧导航栏选择策略管理,然后点击创建自定义策略。填写策略名称,点击下一步。 5. 选择JSON视图,根据实际情况替换以下内容中的Resource字段,然后将以下内容复制到文档框中,点击保存。 说明 可以配置多个CRS实例,以下内容以两个实例为例。 plaintext { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "crs:inst:createsyncrule" ], "Resource": [ "ctrn:crs:: :instance/ " ] }, { "Effect": "Allow", "Action": [ "crs:inst:createsyncrule" ], "Resource": [ "ctrn:crs:: :instance/ " ] } ] } 6. 为委托账号crsCrossAccoutSyncRole授权。 7. 登录账号B进入IAM控制台。 8. 在左侧导航栏,选择委托。 9. 找到名称为crsCrossAccoutSyncRole的委托,选择操作 授权。 10. 勾选上一步中创建的委托策略,例如:CRS跨账号同步委托策略,点击下一步。默认是全局服务资源,无需选择指定资源池,点击确定按钮,完成授权。
        来自:
        帮助文档
        容器镜像服务
        用户指南
        实例导入与同步
        跨账号实例同步
      • 使用DNAT暴露公网服务
        本文为您介绍如何使用使用DNAT暴露公网服务。 NAT网关介绍 弹性容器实例对外提供服务的方式有三种,eip、elb、dnat,您可以按需进行选择使用。 NAT网关(CTNAT Gateway)是一种支持 IP 地址转换的网络云服务,能够为虚拟私有云(Virtual Private Cloud,CTVPC)内的计算实例提供网络地址转换(Network Address Translation),分为公网NAT网关和私网NAT网关两种。公网NAT网关使多个弹性云主机可以共享使用弹性IP访问Internet或使多个弹性云主机提供互联网服务;私网NAT网关可将源、目的网段地址转换为VPC私网中转IP地址,通过使用中转IP实现VPC内的计算实例与其他VPC、云下IDC的指定地址隔离互访。详细信息查看天翼云官网NAT网关帮助文档。 ECI弹性容器实例接入DNAT最佳实践 1. 创建公网nat网关。 2. 为vpc添加路由表,指定0.0.0.0/0的下一跳地址为刚刚创建的nat网关。 3. 为公网nat网关创建DNAT规则。 1. 控制台创建时,选择手动输入自定义地址。 2. openapi创建时,指定virtualMachineType为2,serverType为VM,详细接口请参考创建dnat规则文档。 4. 访问nat网关绑定的eip+externalPort即可访问对应服务。
        来自:
        帮助文档
        弹性容器实例
        最佳实践
        使用DNAT暴露公网服务
      • 网络模型概述
        网络模型为集群内Pod分配IP地址并提供网络服务,CCE支持容器隧道网络、VPC网络,你可在创建集群时进行选择。 选择网络模型 下表介绍了CCE所支持的网络模型,您可根据实际业务需求进行选择。 说明: 集群创建成功后,网络模型不可更改,请谨慎选择。 表网络模型对比 对比维度 容器隧道网络 VPC 网络 数据面依赖 OVS IPVlan,VPC路由 适用集群 CCE集群 虚机集群 CCE集群 虚机集群 是否支持网络策略 (networkpolicy) 是 否 IP地址管理 IP地址可迁移 每个节点分配一个小子网。 在VPC Router上添加静态路由,下一跳为节点IP。 网络性能 基于vxlan隧道封装,有性能损耗。 无隧道封装,性能好,媲美主机网络。 跨节点通过VPC Router转发。 组网规模 最大可支持2000节点 受限VPC路由表能力。 外部依赖 无 依赖VPC Router静态路由表能力。 适用场景 一般容器业务场景。 对网络时延、带宽要求不是特别高的场景。 对网络时延、带宽要求高。 容器与虚机IP互通,使用了微服务注册框架的,如Dubbo、CSE等。 说明: VPC网络集群实际支持规模受限于VPC的路由表路由条目配额,创建前请提前评估集群规模。 VPC网络模型默认支持容器与同一VPC的虚拟机直接互访,与其他VPC的主机在配置对等连接策略后可以支持直接互访。此外,云专线/VPN等混合组网场景在合理规划后可以支持对端直接与容器互访。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        网络管理
        网络模型
        网络模型概述
      • 纳管节点
        前提条件 支持纳管符合如下条件的云主机: 待纳管节点必须状态为“运行中”,未被其他集群所使用,且不携带 CCE 专属节点标签CCEDynamicProvisioningNode。 待纳管节点需与集群在同一虚拟私有云内(若集群版本低于1.13.10,纳管节点还需要与CCE集群在同一子网内)。 待纳管节点需挂载数据盘,数据盘需满足至少有1块,容量不少于100GB。关于节点挂载数据盘的操作说明,请参考新增磁盘。 待纳管节点规格要求:CPU必须2核及以上,内存必须4GB及以上,网卡有且仅能有一个。 如果使用了企业项目,则待纳管节点需要和集群在同一企业项目下,不然在纳管时会识别不到资源,导致无法纳管。 批量纳管仅支持添加相同规格、相同可用区、相同数据盘配置的云主机。 操作步骤 步骤 1 登录CCE控制台,进入要纳管节点的集群。 步骤 2 在左侧列表中选择节点管理,单击右上角纳管节点。 步骤 3 配置节点参数。 计算配置 表 计算配置参数 参数 参数说明 节点规格 单击添加已有云主机,选择要纳管的服务器。 可以选择多台云主机批量纳管,但批量纳管仅支持添加相同规格、相同可用区、相同数据盘配置的云主机。 如果云主机有多块数据盘,需要选择其中一块作为供容器运行时和Kubelet组件使用。 容器引擎 CCE集群支持Docker。 操作系统 公共镜像:请选择节点对应的操作系统。 登录方式 密码 用户名默认为“root”,请输入登录节点的密码,并确认密码。登录节点时需要使用该密码,请妥善管理密码,系统无法获取您设置的密码内容。 密钥对选择用于登录本节点的密钥对,支持选择共享密钥。密钥对用于远程登录节点时的身份认证。若没有密钥对,可单击选项框右侧的“创建密钥对”来新建。 存储配置 配置节点云主机上的存储资源,方便节点上的容器软件与容器应用使用。 表 存储配置参数 参数 参数说明 系统盘 直接使用云主机的系统盘。 数据盘 至少需要一块数据盘 ,供容器运行时和Kubelet组件使用,该数据盘不能被删除卸载,否则会导致节点不可用。 单击后方的“展开高级设置”可设置自定义空间分配:勾选后可定义容器运行时在数据盘上占用的空间比例,容器运行时的空间用于存放容器运行时工作目录、容器镜像数据以及镜像元数据。数据盘空间分配详细说明请参见数据盘空间分配说明。 其他数据盘默认情况直接创建为裸盘,不做任何处理。您也可以展开高级配置,将磁盘挂载到指定目录。另外还可以作为持久存储卷或临时存储卷,具体使用请参见本地持久存储卷和临时存储卷。 高级配置 表 高级配置参数 参数 参数说明 K8S标签 单击“添加标签”可以设置附加到Kubernetes 对象(比如Pods)上的键值对,最多可以添加10条标签使用该标签可区分不同节点, 可结合工作负载的亲和能力实现容器Pod调度到指定节点的功能。 详细请参见Labels and Selectors。 资源标签 通过为资源添加标签,可以对资源进行自定义标记,实现资源的分类。 CCE服务会自动帮您创建CCEDynamicProvisioningNode节点id的标签。 污点(Taints) 默认为空。 支持给节点加Taints来设置反亲和性,每个节点最多配置10条Taints,每条Taints包含以下3个参数: Key:必须以字母或数字开头,可以包含字母、数字、连字符、下划线和点,最长63个字符;另外可以使用DNS子域作为前缀。 Value:必须以字符或数字开头,可以包含字母、数字、连字符、下划线和点,最长63个字符。 Effect:只可选NoSchedule,PreferNoSchedule或NoExecute。须知l Taints配置时需要配合Pod的toleration使用,否则可能导致扩容失败或者Pod无法调度到扩容节点。 节点池创建后可单击列表项的“编辑”修改配置,修改后将同步到节点池下的已有节点。 最大实例数 节点最大可以正常运行的实例数(Pod),该数量包含系统默认实例,取值范围为16~256。 该设置的目的为防止节点因管理过多实例而负载过重,请根据您的业务需要进行设置。 安装前执行脚本 请输入脚本命令,大小限制为0~1000字符。 脚本将在Kubernetes软件安装前执行,可能导致Kubernetes软件无法正常安装,需谨慎使用。 安装后执行脚本 请输入脚本命令,大小限制为0~1000字符。 脚本将在Kubernetes软件安装后执行,不影响Kubernetes软件安装。 步骤 4 单击“下一步:规格确认”,确认已阅读并知晓服务协议,并单击“提交”。
        来自:
        帮助文档
        云容器引擎
        用户指南
        节点管理
        纳管节点
      • 安全容器与普通容器
        本文主要介绍安全容器与普通容器。 安全容器和普通容器相比,它最主要的区别是每个容器(准确地说是pod)都运行在一个单独的微型虚拟机中,拥有独立的操作系统内核,以及虚拟化层的安全隔离。因为云容器引擎CCE的容器安全隔离比独立拥有私有Kubernetes集群有更严格的要求。通过安全容器,不同容器之间的内核、计算资源、网络都是隔离开的,保护了Pod的资源和数据不被其他Pod抢占和窃取。 CCE Turbo集群下单节点支持普通容器和安全容器,您可以根据业务需求选择使用,两者的区别如下: 分类 安全容器 Docker普通容器 Containerd普通容器 容器所在节点类型 物理机 虚拟机 虚拟机 容器引擎 Containerd Docker Containerd 容器运行时 Kata runC runC 容器内核 独占内核 与宿主机共享内核 与宿主机共享内核 容器隔离方式 轻量虚拟机 Cgroups和Namespace Cgroups和Namespace 容器引擎存储驱动 Device Mapper OverlayFS2 OverlayFS Pod Overhead 内存:100MiBCPU:0.1CorePod Overhead为安全容器本身资源占用。比如Pod申请的limits.cpu 0.5Core和limits.memory 256MiB,那么该Pod最终会申请0.6Core的CPU和356MiB的内存。 无 无 最小规格 内存:256MiBCPU:0.25Core安全容器的CPU核数(单位为Core)与内存(单位为GiB)配比建议在1:1至1:8之间。例如CPU为0.5Core,则内存范围建议在512MiB4GiB间。 无 无 容器引擎命令行 crictl docker crictl Pod的计算资源 CPU和内存的request和limit必须一致 CPU和内存的request和limit可以不一致 CPU和内存的request和limit可以不一致 hostnetwork 不支持 支持 支持
        来自:
        帮助文档
        云容器引擎
        用户指南
        节点管理
        节点概述
        安全容器与普通容器
      • 云容器集群Pod进程停止
        本章节介绍云容器集群Pod进程停止故障演练。 背景介绍 在 CCE 中,Pod 容器内进程若意外终止,可能导致业务中断和 Pod 重建。本演练模拟进程终止,评估系统容错及自愈与告警能力。 基本原理 通过kill 9停止节点上的指定进程。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的pod列表。 5. 在弹出的对话框中,单击添加pod。 6. 勾选您希望进行故障演练的一个或多个pod ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎Pod。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎Pod实例。 添加故障动作 :单击立即添加 ,在列表中选择进程停止动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程关键词:例如nginx。 停止进程的方式:强制结束表示使用 SIGKILL (信号9),优雅结束表示使用 SIGTERM (信号15) 容器选择模式:选择攻击pod中容器,可以“按资源定义的首个容器”,也可以“指定容器名称”,当选择指定容器名称时,需要输入容器的名称。 容器名称:填写攻击目标的容器名
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群Pod进程停止
      • 操作类
        本文向您介绍一站式智算服务平台操作类常见问题。 平台已预置的模型有哪些? 进入模型服务模块,选择在线服务,点击【预置服务】,可以看到平台预置的模型,平台预置了多款等基础大模型,包括通义千问、Llama、ChatGLM 等系列,可以直接使用。不同的基础模型的参数和能力不同,我们将持续推出不同能力方向的模型。 平台提供的开发工具有哪些? JupyterLab和Visual Studio Code (VSCode)。 GPU模型脚本如何迁移到昇腾NPU上? 新建脚本train.py,写入以下原GPU脚本代码。 添加以下库代码。 import time import torch ...... import torchnpu from torchnpu.npu import amp 导入AMP模块 from torchnpu.contrib import transfertonpu 使能自动迁移 IDE无法打开图片或预览MD文件,该怎么办? 无法在IDE打开图片或预览MD文件,这是由于浏览器设置问题,需要开启Chrome浏览器 的 unsafelytreatinsecureoriginassecure 功能。 进入Chrome Flag管理界面配置: chrome://flags/ unsafelytreatinsecureoriginassecure。 一站式服务平台预置的镜像有哪些? 进入智算资产模块,选择我的镜像,点击【系统内置镜像】,可以看到平台内置的镜像,包括PyTorch、TensorFlow等。 如果在自定义镜像列表看不到容器镜像服务分享过来的镜像,怎么办? 请进行以下检查: 容器镜像服务所选区域与平台是不是同资源池。 截止时间是不是大于等于当前时间,超出截止时间后共享失效。 共享镜像状态是不是启用。
        来自:
        帮助文档
        一站式智算服务平台
        常见问题
        操作类
      • 使用K8s配置项替换配置文件
        本章节介绍如何使用K8s配置项替换配置文件 概述 当您选择使用Kurbenetes进行容器化部署时,可以使用配置项去保存一些不需要加密的配置信息,如JVM堆内存、JVM属性参数等,在创建或者部署应用时,系统会自动将配置信息直接注入到容器中。 在微服务云应用平台场景下,这种配置管理方式变得更加灵活和强大。微服务云应用平台不仅支持上述的配置注入,还允许您将配置项以文件的形式直接挂载到容器内的指定目录。这意味着,除了能够动态调整应用的运行参数外,您还可以确保这些配置信息以文件的形式存在,这不仅方便了日常的管理和维护工作,也使得在需要时更新配置或进行故障排查变得更为直观和高效,从而显著提升了整体的运维体验和工作效率。 前提条件 1. 您已开通微服务云应用平台 2. 您已订购一个云容器引擎实例 常用使用场景 覆盖目录下已经存在的文件 这里以常用的nginx镜像举例,在官方的nginx镜像中,/etc/nginx目录下的nginx.conf文件是需要配置的,并且在不同的环境下,该文件内容也不相同。此时,可以使用将配置项以文件形式挂载到容器指定目录下,覆盖原文件,来实现不同环境使用不同配置的效果。 首先需要创建K8s配置项,左侧导航栏,选择容器应用实例 > Kubernetes配置,进入到配置列表,点击左上角创建配置项。需要注意的是:配置项下的键值对映射,键是文件名称,值为文件内容。 挂载配置项,左侧导航栏,选择容器应用实例 > 应用发布 > 应用实例。在应用实例列表选择需要覆盖的应用,进入应用详情界面,点击上方新增版本按钮,进入应用配置界面,在配置管理模块下配置文件挂载。 在配置管理中,可以通过挂载文件的方式,向容器中注入配置信息。需要注意的是,在挂载文件路径中,需要填写到文件名称。如下图所示: 参数 描述 配置类型 目前只支持配置项。 挂载类型 挂载到文件。 挂载源 挂载到应用容器文件系统中的配置项的名称。 挂载主目录 设置容器的挂载主目录,必须以斜杠(/)开头。 文件挂载方式 保留原文件:保留原目录下的文件,添加本次挂载文件。注意,相同文件名将保留本次挂载文件,隐藏原目录重名文件。 挂载配置 要挂载的Key:需要挂载到应用容器文件系统中的配置项指定的Key。挂载文件路径:相对挂载主目录的子路径。
        来自:
        帮助文档
        微服务云应用平台
        快速入门
        使用K8s配置项替换配置文件
      • 容器舰队管理
        关联权限 1. 登录分布式容器云平台,在左侧导航栏选择 联邦舰队 > 舰队管理,在舰队管理页签下选择目标舰队栏中单击 关联权限;或者进入舰队详情页,单击 修改权限。 2. 显示目前舰队已关联权限列表,选择 修改舰队权限,修改权限信息: 1. 用户名 2. 命名空间:权限作用的命名空间。 3. 关联权限:关联已有权限;或者自定义权限,在左侧导航栏选择 平台服务 > 权限管理 进行操作,自定义权限内容,选择资源对象和操作类型。 3. 权限关联:舰队权限配置将同步舰队下所有成员集群。若舰队权限未配置,新签发子账号默认拥有只读权限。权限管理基于Kubernetes RABC控制体系的资源权限定义 加入联邦 1. 登录分布式容器云平台,在左侧导航栏选择 联邦舰队 > 舰队管理,在舰队管理页签下选择目标舰队栏中单击 加入联邦。 2. 列表中选择已有集群联邦,若还无可用联邦实例,请先在联邦控制台创建。 移除集群 1. 登录分布式容器云平台,在左侧导航栏选择 联邦舰队 > 舰队管理,在舰队管理页签下选择目标舰队进入舰队详情页。 2. 选择目标集群,单击集群右侧 移出舰队。
        来自:
        帮助文档
        分布式容器云平台 CCE One
        用户指南
        容器舰队
        容器舰队管理
      • 日志管理概述
        本文主要介绍云日志服务的日志管理概述。 登录云日志服务控制台,您可在日志管理页查看资源统计、日志应用、日志项目、日志单元等信息。 资源统计 资源统计展示当前账号、当前资源池下,所有日志的标准存储量、读写流量、加工流量与转储流量,以及这些指标的日环比数据。 详细信息,请参考资源统计。 日志应用 当前支持接入云主机应用文本日志与云容器引擎应用日志。详情请见接入云主机文本日志与接入云容器引擎应用日志。 日志项目列表 可查看当前创建的所有日志项目与日志单元,并可进行新建、收藏等操作。详情请见管理日志项目与管理日志单元。
        来自:
      • 添加Sidecar容器
        云应用引擎 支持在应用中添加Sidecar容器,以增强主应用容器的功能。Sidecar容器可以用于实现监控和日志收集等非业务功能的解耦与标准化。通过这种方式,您可以将一些辅助性任务从主应用容器中分离出来,使主应用容器更加专注于其核心业务逻辑。 功能入口 场景不同,操作入口也有所不同 创建应用 1. 登录云应用引擎控制台,在左侧导航栏选择应用管理>应用列表,然后选择单击创建应用 2. 在应用基本信息向导页面进行配置后,单击下一步:高级设置。 对正在运行的应用进行变更 1. 登录云应用引擎控制台,在左侧导航栏选择应用管理>应用列表,然后单击目标应用名称 2. 在目标应用的基础信息页面,单击部署应用 注意 重新部署应用后,该应用将会被重启。为避免业务中断等不可预知的错误,请在业务低峰期执行部署操作 对已停止的应用进行变更 1. 登录云应用引擎控制台,在左侧导航栏选择应用管理>应用列表,然后单击目标应用名称 2. 在目标应用的基础信息页面,单击部署应用 添加Sidecar容器指引 展开Sidecar容器区域,单击+添加按钮弹出的Sidecar容器 面板,按照以下步骤完成添加: 1. 自定义Sidecar容器名称 2. 配置拉取镜像的地址 3. 为Sidecar容器设置CPU资源上限和内存资源上限 说明 Sidecar容器与主应用容器共享CPU和内存资源。为了确保主容器的正常运行,请合理设置Sidecar容器的最大可使用资源上限,避免其过度占用资源。 4. (可选) 单击高级设置 ,按需为Sidecar容器配置以下参数。 1. 在启动命令区域为Sidecar容器配置启动命令。 2. 在环境变量区域为Sidecar容器配置容器环境中需要运行的变量。 3. 在配置管理区域通过挂载ConfigMap配置文件的方式,向Sidecar容器中注入所需的配置信息。 4. 在共享临时存储区域,设置临时存储目录,并将其挂载到主应用容器和Sidecar容器中 说明 临时存储名称只能包含小写字母、数字和短划线()。
        来自:
        帮助文档
        云应用引擎
        用户指南
        应用管理
        应用配置
        添加Sidecar容器
      • 并行文件概述
        本节介绍了用户指南: 并行文件概述。 云容器引擎支持使用天翼云并行文件存储卷。cstorcsi插件支持使用并行文件动态存储卷和静态存储卷,通过将并行文件存储卷挂载到容器指定目录,可满足数据持久化需求。 并行文件服务提供高性能并行文件存储,支持全NVMe闪存与RDMA技术,最高可实现百万级IOPS和百GBps吞吐量,同时保障亚毫秒级延迟。该服务具备高性能、高可靠性和高可扩展性特点,能够充分满足影视渲染、AI训练及自动驾驶等数据密集型场景的需求。 使用限制 插件版本 使用并行文件存储功能,需要cstorcsi插件版本 >3.3.2 容器集群 当前并行文件服务功能仅智算集群可见 文件协议 当前cstorcsi插件仅支持HPFSPOSIX协议 容量 单个文件系统最小容量为512GB 可用区 协议类型为hpfs时,不支持跨可用区挂载。 使用并行文件存储PVC的Pod将会被强制调度到该PVC创建时指定的的可用区内 其他限制 参见 并行文件使用限制 产品优势 共享访问 1. 支持上千台客户端挂载同一文件系统,实现共享访问。 2. 支持 NFS、HPFSPOSIX 协议类型,用户能够在创建文件系统时指定协议类型,通过标准 POSIX 接口访问数据,无缝适配主流应用程序进行数据读写。 3. 支持 MPII/O 并行计算接口,满足多客户端并行计算场景。 弹性扩展 1. 采用可扩展的元数据架构,单个文件系统可支持几十亿级别的文件数量,在海量文件场景下,仍然保持稳定持续的高效访问性能。 2. 分钟级别快速扩容,用户可根据实际需要对文件系统进行在线扩容,扩容过程 IO 不中断,保障业务连续性。 安全可信 1. 支持使用 VPC 用户隔离、权限组等安全管理功能进行访问权限控制,保障数据安全可靠。 2. 使用多种 EC 方式、热备盘备份保证数据的可靠性。 3. 支持 HA,故障时自动切换,服务可用性在99.90%及以上。 性能优越 1. 可支持高性能100GE 以太网、IB、RoCE 网络。 2. 带宽、IOPS 性能可以随文件系统容量线性提升,最高提供百万 IOPS 和百 GBps 吞吐,同时保证亚毫秒级时延,使得数据访问更加高效。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        存储
        并行文件(CT-HPFS)
        并行文件概述
      • 网页防篡改、容器安全与主机安全共用Agent吗?
        本章介绍网页防篡改、容器安全与主机安全共用Agent。 是的。同一服务器安装一次Agent即可满足网页防篡改、容器安全与主机安全所有版本的使用,无需多次安装。
        来自:
        帮助文档
        企业主机安全
        常见问题
        Agent问题
        网页防篡改、容器安全与主机安全共用Agent吗?
      • HelmChart命名空间
        本节介绍了HelmChart命名空间的用户指南。 概述 HelmChart命名空间,是管理镜像仓库的一个逻辑概念。 创建Helm Chart命名空间 1. 进入容器镜像服务控制台。 2. 点击已开通实例名称,左侧导航栏点击"Helm Chart" "命名空间",点击页面的创建Helm Chart命名空间按钮。 3. 填写命名空间名称;选择是否自动创建仓库 ,即是否可以通过推送Chart(helm push)自动创建Chart仓库。 1. 当自动创建仓库设置为开启时,选择默认仓库类型 ,即自动创建仓库的类型;如果设置为公开 ,则可以匿名拉取,请谨慎设置。 4. 点击创建,创建成功后会出现在Helm Chart命名空间的列表中。 删除Helm Chart命名空间 1. 进入容器镜像服务控制台 。 2. 点击已开通实例名称。左侧导航栏点击"Helm Chart" "命名空间" 。点击需要删除的命名空间所在行的删除按钮,并勾选确认删除该命名空间 。 注意 删除命名空间将会删除该命名空间下的所有Chart仓库且不可恢复,请谨慎操作。
        来自:
        帮助文档
        容器镜像服务
        用户指南
        命名空间与镜像仓库
        HelmChart命名空间
      • 容器与节点时区同步
        本节介绍云容器引擎的最佳实践:容器与节点时区同步。 背景说明 使用Dockerfile构建容器镜像时,若未指定时区配置,那么构建的容器有可能会使用UTC时间。在云容器引擎中使用该容器镜像构建工作负载时就有可能出现容器实例与云容器引擎的节点时间不一致,相差8小时的现象。 云容器引擎的所有节点统一中国CST时间(UTC+8), 登录节点执行date R指令进行查看: [root@0000000gwcgp0q8ads ~] date R Sat, 06 Apr 2024 18:37:16 +0800 验证Pod实例的工作容器当前时间可以使用kubectl指令,例如查看default命名空间下,名为kubiamannual的pod工作容器时间: 使用kubectl exec指令可查看pod的工作负载容器当前的时间: [root@0000000gwcgp0q8ads ~] kubectl exec kubiamanual n default date R Sat, 06 Apr 2024 10:37:18 +0000 工作容器的时间戳时区为+0000,代表使用的是标准UTC时间, 中国CST时间比标准UTC时间多8个小时 解决该问题有两种方法: 1、构建容器镜像时配置时区 2、通过云容器引擎控制台进行配置 构建容器镜像时配置时区 以Dockerfile方式构建镜像为例,在镜像的Dockerfile中增加以下语句: RUN cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime 通过云容器引擎控制台进行配置 云容器控制台可以通过数据卷的方式,将节点的/etc/localtime文件挂载到Pod的工作容器实例中,以此实现时区信息同步,具体操作步骤如下: 1、登录云容器引擎控制台 2、进入【集群】【工作负载】界面,找到待处理的pod名称,点击【全量替换】按钮 全量替换 3、增加一个主机目录类型的数据卷,设置主机路径为/etc/localtime 数据卷 4、为工作容器增加挂载点 挂载点 提交更改后,容器实例会重启,使用与节点相同的时区配置; 通过云容器引擎创建新的工作负载时,可以使用的操作方法:以数据卷的方式将节点的/etc/localtime挂载到容器实例的/etc/localtime,实现节点与容器实例时间同步。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        容器
        容器与节点时区同步
      • 云容器集群节点进程终止
        2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎节点。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎节点实例。 添加故障动作 :单击立即添加 ,在列表中选择进程终止动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程名称:例如nginx。 停止进程的方式:强制结束表示使用 SIGKILL (信号9),优雅结束表示使用 SIGTERM (信号15) 3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到终止进程动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务请求量、应用提供服务平均响应时间指标。 2、业务应用验证: 如果被终止的是一个由 systemd 管理的服务,执行 systemctl status [服务名]。服务的状态会显示为 inactive (dead) 或 failed,并可能看到其自动重启的记录。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点进程终止
      • 云容器集群节点进程终止(1)
        2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎节点。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎节点实例。 添加故障动作 :单击立即添加 ,在列表中选择进程终止动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 进程名称:例如nginx。 停止进程的方式:强制结束表示使用 SIGKILL (信号9),优雅结束表示使用 SIGTERM (信号15) 3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到终止进程动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务请求量、应用提供服务平均响应时间指标。 2、业务应用验证: 如果被终止的是一个由 systemd 管理的服务,执行 systemctl status [服务名]。服务的状态会显示为 inactive (dead) 或 failed,并可能看到其自动重启的记录。
        来自:
      • 流式文件处理
        本章节主要介绍如何使用函数流实现流式大文件处理。 背景与价值 Serverless Workflow由于自身可编排、有状态、持久化、可视化监控、异常处理、云服务集成等特性,适用于很多应用场景,比如: 复杂度高需要抽象的业务(订单管理,CRM 等) 业务需要自动中断 / 恢复能力,如多个任务之间需要人工干预的场景(人工审批,部署流水线等) 业务需要手动中断 / 恢复(数据备份 / 恢复等) 需要详细监控任务执行状态的场景 流式处理(日志分析,图片 / 视频处理等)当前大部分 Serverless Workflow 平台更多关注控制流程的编排,忽视了工作流中数据流的编排和高效传输,上述场景创建函数流触发器中,由于数据流相对简单,所以各大平台支持都比较好,但是对于文件转码等存在超大数据流的场景,当前各大平台没有给出很好的解决方案。FunctionGraph函数工作流针对该场景,提出了 Serverless Streaming 的流式处理方案,支持毫秒级响应文件处理。 技术原理 FunctionGraph函数工作流提出 Serverless Streaming 的流式可编排的文件处理解决方案,步骤与步骤之间通过数据流驱动,更易于用户理解。本章通过图片处理的例子解释该方案的实现机制。 如果需要驱动一个工作流执行,工作流系统需要处理两个部分: 控制流:控制工作流的步骤间流转,以及步骤对应的 Serverless 函数的执行。确保步骤与步骤之间有序执行。 数据流:控制整个工作流的数据流转,通常来说上一个步骤的输出是下一个步骤的输入,比如上述图片处理工作流中,图片压缩的结果是打水印步骤的输入数据。 在普通的服务编排中,由于需要精准控制各个服务的执行顺序,所以控制流是工作流的核心部分。然而在文件处理等流式处理场景中,对控制流的要求并不高,以上述图片处理场景举例,可以对大图片进行分块处理,图片压缩和加水印的任务不需要严格的先后顺序,图片压缩处理完一个分块可以直接流转到下一个步骤,而不需要等待图片压缩把所有分块处理完再开始加水印的任务。 基于上述理解,FunctionGraph工作流的 Serverless Streaming 方案架构设计如下图所示: 在 Serverless Streaming 的流程中,弱化控制流中步骤之间的先后执行顺序,允许异步同时执行,步骤与步骤之间的交互通过数据流驱动。其中数据流的控制通过 Stream Bridge 组件来实现。同时函数 SDK 增加流式数据返回接口,用户不需要将整个文件内容返回,而是通过 gRPC Stream 的方式将数据写入到 Stream Bridge,Stream Bridge 用来分发数据流到下一个步骤的函数 Pod 中。
        来自:
        帮助文档
        函数工作流
        用户指南
        函数流管理
        流式文件处理
      • 云硬盘概述
        维度 弹性文件服务 对象存储 云硬盘 概念 弹性文件服务提供了一个高度可扩展的文件系统,可在云环境中共享文件数据。具有高可用性、持久性和可靠性。 对象存储具有高度的可扩展性和耐久性,可以存储任意类型的海量数据,并且能够自动处理数据冗余、故障恢复和数据分发。 云硬盘提供了高性能、低延迟、可扩展的块级存储。云硬盘可以被挂载到弹性云主机或物理机上,使其能够持久化地存储数据。 存储方式 弹性文件服务采用文件存储方式。文件存储将数据组织为层次化的目录和文件结构,用户可以通过文件路径和名称来操作文件和目录。 对象存储将数据存储为独立的对象。每个对象由数据本身和与之相关的元数据(例如文件名、文件类型、大小等)组成。 云硬盘采用块存储方式。块存储将数据分为固定大小的块(通常为几KB或几MB),并通过唯一的块地址进行访问。 访问方式 弹性文件服务通过网络共享的方式进行访问。用户可以在需要的弹性云主机实例或容器实例上挂载文件系统,并通过标准的文件系统接口(如NFS、SMB等)访问共享的文件系统。 对象存储需要指定桶地址,通过HTTP或HTTPS等传输协议进行访问。 云硬盘类似于PC机的硬盘,无法单独使用,通常通过挂载(Mount)的方式来访问。它可以被挂载到弹性云主机或物理机上,使其在操作系统中可见。 适用场景 如应用程序的配置文件、日志文件等需要共享的文件数据以及在容器化应用中支持多个容器实例之间的数据共享和同步。 如大数据分析,数据湖,数据备份和归档等大规模数据存储和分析场景;静态网站托管解决方案存储。 如作为弹性云主机或物理机的数据存储介质进行数据存储和持久化;大规模数据处理与分布式计算等高性能计算场景。 容量 弹性文件服务可按需扩展,单文件系统容量默认最大为32TB。如需更大容量的文件系统,可提工单申请。 对象存储服务没有容量限制,存储资源可无限扩展。 云硬盘支持按需扩容,最小扩容步长为1 GB,单个云硬盘可由10 GB扩展至32 TB。 是否支持数据共享 是 是 是 是否支持远程访问 是 是 否
        来自:
        帮助文档
        弹性云主机 ECS
        用户指南
        云硬盘
        云硬盘概述
      • Kubernetes 1.31版本说明
        Kubernetes 1.30 版本Changelog 1. Pod 调度就绪机制(GA),通过 spec.schedulingGates 字段,允许用户在 Pod 创建后动态控制其调度时机。例如,当存储卷或网络策略未准备好时,Pod 可被标记为 “未就绪”,避免无效调度导致的资源浪费。 2. Pod 拓扑分布最小域(GA),在 PodTopologySpread 中新增 minDomains 参数,要求 Pod 至少分布在指定数量的拓扑域(如可用区)。若当前域不足,Pod 将暂停调度,触发自动缩放器创建新节点,确保高可用性。 3. 基于索引的 Job 回退机制(Beta),支持为索引 Job 的每个任务索引单独配置重试策略(.spec.backoffLimitPerIndex),避免因单个索引失败导致整个 Job 终止。适用于分布式训练等需细粒度控制的场景。 4. 基于容器资源的 HPA(GA),Horizontal Pod Autoscaler 可根据 Pod 内单个容器的 CPU / 内存使用情况进行扩缩容,而非依赖 Pod 整体指标。例如,优先对关键容器(如数据库主节点)设置更严格的扩缩容阈值。 5. 负载均衡器 IP 模式(Beta), LoadBalancer 类型的 Service 新增 .status.loadBalancer.ingress.ipMode 字段,用于指定负载均衡器IP的转发行为。该字段仅在指定了.status.loadBalancer.ingress.ip字段时才能被指定。 6. 多服务 CIDR 支持(Alpha),允许为集群配置多个 Service ClusterIP 地址段(通过 ServiceCIDR 资源),扩展服务 IP 地址空间,满足复杂网络拓扑需求。 7. 基于 CEL 的准入控制(GA),该特性支持通过CEL表达式声明资源的验证准入策略。 8. ImageMaximumGCAge(Beta),允许kubelet配置对未使用镜像被垃圾回收前的最大存活时间,即在达到指定时间后若镜像仍然未被使用,那么镜像将可被垃圾收集机制清理。默认值为"0s",即不设置时间限制)。 更多信息请参考:Kubernetes 1.30 Changelog
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        集群
        集群概述
        Kubernetes版本发布记录
        Kubernetes 1.31版本说明
      • CTCCL-Slowdetect简介
        CTCCLSlowdetect是天翼云自研的用于大模型训练中慢节点检测的工具套件,需配合CTCCL0.4.0及以上使用。 功能介绍 CTCCLSlowdetect1.0.0工具套件架构如图所示,包括三个模块。 · ctccm:跨节点的集中式慢节点诊断工具。部署在和所有训练任务节点网络互通的节点上,每个大模型训练任务只需部署一个ctccm服务。负责收集汇总和集中发现与定位慢节点问题。 · ctcclprofilercomm:通信域级别集合通信信息统计工具。在每个训练任务所在的节点/容器内安装ctcclprofilercomm插件,在训练任务的脚本中import相关库并调用API接口使用,负责获得训练任务的通信域任务拓扑,以及收集通信域级别的超时集合通信操作事件,提供给ctccm进行慢节点分析诊断。 · ctcclprofilernet:机间通信边缘诊断工具。在每个训练任务所在的节点/容器内部署ctcclprofilernet服务,每个训练任务节点都需要部署1个独享的ctcclprofilernet服务。负责在边缘处理与初步诊断机间通信数据。 在大模型训练任务中使用CTCCLSlowdetect1.0.0工具套件,能够实现大模型训练过程中通信原因与非通信原因的慢节点检测。在发现集群中慢节点存在时,自动化开启全量集合通信操作事件监控,进一步分析定位慢节点。
        来自:
        帮助文档
        训推服务
        用户指南
        训推加速
        慢节点检测工具套件 CTCCL-Slowdetect
        CTCCL-Slowdetect简介
      • 资源管理
        本章节介绍在微服务云应用平台使用中可能会涉及的相关资源 概述 资源管理内容与环境详情里面资源列表类似,展示了已导入环境的资源信息,在导入资源列表点击导入按钮可导入新的资源,点击移除按钮可移除已导入资源,对于导入失败的资源可通过重试按钮进行重试,日志按钮可查看导入过程的详细日志。 云容器引擎 左侧导航栏,选择资源管理 > 云容器引擎。在云容器引擎列表展示了当前环境下已导入的云容器引擎资源。 点击导入按钮,列表会展示与当前环境同VPC的云容器引擎列表,勾选云容器引擎,再选择对应的部署单元,点击保存就可将资源导入。 导入失败可点击日志查看具体失败原因,也可点击重试按钮进行重试。 点击移除按钮,可移除选择的云容器引擎,在移除之前需要删除对应云容器引擎下的容器应用实例。 若云容器引擎进行节点扩容,有节点对应新的可用区,可通过编辑部署单元,修改云容器引擎与部署单元的对应关系。 ECS集群 左侧导航栏,选择资源管理 > ECS集群。在ECS集群列表展示了当前环境已创建的ECS集群资源。 集群列表界面,点击创建集群,输入集群名称后保存即可在当前环境下创建ECS集群。 集群列表界面,点击ECS集群名称,进入ECS集群详情页面,ECS集群详情页面展示了导入到集群的ECS实例列表,以及发布到ECS集群的应用列表。在ECS实例列表,点击上方导入按钮,可导入已订购的ECS实例。点击购买ECS扩容,可跳转到ECS订购界面,进行订购操作。点击操作栏移除按钮,可移除已导入的ECS实例,点击购买相同配置按钮,可跳转到ECS订购界面,自动选择与当前ECS实例同配置机器。 集群列表界面,点击操作栏删除按钮,可删除对应ECS集群,删除集群前需要先删除发布到此集群的ECS应用实例。 注意 一台ECS机器只能部署一个应用,订购ECS时根据部署应用所需资源选择规格订购。目前支持ECS发布的资源池如下:华东1、华北2、华南2、西南1、西安7。
        来自:
        帮助文档
        微服务云应用平台
        用户指南
        环境规划
        资源管理
      • 自定义授权服务
        本章节介绍自定义授权服务 前提条件 1. 已开通云容器引擎,至少有一个云容器引擎集群实例。产品入口:云容器引擎。 2. 开通天翼云服务网格实例。 操作步骤 创建测试命名空间 kubectl create ns foo 打开sidecar自动注入 kubectl label ns foo istioinjectionenabled 部署sleep和httpbin应用 apiVersion: v1 kind: ServiceAccount metadata: name: sleep apiVersion: v1 kind: Service metadata: name: sleep labels: app: sleep service: sleep spec: ports: port: 80 name: http selector: app: sleep apiVersion: apps/v1 kind: Deployment metadata: name: sleep spec: replicas: 1 selector: matchLabels: app: sleep template: metadata: labels: app: sleep spec: terminationGracePeriodSeconds: 0 serviceAccountName: sleep containers: name: sleep image: registryvpccrshuadong1.cnspinternal.ctyun.cn/library/curl command: ["/bin/sleep", "infinity"] imagePullPolicy: IfNotPresent volumeMounts: mountPath: /etc/sleep/tls name: secretvolume volumes: name: secretvolume secret: secretName: sleepsecret optional: true 部署外部授权服务 apiVersion: v1 kind: Service metadata: name: extauthz labels: app: extauthz spec: ports: name: http port: 8000 targetPort: 8000 name: grpc port: 9000 targetPort: 9000 selector: app: extauthz apiVersion: apps/v1 kind: Deployment metadata: name: extauthz spec: replicas: 1 selector: matchLabels: app: extauthz template: metadata: labels: app: extauthz spec: containers: image: registryvpccrshuadong1.cnspinternal.ctyun.cn/library/extauthz:1.16.2 imagePullPolicy: IfNotPresent name: extauthz ports: containerPort: 8000 containerPort: 9000 apiVersion: v1 kind: ServiceAccount metadata: name: httpbin apiVersion: v1 kind: Service metadata: name: httpbin labels: app: httpbin service: httpbin spec: ports: name: http port: 8000 targetPort: 80 selector: app: httpbin apiVersion: apps/v1 kind: Deployment metadata: name: httpbin spec: replicas: 1 selector: matchLabels: app: httpbin version: v1 template: metadata: labels: app: httpbin version: v1 spec: serviceAccountName: httpbin containers: image: registryvpccrshuadong1.cnspinternal.ctyun.cn/library/httpbin imagePullPolicy: IfNotPresent name: httpbin ports: containerPort: 80
        来自:
        帮助文档
        应用服务网格
        用户指南
        网格安全中心
        授权控制示例
        自定义授权服务
      • 创建守护进程集(DaemonSet)
        基本信息 负载类型:选择守护进程DaemonSet。工作负载类型的介绍请参见工作负载概述。 负载名称:填写工作负载的名称。 命名空间:选择工作负载的命名空间,默认为default。您可以单击后面的“创建命名空间”,命名空间的详细介绍请参见创建命名空间。 容器运行时:CCE集群默认使用普通运行时。 时区同步:选择是否开启时区同步。开启后容器与节点使用相同时区(时区同步功能依赖容器中挂载的本地磁盘,请勿修改删除),时区同步详细介绍请参见时区同步。 容器配置 容器信息 Pod中可以配置多个容器,您可以单击右侧“添加容器”为Pod配置多个容器。 基本信息:容器基本信息 生命周期:设置容器生命周期 健康检查:设置容器健康检查 环境变量:设置环境变量 数据存储:存储概述 安全设置:对容器权限进行设置,保护系统和其他容器不受其影响。请输入用户ID,容器将以当前用户权限运行。 容器日志:使用ICAgent采集容器日志 说明 负载实例数大于1时,不支持挂载云硬盘类型的存储。 镜像访问凭证:用于访问镜像仓库的凭证,默认取值为defaultsecret,使用defaultsecret可访问SWR镜像仓库的镜像。defaultsecret详细说明请参见defaultsecret。 GPU显卡:默认为不限制。当集群中存在GPU节点时,工作负载实例可以调度到指定GPU显卡类型的节点上。
        来自:
        帮助文档
        云容器引擎
        用户指南
        工作负载
        创建守护进程集(DaemonSet)
      • 升级应用
        本文介绍如何升级应用。 升级操作可以通过应用管理界面列表操作【升级】进入升级页面,也可以通过点击具体的应用进入详情页点击【升级】页签进入升级页面。 操作步骤 1.登录云容器引擎控制台,在左侧控制台导航栏中选择【工作负载】>【无状态】或【有状态】,进入应用管理界面>单击已创建的某一个应用,进入应用详情页面,选择【升级】页签; 2.请根据业务需求进行应用的升级,该过程与创建应用容器设置步骤相似,升级的参数说明请参见下表: 参数 参数说明 容器配置 选择镜像 在对应的容器下,单击【选择镜像】进行修改 镜像版本 进行镜像版本的更改 容器名称 单击列表框,修改容器名称 容器规格 对容器允许使用的cpu的最小值、最大值,内存的最小值、最大值进行修改 其它设置 生命周期 支持对生命周期进行修改,为应用提供极大的灵活性 生命周期包括:启动命令、启动后处理、停止前处理 健康检查 支持对通过探针监测容器进行修改 环境变量 容器运行环境中设定的一个变量。可以在应用部署后修改,为应用提供极大的灵活性; 在【环境变量】页签,单击【添加环境变量】; 输入变量名称、变量/变量引用。 数据存储 支持对数据存储进行修改,增加本地磁盘 安全设置 支持通过修改用户ID对容器权限进行修改 容器日志 容器设置日志采集策略、配置日志目录。用于收集容器日志以及日志防爆。通过添加日志策略对容器设置进行修改 3.更新完成后,单击【提交】。
        来自:
        帮助文档
        云容器引擎(旧版)
        用户指南
        应用资源
        应用管理运维
        升级应用
      • 高频问题
        本章节主要介绍高频问题 新创建应用、服务等资源后,AOM界面为何不实时显示监控数据? 当您新创建了主机、应用、组件、进程等资源后,ICAgent会以10分钟为周期进行周期性监控数据上报,AOM界面需要等待一个上报周期后方可展示相关监控数据。 删除主机、工作负载等资源后,AOM界面为何仍然显示资源状态为正常? 当您在CCE集群中删除了主机或工作负载等资源后,在AOM“主机监控”或“容器监控”界面显示资源状态仍为正常。此为正常现象,这是由于AOM“主机监控”或“容器监控”界面不会立即将资源状态置为已删除,而是会等待30分钟后将已删除的资源状态置为已删除。 如果界面上点击升级操作失败,该怎么办? 自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。 ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。 采集的日志文件是什么类型的? 在配置日志采集路径时,若日志采集路径配置的是目录,则默认采集目录下的日志(只采集.log、 .trace和 .out类型的文本日志文件);若配置的为具体某个文件,则直接采集对应文件。指定文件必须为文本文件,不支持其他类型(例如二进制日志文件)的日志文件。 采集器ICAgent对资源的占用大吗?例如内存、CPU。 AOM对基础指标的采集,包含VM、容器、进程的CPU、内存等基础指标。 资源消耗:对此类指标采集时,采集器ICAgent对资源的消耗和容器、进程个数相关。 正常业务量情况下,采集器ICAgent消耗内存约30M、单核CPU约3%。 使用限制:单节点上运行容器个数小于1000个。 保护机制: 采集器ICAgent对CPU资源的消耗最大不超过2核。 当采集器ICAgent对内存的消耗超过min{4G,节点物理内存/2}时,AOM将启动采集器重启保护。
        来自:
        帮助文档
        应用运维管理
        常见问题
        高频问题
      • 设置容器生命周期
        重启策略 说明 Always 当容器失效时,由kubelet自动重启该容器。 OnFailure 当容器终止运行且退出码不为0时,由kubelet自动重启该容器。 Never 不论容器运行状态如何,kubelet都不会重启该容器。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        工作负载
        容器设置
        设置容器生命周期
      • 云日志服务可以采集哪类日志?支持采集哪些文件类型?
        云日志服务可以采集哪类日志?支持采集哪些文件类型? 云日志服务可以采集的日志类型 天翼云主机应用日志:可通过采集器进行采集。 天翼云云容器引擎日志,标准输出与文件日志。 通过API、SDK上报日志。 云日志服务支持采集的文件类型(文件扩展名) 在采集配置中,如果日志采集路径配置的是目录(如:/var/logs/),则只采集目录下后缀为“.log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。
        来自:
        帮助文档
        云日志服务
        常见问题
        数据采集
        云日志服务可以采集哪类日志?支持采集哪些文件类型?
      • 纳管节点
        操作步骤 1.检查待纳管的云主机是否具备独立数据盘,且首块数据盘未被分区或格式化。独立数据盘非强制要求,但若缺失,容器数据将默认存储于系统盘。 2.若首块数据盘已被分区或格式化,可先备份数据,再使用以下命令擦除磁盘: plaintext wipefs a 3.登录云容器引擎控制台,进入要纳管节点的集。 4.在集群控制台左侧导航栏中选择“节点 ”,切换至“节点”页签并点击“纳管节点”。 5.点击选择“已有的服务器 ”,选择待纳管的云服务器,点击"确定"。 6. 选择“操作系统 ”,填写“登录密码 ”以及“确认密码 ”,再根据需要填写高级配置:节点标签 、节点污点 、部署前/后执行脚本. 7. 单击“下一步 ”,并单击“提交”。 重复纳管 出于数据安全考虑,节点纳管时会跳过已格式化或分区的磁盘。当对主机执行"纳管移除再次纳管"操作时,容器数据将直接存储于系统盘,而非数据盘。 可通过以下步骤使容器数据落于数据盘。 1.登录云主机控制台访问云主机。 2.定位云容器引擎使用的数据盘: 若主机仅有一块数据盘,直接执行步骤3。 若有多块磁盘,容器引擎一般会选择位于系统盘之上(即倒数第二块)的磁盘作为容器数据盘,或通过磁盘类型、容量信息定位磁盘的盘符。 云盘列表中显示的是云盘的名称和id,云盘挂载到os时会自动分配磁盘设备名称,可以使用云盘id前缀查找到云盘的设备名称。 登录到操作系统,可通过如下指令查到云盘在os中的设备名称。 3.检查云盘是否已经被格式化。 可以使用步骤2找到的磁盘设备名称,使用blkid指令检查结果。 plaintext blkid grep nvme1n1 若发现磁盘已经被格式化,则执行wipefs a指令擦除。 4.在云容器引擎控制台执行节点纳管操作。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        节点与节点池
        节点管理
        纳管节点
      • 1
      • ...
      • 20
      • 21
      • 22
      • 23
      • 24
      • ...
      • 498
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      多活容灾服务

      镜像服务 IMS

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      AI Store

      模型推理服务

      科研助手

      推荐文档

      iOS客户端需求

      盘符客户端

      首次备案

      接口方法概述

      云课堂 第二课:从一起Linux云主机无法远程ssh登录故障说起

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号