云主机开年特惠28.8元/年,0元秒杀等你来抢!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 天翼云新春焕新季 NEW 云主机开年特惠28.8元/年,0元秒杀等你来抢!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      容器镜像服务_相关内容
      • 昇腾 910B 物理机使用Galaxy镜像嵌入式模型部署指南
        在当今数字化浪潮中,人工智能与高性能计算的融合正驱动着各行业的创新变革。随着数据量的爆炸式增长以及复杂算法的不断涌现,对计算资源的高效利用和模型部署的灵活性、高性能提出了严格要求。昇腾 910B 物理机,作为前沿计算领域的佼佼者,凭借其卓越的算力与强大的并行处理能力,为各类复杂任务提供了坚实的硬件支撑。通过嵌入式模型的部署,能够将先进的人工智能技术深度融入各类设备与系统,实现智能化的精准赋能。 本指南将详细阐述如何依托昇腾 910B 物理机及其镜像,顺利完成嵌入式模型部署工作。从前期依托 Galaxy 镜像构建 Slurm 集群并部署 DS 服务的环境搭建,到精准下载 BGEM3 等关键模型并巧妙配置启动脚本,再到运用 TEIATB 容器镜像灵活管理服务,每一个环节都紧密相扣。旨在帮助技术人员、科研工作者以及相关领域从业者,全面掌握基于昇腾 910B 的嵌入式模型部署技巧,充分释放硬件潜能,推动人工智能应用在各场景中的高效落地,助力行业迈向智能化发展的新高度。 一、环境准备
        来自:
        帮助文档
        物理机 DPS
        DeepSeek专题
        实践指南:DeepSeek驱动高效能云生态
        GPU物理机:物理机搭建DeepSeek指南
        昇腾 910B 物理机使用Galaxy镜像嵌入式模型部署指南
      • 产品功能
        功能类别 功能描述 模型适配前机器环境检查确认 硬件环境检查:服务器、存储、网络等硬件型号及环境检查。 软件环境检查(系统软件):操作系统、HDK固件驱动、CANN版本、镜像等版本检查。 软件环境检查(模型训推软件):训练推理框架、Python、运行库等版本检查。 NPU健康状态检查:NPU卡数、型号、显存容量及运行状态检查。 网络检查(功能):网络连通性检查,设备防火墙检查。 网络检查(性能):P2P、D2H、H2D、D2H带宽检查。 HCCL功能性能检查:单多机HCCL allreduce、allgather带宽检查。 Aicore、HBM压测:Aicore、HBM压测。 HPFS存储检查:HPFS存储空间,挂载路径检查。 镜像及容器检查:docker镜像及容器启动功能检查。 模型训练集群验证:验证集群环境下开源模型单多机训练功能性能,包括loss,TPS及MFU指标。 模型适配 适配模型GPU基准验证:待适配模型在GPU环境下的基准验证,收集loss曲线,计算MFU、TPS等模型指标,计算模型训练效果的算法性能指标(如准确率、召回率、PPL、Rouge等)。 模型NPU适配度验证评估:评估待适配模型是否有不支持算子,评估该模型训练框架、依赖库的软件版本范围和约束。 模型算子开发:待适配模型算子开发及算子优化。 模型预训练适配(预训练)。 模型微调训练适配(全量微调)。 模型微调训练适配(lora微调)。 模型在线推理适配:适配模型在线推理代码、模板开发及验证。 模型极致调优:从训练框架、数据前后处理,算子亲和性等方面提升模型的MFU、TPS、训练精度等关键指标。 训练平台侧功能支持:训练平台侧运行脚本、log日志功能支持。 模型适配交付物提供:提供模型适配的开发代码、镜像、模型及技术文档。 客户交付过程中故障排查以及技术支持 基础环境运行故障定位、问题排查及支撑解决。 训练框架运行故障定位、问题排查及支撑解决。 模型训练中断问题定位、排查及支撑解决。 模型训练精度问题及支撑解决。 模型训练效率问题及支撑解决。 模型在线推理问题及支撑解决。 训练数据处理问题及支撑解决。 平台侧训练问题及支撑解决。 模型训练性能极致调优服务支撑:模型训练效率如MFU、TPS等指标的深度分析及极致优化。 模型训练算法效果服务支撑。 模型运行版本、训练配置差异化验证服务支撑。
        来自:
        帮助文档
        模型适配专家服务
        产品介绍
        产品功能
      • 使用ImageCache加速创建Pod
        本文介绍如何使用ImageCache加速创建Pod。 您可以使用弹性容器实例ECI的镜像缓存功能,从而加速Pod的创建过程。本文将介绍如何使用ImageCache来加速Pod的创建。 前提条件 确保您已经创建Serverless集群,具体操作请参阅创建Serverless集群。 确保kubectl工具已经连接目标集群。 配置说明 ImageCache资源是在集群级别定义的,因此在任意Namespace下创建Pod时均可以使用ImageCache来实现加速Pod的创建过程。 使用ImageCache创建Pod包括自动匹配和明确指定两种方式。您可以通过在Pod级别的metadata中添加相应annotations进行配置: k8s.ctyun.cn/eciimagecache:根据匹配策略,ImageCache能够自动为Pod选择最优的缓存,从而加速Pod的创建过程。如果当前没有符合条件的缓存,系统会在创建Pod时自动创建一个ImageCache。 k8s.ctyun.cn/eciimagesnapshotid:明确指定使用哪个镜像缓存来加速创建Pod。 在使用ImageCache创建Pod时,请注意以下几点: 建议在Pod中使用ImageCache的镜像,以提高匹配度。 建议将Pod中容器的镜像拉取策略设置为按需拉取,以避免重复下载镜像层。 自动匹配ImageCache 创建Pod时,您可以使用annotations来声明使用自动匹配模式的ImageCache以加速Pod的创建。ECI将根据匹配策略,并基于已有的ImageCache列表选择最优的ImageCache来创建Pod。匹配策略的优先级从高到低依次为:镜像匹配度、匹配的镜像大小以及创建时间。 Deplyoment示例 apiVersion: apps/v1 kind: Deployment metadata: name:nginxautomatch labels: app: nginx spec: replicas: 3 selector: matchLabels: app: nginx template: metadata: labels: app: nginx annotations: k8s.ctyun.cn/eciimagecache: "true"
        来自:
        帮助文档
        云容器引擎 Serverless版
        用户指南
        镜像
        使用ImageCache加速创建Pod
      • 订购
        如何选择Master节点的规格?以便更好匹配Worker节点规模。 一般不同规模的节点池,建议配置相应的Master节点规模与之匹配,详细可查看:集群规格规划 同一集群支持2种不同Worker节点主机规格吗? 支持,需要通过2步实现:集群订购+扩容节点池。1)集群订购选择一种默认节点池的主机规格;2)集群开通后进入控制台,创建节点池选择另一种主机规格,手动扩容新的节点池配置,详细可查看: 节点池管理 节点的系统盘大小可以选择订购吗? 支持,Master节点和节点池节点的系统盘可以按需选择订购,一般该主机盘的最小值为主机操作系统镜像的最小值,详细可参考订购页。 集群订购页"组件配置"有哪些额外的收费项,是否必须购买? 非必须,可选的收费项包括:Ingress的elb和eip;云日志服务、容器镜像服务企业版,客户可按需选择,由对应的云产品进行收费。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        常见问题
        订购
      • 集群高可靠推荐配置
        关注配额限制 云服务和集群资源均有配额限制,以防止意外过度使用资源。 云服务配额:如弹性云服务器、云硬盘、虚拟私有云、弹性负载均衡、容器镜像服务等均有配额限制,当资源配额限制无法满足使用时,可以提交工单申请扩大配额; 集群配额:租户可创建集群数量、单集群管理节点数量、单节点最大Pod数有配额限制,详见使用限制。 监控控制节点指标 采集控制节点指标可以深入了解控制节点性能并提前识别问题,运行状况不佳的控制节点会影响应用可靠性。 云容器引擎通过ccsemonitor插件对接应用性能监控服务APM,以采集集群指标,默认会采集kubeapiserver、kubecontroller、kubescheduler、etcd等核心组件指标。 可在云容器引擎控制台的“运维管理监控”侧查看这些系统组件的监控面板。 运行npd 工作节点故障可能影响容器应用的正常运行。npd(node problem detector)是Kubernetes社区提供的用于检测集群节点异常的插件,借助npd可及时获取节点可能存在的异常并处理。npd插件支持自定义配置,如目标节点、触发阈值、检查周期等。 配置DNS缓存 CoreDNS默认不缓存DNS,当集群内DNS请求量增加时,CoreDNS可能出现如下问题: 延迟增加:CoreDNS要处理更多请求,DNS查询可能变慢,从而影响业务性能; 资源占用率增加:CoreDNS需要占用更多CPU和内存,以满足激增的DNS请求。 可在集群中部署NodeLocal DNSCache插件以减少DNS请求延迟,提升服务发现的稳定性和性能。该插件在每个集群节点上运行DNS缓存代理,所有注入DNS配置的Pod优先使用该DNS缓存代理进行域名解析,以减少CoreDNS服务的压力,提高集群DNS性能。 详见使用NodeLocal DNSCache。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        容灾
        集群高可靠推荐配置
      • 重置升级/滚动升级(1.13版本)
        参数 参数说明 集群名称 请确认您要升级的集群名称。 当前版本 请确认待升级集群的版本。 升级后版本 请确认升级后的目标版本。 节点升级策略 重置升级:用户节点采用重置安装方式,节点操作系统将会被重装,系统盘和数据盘的数据均会被清空,请谨慎使用。 说明 本集群的节点及工作负载生命周期管理功能暂不可用。 API访问功能暂不可用。 由于升级过程节点进行重置安装,用户已运行的工作负载业务将会中断。 用户节点的系统盘和数据盘将会被清空,升级前请事先备份重要数据。 用户节点上挂载的非LVM管理的数据盘,升级后需要重新挂载,盘中数据不会丢失。 云硬盘的配额需大于0。 容器的IP地址会发生变化,但是不影响容器间的网络通信。 用户节点的自定义标签将不会保留。 集群升级时间约为12分钟。 滚动升级 :用户节点采用节点池滚动升级,适用于集群下节点均采用节点池创建的场景。 说明 本集群的节点及工作负载生命周期管理功能暂不可用。 API访问功能暂不可用。 用户已运行的工作负载业务不会中断。 集群升级时间约为12分钟。 重置节点镜像 仅支持物理机节点。物理机节点支持在升级时替换操作系统镜像,可指定节点使用新的镜像,在升级时会使用新镜像重装操作系统。如不指定则默认使用原有镜像重装操作系统。 登录方式 密码 用户名默认为“root”,请输入登录节点的密码,并确认密码。登录节点时需要使用该密码,请妥善管理密码,系统无法获取您设置的密码内容。选择用于登录本节点的密钥对,支持选择共享密钥。密钥对用于远程登录节点时的身份认证。若没有密钥对,可单击选项框右侧的“创建密钥对”来新建。 集群备份 对集群的Master节点进行整机备份, 需要用户手动确认 ,备份过程会使用云备份服务,备份通常耗时在20分钟左右, 若当前局点云备份任务排队较多时,备份时间可能同步延长,推荐用户使用进行整机备份。 节点升级优先级 可选择优先升级的节点。
        来自:
        帮助文档
        云容器引擎
        用户指南
        集群管理
        集群升级
        重置升级/滚动升级(1.13版本)
      • 镜像拉取凭证
        使用镜像拉取凭证 1、登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页 2、在集群列表中点击需要使用镜像拉取凭证的集群,进入集群管理页面 3、在集群管理页面导航栏中选择工作负载, 在列表中选择需要创建的工作负载,本文以无状态为例。 4、点击新建,进入新建Deployment页面 5、根据实际需要设置工作负载的基本信息(名称、镜像等),并点击 新建Deployment 中的显示高级设置展开工作负载的高级设置 6、在镜像拉取凭证 中点击添加并选择已创建的镜像拉取凭证。 7、点击提交完成创建。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        配置管理
        镜像拉取凭证
      • 昇腾 910B 物理机使用Galaxy镜像嵌入式模型部署指南
        在当今数字化浪潮中,人工智能与高性能计算的融合正驱动着各行业的创新变革。随着数据量的爆炸式增长以及复杂算法的不断涌现,对计算资源的高效利用和模型部署的灵活性、高性能提出了严格要求。昇腾 910B 物理机,作为前沿计算领域的佼佼者,凭借其卓越的算力与强大的并行处理能力,为各类复杂任务提供了坚实的硬件支撑。而嵌入式模型的部署,能够将先进的人工智能技术深度融入各类设备与系统,实现智能化的精准赋能。 本指南将详细阐述如何依托昇腾 910B 物理机及其镜像,顺利完成嵌入式模型部署工作。从前期依托 Galaxy 镜像构建 Slurm 集群并部署 DS 服务的环境搭建,到精准下载 BGEM3 等关键模型并巧妙配置启动脚本,再到运用 TEIATB 容器镜像灵活管理服务,每一个环节都紧密相扣。旨在帮助技术人员、科研工作者以及相关领域从业者,全面掌握基于昇腾 910B 的嵌入式模型部署技巧,充分释放硬件潜能,推动人工智能应用在各场景中的高效落地,助力行业迈向智能化发展的新高度。 一、环境准备
        来自:
        帮助文档
        物理机 DPS
        最佳实践
        物理机搭建DeepSeek指南
        昇腾 910B 物理机使用Galaxy镜像嵌入式模型部署指南
      • 设置容器健康检查
        操作场景 健康检查是指容器运行过程中,根据用户需要,定时检查容器健康状况。若不配置健康检查,如果服务出现业务异常,pod将无法感知,也不会自动重启去恢复业务。最终导致虽然pod状态显示正常,但pod中的业务异常的情况。 CCE提供了两种健康检查的探针: 工作负载存活探针:用于检测容器是否正常,类似于我们执行ps命令检查进程是否存在。如果容器的存活检查失败,集群会对该容器执行重启操作;若容器的存活检查成功则不执行任何操作。 工作负载业务探针:用于检查用户业务是否就绪,不就绪则不转发流量到当前实例。一些程序的启动时间可能很长,比如要加载磁盘数据或者要依赖外部的某个模块启动完成才能提供服务。这时候程序进程在,但是并不能对外提供服务。这种场景下该检查方式就非常有用。如果容器的就绪检查失败,集群会屏蔽请求访问该容器;若检查成功,则会开放对该容器的访问。 检查方式 HTTP 请求检查 HTTP 请求方式针对的是提供HTTP/HTTPS服务的容器,集群周期性地对该容器发起HTTP/HTTPS GET请求,如果HTTP/HTTPS response返回码属于200~399范围,则证明探测成功,否则探测失败。使用HTTP请求探测必须指定容器监听的端口和HTTP/HTTPS的请求路径。 例如:提供HTTP服务的容器,HTTP检查路径为:/healthcheck;端口为:80;主机地址可不填,默认为容器实例IP,此处以172.16.0.186为例。那么集群会周期性地对容器发起如下请求:GET TCP 端口检查 对于提供TCP通信服务的容器,集群周期性地对该容器建立TCP连接,如果连接成功,则证明探测成功,否则探测失败。选择TCP端口探测方式,必须指定容器监听的端口。 例如:我们有一个nginx容器,它的服务端口是80,我们对该容器配置了TCP端口探测,指定探测端口为80,那么集群会周期性地对该容器的80端口发起TCP连接,如果连接成功则证明检查成功,否则检查失败。 执行命令检查 命令检查是一种强大的检查方式,该方式要求用户指定一个容器内的可执行命令,集群会周期性地在容器内执行该命令,如果命令的返回结果是0则检查成功,否则检查失败。 对于上面提到的TCP端口检查和HTTP请求检查,都可以通过执行命令检查的方式来替代: − 对于TCP端口探测,我们可以写一个程序来对容器的端口进行connect,如果connect成功,脚本返回0,否则返回1。 − 对于HTTP请求探测,我们可以写一个脚本来对容器进行wget。 wget 并检查response 的返回码,如果返回码在200~399 的范围,脚本返回0,否则返回1。 须知: 必须把要执行的程序放在容器的镜像里面,否则会因找不到程序而执行失败。 如果执行的命令是一个shell脚本,由于集群在执行容器里的程序时,不在终端环境下,因此不能直接指定脚本为执行命令,需要加上脚本解决器。比如脚本是/data/scripts/healthcheck.sh ,那么我们使用执行命令检查时,指定的程序应该是sh /data/scripts/healthcheck.sh 。究其原因是集群在执行容器里的程序时,不在终端环境下。 表公共参数说明 参数 参数说明 延迟时间 延迟检查时间,单位为秒,此设置与业务程序正常启动时间相关。 例如,设置为30,表明容器启动后30秒才开始健康检查,该时间是预留给业务程序启动的时间。 超时时间 超时时间,单位为秒。 例如,设置为10,表明执行健康检查的超时等待时间为10秒,如果超过这个时间,本次健康检查就被视为失败。若设置为0或不设置,默认超时等待时间为1秒。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        工作负载
        容器设置
        设置容器健康检查
      • DeepSeek-R1蒸馏模型部署
        背景信息 本文介绍如何在智算容器引擎加载DeepSeekR1 蒸馏模型。 前提条件 已开通包含GPU节点的Kubernetes集群。 已安装智算套件。 添加GPU节点 点击左侧【节点】>【节点池】,点击【创建节点池】。若集群已有GPU资源,请忽略。 在规格中可选择【x86计算】或【弹性裸金属服务器】中的【GPU计算加速型】或【GPU型】,节点池创建成功后,进入节点池列表,扩容节点至期望的节点数量。 操作步骤 进入云容器引擎控制台。 点击左侧【集群】进入集群列表。 点击使用的集群名称,进入集群。 点击左侧【工作负载】>【自定义资源】,选择资源浏览器,找到apps/v1/Deployment,选择命名空间,点击新增。 在创建yaml中,填入以下GPU模板信息后点击【创建】。 注意 1. 修改对应的镜像仓库地址前缀为对应资源池,可在容器镜像控制台查看,如武汉41,则修改{imagerepo}为registryvpccrswuhan41.cnspinternal.ctyun.cn。 2. namespace: 要和界面选择的一致。 3. 已经支持的资源池有华北2,武汉41,杭州7。 GPU模板 xml apiVersion: apps/v1 kind: Deployment metadata: name: deepseek spec: replicas: 1 selector: matchLabels: app: deepseek template: metadata: labels: app: deepseek spec: containers: name: deepseek image: {imagerepo}/opensource/openwebuideepseekr1:7b
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        DeepSeek专题
        实践指南:DeepSeek驱动高效能云生态
        智算容器:云容器引擎与DeepSeek融合实践
        DeepSeek-R1蒸馏模型部署
      • 混合集群网络
        场景二:云下Kubernetes集群容器网络模式为Overlay模式,或Underlay模式但Pod IP集群外不可访问 隧道网络模式相较平面网络模式,存在10%~20%的性能损失,一般用于集群规模较小且对网络性能要求不高的场景。场景开源组件模式包括: Flannel VXLan模式 Calico IPIP模式 Cilium VXLan模式 若云下Kubernetes集群的容器网络模式为隧道网络,则云上节点也可以复用该网络模式,只需保证云上节点能够拉取到容器网络插件所需容器镜像即可。
        来自:
        帮助文档
        分布式容器云平台 CCE One
        用户指南
        注册集群
        注册集群控制台
        节点管理
        节点池
        混合集群网络
      • 故障诊断
        查看诊断结果 在故障诊断页面诊断列表的操作列,点击目标诊断报告对应的诊断详情,在诊断详情页面查看详细诊断结果,诊断项状态为异常时,需要确认,如果是引起集群异常的问题需要处理。 注意 根据集群配置,具体检查项可能稍有不同。实际结果请以诊断页面结果为准。 支持的诊断项 诊断维度 诊断项 说明 修复方案 Service 检查Service后端Ready Pod数量 检查Service后端Ready Pod数量。 检查业务Pod状态,保证Pod存在且处于Ready状态。 Service 检查Service是否存在异常事件 检查集群中是否存在与该Service相关的异常事件。 请检查并处理Service异常事件中的描述信息,若无法处理,请提交工单。 节点 检查节点是否存在 检查集群中是否存在该节点。 请检查Node在集群中是否存在。 节点 检查节点状态是否Ready 检查节点在集群中的状态是否为Ready。 请登录到节点上执行systemctl status kubelet或journalctl exu kubelet查看节点上kubelet进程异常日志并尝试修复。 节点 检查节点状态是否不可调度 检查节点是否不可调度,不可调度的节点会影响Pod的正常运行。 节点不可调度,请检查节点调度设置。 节点 检查节点CPU装载率是否过高 检查节点CPU资源分配率是否过高。 请检查节点上pod的CPU request值设置的合理性。 节点 检查节点内存装载率是否过高 检查节点内存资源分配率是否过高。 请检查节点上pod的Memory request值设置的合理性。 节点 检查节点磁盘压力 检查节点磁盘使用率是否过高。 请检查节点磁盘使用情况,及时清理磁盘中不需要的文件或扩容磁盘。 节点 检查节点PID压力 检查节点PID使用率是否过高。 请检查节点PID使用情况。 节点 检查节点Chronyd进程状态是否正常 检查节点Chronyd进程是否异常,该进程异常可能会影响系统时钟同步。 节点Chronyd进程异常,可能影响节点系统时间同步。请尝试通过命令systemctl restart chronyd重启节点Chronyd进程。 节点 检查节点Ntpd进程状态是否正常 检查节点Ntpd进程是否异常,该进程异常时可能会影响系统时钟同步。 节点Ntpd进程异常,可能影响节点系统时间同步。请尝试通过命令systemctl restart ntpd重启节点Ntpd进程。 节点 检查节点Containerd状态是否正常 检查节点Containerd服务的状态,该进程异常时可能会影响Pod的正常运行。 节点Containerd状态异常,请收集节点日志并提交工单处理。 节点 检查节点Containerd镜像拉取是否正常 检查节点Containerd进程拉取pause镜像是否正常。 请检查节点网络及镜像配置。 节点 检查节点Docker状态是否正常 检查节点Dockerd服务的状态,该进程异常时可能会影响Pod的正常运行。 节点Docker状态异常,请收集节点日志并提交工单处理。 节点 检查节点Docker镜像拉取是否正常 检查节点Docker进程拉取pause镜像是否正常。 请检查节点网络及镜像配置。 节点 检查节点Kubelet状态是否正常 检查节点Kubelet服务的状态,该进程可能会影响Pod的正常运行。 请检查节点kubelet日志。 节点 检查节点Kubelet启动时间 检查节点Kubelet进程启动时间。 无 节点 节点OS版本 检查节点操作系统版本。 无 节点 节点内核版本 检查节点内核版本是否过低,内核版本过低可能造成系统异常。 请尝试更换节点升级内核。 节点 节点Systemd版本 检查节点systemd版本。 无 节点 节点runc版本 检查节点runc版本,runc版本过低可能造成系统异常。 无 节点 节点系统时间 检查节点系统时间。 无 节点 节点硬件时间 检查节点硬件时间。 无 节点 节点硬件时间漂移 检查节点硬件时钟与系统时间是否一致,时间相差超过2分钟可能引起组件异常。 请尝试登录节点,通过命令hwclock systohc将节点系统时间同步到硬件时间。 节点 检查节点内存交换区开启情况 检查节点内存交换区 (Memory Swap) 功能是否开启,K8s默认要求关闭内存交换区。 当前节点内存交换区 (Memory Swap) 功能不支持开启,请登录节点关闭该功能。 节点 检查Conntrack表使用情况 检查节点Conntrack表是否满,Conntrack表满可能影响网络性能。 请检查nfconntrackbuckets和nfconntrackmax内核参数。 节点 检查节点访问集群API Server是否正常 检查节点能否正常连接集群API Server,访问集群中其他K8s资源。 请检查集群相关配置。请检查集群相关配置。检查Master组件Pod是否异常。API Server使用的负载均衡ELB是否异常。 节点 节点DNS服务地址 检查节点能否正常使用主机DNS服务,通过主机DNS服务解析集群外域名。 请检查主机DNS服务是否正常。更多信息,请参见DNS解析异常问题排查。 节点 检查节点内网IP是否存在 检查节点内网IP是否存在。 节点内网IP不存在,请尝试移除节点后重新导入。 节点 检查节点能否访问公网 检查节点能否正常访问公网,无法访问公网可能影响公网镜像拉取。 请检查集群是否开启SNAT公网访问。 节点 节点CPU使用率 检查节点CPU负载是否过高,CPU负载过高可能影响系统性能。 无 节点 节点内存使用率 检查节点内存负载是否过高,内存过高可能影响系统性能。 无 Pod 检查Pod是否存在 检查集群中是否存在该Pod。 请检查Pod在集群中对应命名空间下是否存在。 Pod 检查Pod状态是否为Running 检查Pod是否处于Running状态。 请检查Pod状态及日志。更多信息,请参见Pod异常问题排查。 Pod Pod容器重启次数统计 统计Pod中容器重启次数。 请检查Pod状态及日志。更多信息,请参见Pod异常问题排查。 Pod 检查Pod容器是否存在镜像下载阻塞情况 检查Pod容器对应的镜像下载被阻塞。 请检查Pod状态及日志。更多信息,请参见Pod异常问题排查。 Pod 检查Pod容器镜像Secrets是否有效 检查Pod拉取镜像的Secrets是否有效。 请检查Pod状态及日志。更多信息,请参见Pod异常问题排查。 Pod 检查Pod到主机网络DNS服务器的连通性 检查Pod到主机网络DNS服务器的连通性。 请检查Pod到主机网络DNS服务器的连通性。 Pod 检查Pod容器进程处于D状态检查 检查Pod内的容器进程是否处于D状态。 Pod的部分容器进程处于D状态,通常为容器进程卡在磁盘IO中,请尝试重启宿主机ECS,如仍无法恢复,请提交工单处理。 Pod 检查Pod是否初始化成功 检查Pod是否正常初始化。 请检查Pod状态及日志。更多信息,请参见Pod异常问题排查。 Pod 检查Pod是否处于调度中状态 检查Pod是否正常调度。 请检查Pod状态及日志。更多信息,请参见Pod异常问题排查。 Pod 检查Pod是否配置了livenessProbe探针 检查Pod描述文件是否配置了livenessProbe探针。 请为Pod配置合适的livenessProbe健康检查。 Pod 检查Pod是否配置了ReadinessProbe探针 检查Pod描述文件是否配置了ReadinessProbe探针。 请为Pod配置合适的readinessProbe健康检查。 Pod 检查Pod是否配置了资源requests 检查Pod描述文件是否配置了资源requests。 请为Pod配置合适的request资源申请。 Pod 检查Pod是否配置了资源limits 检查Pod描述文件否配置了资源limits。 请为Pod配置合适的limit资源限制。 Pod 检查Pod在过去24小时内是否存在OOM Kill情况 检查Pod在过去24小时内是否存在因内存过载而被Kill的情况。 请检查Pod是否配置了合适的limit资源限制,同时检查Pod状态及日志。更多信息,请参见Pod异常问题排查。 Ingress 检查Ingress是否存在 检查与转发规则匹配的Ingress是否存在。 检查所提供的URL信息是否有能够对应的Ingress规则。若URL信息无误,可能是Ingress规则存在问题。 Ingress 检查Ingress名称规范 检查所匹配到的Ingress名称是否规范。 无 Ingress 检查是否使用了nginx.ingress.kubernetes.io/sessioncookiehash废弃注解 检查是否使用了在0.24.0版本废弃的nginx.ingress.kubernetes.io/sessioncookiehash注解key。 确认当前Ingress Controller版本,移除该注解或使用其他注解代替。 Ingress 检查是否使用了nginx.ingress.kubernetes.io/baseurlscheme废弃注解 检查是否使用了在0.22.0版本废弃的nginx.ingress.kubernetes.io/baseurlscheme注解key。 确认当前Ingress Controller版本,移除该注解或使用其他注解代替。 Ingress 检查是否使用了nginx.ingress.kubernetes.io/securebackends废弃注解 检查是否使用了在0.21.0版本废弃的nginx.ingress.kubernetes.io/securebackends注解key。 确认当前Ingress Controller版本,移除该注解或使用其他注解代替。 Ingress 检查是否使用了nginx.com/nginx.org注解 检查是否使用了不兼容社区版Nginx Ingress Controller的商业版Ingress注解key(以nginx.com/nginx.org开头)。 请使用对应功能的正确用法。关于Ingress更多信息,请参见社区官方文档Nginx Ingress Controller。(引用到官方文档) Ingress 检查是否使用了nginx.ingress.kubernetes.io/grpcbackend废弃注解 检查是否使用了在0.21.0版本废弃的nginx.ingress.kubernetes.io/grpcbackend注解key。 确认当前Ingress Controller版本,移除该注解或使用其他注解代替。 Ingress 检查是否使用了nginx.ingress.kubernetes.io/mirroruri废弃注解 检查是否使用了在0.24.0版本废弃的nginx.ingress.kubernetes.io/mirroruri注解key。 确认当前Ingress Controller版本,移除该注解或使用其他注解代替。 Ingress 检查是否启用了canary 使用了nginx.ingress.kubernetes.io/canary相关注解,但value值为"false‘,如果需要使用灰度功能,请指定nginx.ingress.kubernetes.io/canary: "true"。 如果您需要在该Ingress上开启Canary功能,请在Ingress规则上添加nginx.ingress.kubernetes.io/canary: "true"注解。 Ingress 检查Ingress是否存在异常事件 检查集群中是否存在与该Ingress相关的异常事件。 检查并处理异常事件描述信息中的报错,如无法解决,请提交工单处理。
        来自:
        帮助文档
        分布式容器云平台 CCE One
        用户指南
        注册集群
        注册集群控制台
        运维
        故障诊断
      • ECI Pod Annotation
        本文介绍ECI Pod Annotation。 在 Kubernetes 集群中创建 ECI 类型 Pod 时,为了更好地利用 ECI 的特性,同时保持 Kubernetes 的标准行为,您可以通过为 Pod 添加 Annotation 来实现。本文将指导您了解创建 ECI Pod 时可以配置的 Annotation,以及 ECI 实例完成调度后系统会自动为 Pod 附加的 Annotation。 ECI Pod支持的Annotation 创建ECI Pod时,支持添加的Annotation如下: 参数 示例值 描述 k8s.ctyun.cn/eciusespecs pi7.4xlarge.4 指定ECI实例规格,只支持指定一种规格 k8s.ctyun.cn/eciimagecache "true" 配置为true表示自动匹配镜像缓存 k8s.ctyun.cn/eciimagesnapshotid imc7nh0dkpoaxepqyh2 指定镜像缓存ID k8s.ctyun.cn/ecisecuritygroup sg5bvqyvrmch 指定ECI容器实例所在的安全组ID k8s.ctyun.cn/ecieipinstanceid eipxxxx 指定弹性IP的ID。注:弹性IP默认不开放8080、80、443、8443端口,建议使用其他端口 k8s.ctyun.cn/eciiamrolename testName ECS资源委托名称 k8s.ctyun.cn/ecisubnet subnetxxxx 指定ECI子网ID。注:只支持单个子网 ECI Pod追加的Annotation ECI Pod调度完成后会追加的Annotation如下表所示。您可以通过kubectl describe命令进行查询。 参数 示例值 描述 ccse.ctyun.cn/eniinstanceid portxxx ECI容器实例的网卡ID k8s.ctyun.cn/eciinstanceid ecixxxxx ECI容器实例的ID k8s.ctyun.cn/eciinstancecpu "1.0" ECI容器实例CPU大小 k8s.ctyun.cn/eciinstancemem "1.0" ECI容器实例Memory大小 k8s.ctyun.cn/eciinstancezone cnxxxxxxxxpublicctcloud ECI容器实例所在可用区名称 k8s.ctyun.cn/ecivpc vpcxxxxxx ECI容器实例所属VpcId k8s.ctyun.cn/ecisubnet subnetxxxxxx ECI容器实例所属子网ID k8s.ctyun.cn/ecisecuritygroup sgxxxxxx ECI容器实例所在的安全组ID k8s.ctyun.cn/ecirequestid 80e90ccca5b54034acae7c0c8eeb376f 请求ID k8s.ctyun.cn/k8sversion v1.25.6 集群版本 k8s.ctyun.cn/clusterdns 10.96.0.10 集群DNS服务器的IP地址 k8s.ctyun.cn/clusterdomain cluster.local 集群本地域名 k8s.ctyun.cn/vkversion v1.2.020240829 cubevk版本
        来自:
        帮助文档
        云容器引擎 Serverless版
        用户指南
        ECI Pod
        ECI Pod Annotation
      • ECI Pod Annotation(1)
        本文介绍ECI Pod Annotation。 在 Kubernetes 集群中创建 ECI 类型 Pod 时,为了更好地利用 ECI 的特性,同时保持 Kubernetes 的标准行为,您可以通过为 Pod 添加 Annotation 来实现。本文将指导您了解创建 ECI Pod 时可以配置的 Annotation,以及 ECI 实例完成调度后系统会自动为 Pod 附加的 Annotation。 ECI Pod支持的Annotation 创建ECI Pod时,支持添加的Annotation如下: 参数 示例值 描述 k8s.ctyun.cn/eciusespecs pi7.4xlarge.4 指定ECI实例规格,只支持指定一种规格 k8s.ctyun.cn/eciimagecache "true" 配置为true表示自动匹配镜像缓存 k8s.ctyun.cn/eciimagesnapshotid imc7nh0dkpoaxepqyh2 指定镜像缓存ID k8s.ctyun.cn/ecisecuritygroup sg5bvqyvrmch 指定ECI容器实例所在的安全组ID k8s.ctyun.cn/ecieipinstanceid eipxxxx 指定弹性IP的ID。注:弹性IP默认不开放8080、80、443、8443端口,建议使用其他端口 k8s.ctyun.cn/eciiamrolename testName ECS资源委托名称 k8s.ctyun.cn/ecisubnet subnetxxxx 指定ECI子网ID。注:只支持单个子网 ECI Pod追加的Annotation ECI Pod调度完成后会追加的Annotation如下表所示。您可以通过kubectl describe命令进行查询。 参数 示例值 描述 ccse.ctyun.cn/eniinstanceid portxxx ECI容器实例的网卡ID k8s.ctyun.cn/eciinstanceid ecixxxxx ECI容器实例的ID k8s.ctyun.cn/eciinstancecpu "1.0" ECI容器实例CPU大小 k8s.ctyun.cn/eciinstancemem "1.0" ECI容器实例Memory大小 k8s.ctyun.cn/eciinstancezone cnxxxxxxxxpublicctcloud ECI容器实例所在可用区名称 k8s.ctyun.cn/ecivpc vpcxxxxxx ECI容器实例所属VpcId k8s.ctyun.cn/ecisubnet subnetxxxxxx ECI容器实例所属子网ID k8s.ctyun.cn/ecisecuritygroup sgxxxxxx ECI容器实例所在的安全组ID k8s.ctyun.cn/ecirequestid 80e90ccca5b54034acae7c0c8eeb376f 请求ID k8s.ctyun.cn/k8sversion v1.25.6 集群版本 k8s.ctyun.cn/clusterdns 10.96.0.10 集群DNS服务器的IP地址 k8s.ctyun.cn/clusterdomain cluster.local 集群本地域名 k8s.ctyun.cn/vkversion v1.2.020240829 cubevk版本
        来自:
      • 查看容器告警事件
        本小节介绍查看容器告警事件。 企业主机安全可对您已开启的告警防御能力提供总览数据,帮助您快速了解安全告警概况包括存在告警的容器、待处理告警事件、已处理告警事件。 事件列表仅保留近30天内发生的告警事件,您可以根据自己的业务需求,自行判断并处理告警,快速清除资产中的安全威胁。 告警事件处理完成后,告警事件将从“未处理”状态转化为“已处理”。 约束限制 未开启防护的服务器不支持告警事件相关操作。 操作步骤 1、登录管理控制台。 2、在左侧导航栏中选择“入侵检测 > 安全告警事件 > 容器安全告警”,进入“容器安全告警”页面,查看容器告警事件信息。 查看容器告警事件概览。 安全告警统计:您可以查看存在告警的容器数量,以及待处理和已处理告警事件数量。 威胁等级:您可以查看容器存在的告警等级分布数量。 TOP事件类型:您可以查看容器中告警数量排在前五的事件类型。 查看容器告警事件分类列表。 在“事件类型”栏,选择告警事件类型,查看每个事件类型对应的告警事件列表。在告警事件列表中可以查看告警威胁等级、告警名称、受影响容器实例名称等信息。 查看容器告警事件详细信息。 单击目标告警事件的告警名称,进入告警事件详情页面,可以查看容器ID、IP地址、虚拟机名称、镜像ID等信息。
        来自:
        帮助文档
        企业主机安全
        用户指南
        入侵检测
        容器安全告警
        查看容器告警事件
      • 网关访问保留源IP
        本节主要介绍网关访问保留源IP 操作场景 服务通过网关访问时,默认情况下,目标容器中看到的不是客户端的源IP,如果需要保留源IP,请参考本节指导操作。 配置方法 请在CCE控制台“服务发现”页面,istiosystem命名空间下,更新服务所关联的网关服务,将服务亲和改成“节点级别”。前提是已开启ELB的获取客户端IP功能(当前为默认开启)。 externalTrafficPolicy:表示此Service是否希望将外部流量路由到节点本地或集群范围的端点。有两个可用选项:Cluster(默认)和Local。Cluster隐藏了客户端IP,可能导致第二跳到另一个节点,但具有良好的整体负载分布。Local保留客户端源IP并避免LoadBalancer和NodePort类型服务的第二跳,但存在潜在的不均衡流量传播风险。 验证方式 结合httpbin镜像在“xforwardfor”字段中可以看到源IP,httpbin是一个HTTP Request & Response Service,可以向他发送请求,他将会按照指定的规则将请求返回。httpbin镜像可在SWR中搜索。使用httpbin镜像进行验证时请确保集群已开通网格。 1. 登录ASM应用服务网格控制台,选择一个可用的测试网格并单击进入。 2. 选择左侧“网格配置”查看其关联的集群。 3. 单击集群名称进入集群详情页,单击对应集群右上角第三个图标“工作负载”进入“工作负载”页签。 4. 配置工作负载的信息。 5. 单击右下角“确定”完成服务创建。 6. 单击右下角“创建工作负载”完成工作负载创建。 7. 在集群详情页选择左侧“服务发现”页签,可在服务列表中查看到所创建的httpbin服务。 8. 返回ASM应用服务网格,选择左侧“服务管理”页签,在服务管理中可查看到httpbin的配置诊断显示为异常。 9. 单击此服务配置诊断中的“处理”按钮,按照弹出“配置诊断”页面对应的修复指导进行修复。 10. 选择左侧“网关管理”页签,单击右上角“添加网关”,在弹出“添加网关”页面输入配置信息。 11. 单击“确定”完成网关添加。 12. 选择左侧“服务管理”页签,可以在“访问地址”查看到所创建路由的外部访问地址。 13. 单击之前添加路由时设置映射的外部访问地址,可以在“xforwardfor”字段中查看网关获取的IP为容器段IP。 14. 返回集群详情页,选择左侧导航栏“服务发现”,更改服务所关联的网关服务的配置。方法如下: 下拉上方“命名空间”列表选择“istiosystem”。 展开服务后方“更多”选项,单击“更新”,在弹出“更新服务”页面将“服务亲和”更改为“节点级别”,单击“确定”。 15. 返回13中访问的外部地址并刷新,若设置之后“xforwardfor”字段中显示的网关获取IP的结果为本机源IP,则完成验证。
        来自:
        帮助文档
        应用服务网格
        最佳实践
        网关访问保留源IP
      • 节点访问(NodePort)
        操作场景 节点访问 ( NodePort )是指在每个节点的IP上开放一个静态端口,通过静态端口对外暴露服务。节点访问 ( NodePort )会路由到ClusterIP服务,这个ClusterIP服务会自动创建。通过请求 : ,可以从集群的外部访问一个NodePort服务。 约束与限制 “节点访问 ( NodePort )”默认为VPC内网访问,如果需要使用弹性IP通过公网访问该服务,请提前在集群的节点上绑定弹性IP。 创建service后,如果服务亲和从集群级别切换为节点级别,连接跟踪表将不会被清理,建议用户创建service后不要修改服务亲和属性,如需修改请重新创建servcie。 同一个节点内的容器不支持访问externalTrafficPolicy为local的service。 工作负载创建时设置 您可以在创建工作负载时通过控制台设置Service访问方式,本节以nginx为例进行说明。 步骤 1 参考创建无状态负载(Deployment)、创建有状态负载(StatefulSet)或创建守护进程集(DaemonSet),在“工作负载访问设置”步骤,单击“添加服务”。 访问类型:选择“节点访问 ( NodePort )”。 说明: 如果需要使用弹性IP通过公网访问该服务,请提前在集群的节点上绑定弹性IP。 Service 名称:自定义服务名称,可与工作负载名称保持一致。 服务亲和: − 集群级别:集群下所有节点的IP+访问端口均可以访问到此服务关联的负载,服务访问会因路由跳转导致一定性能损失,且无法获取到客户端源IP。 − 节点级别:只有通过负载所在节点的IP+访问端口才可以访问此服务关联的负载,服务访问没有因路由跳转导致的性能损失,且可以获取到客户端源IP。 端口配置: − 协议:请根据业务的协议类型选择。 − 容器端口:容器镜像中工作负载实际监听的端口,取值范围为165535。 − 访问端口:容器端口映射到节点私有IP上的端口,建议选择“自动生成”。 自动生成:系统会自动分配端口号。 指定端口:指定固定的节点端口,默认取值范围为3000032767。若指定端口时,请确保同个集群内的端口唯一性。 步骤 2 完成配置后,单击“确定”。 步骤 3 单击“下一步:高级设置”进入高级设置页面,直接单击“创建”。 步骤 4 单击“查看工作负载详情”,在访问方式页签下获取访问地址,例如“192.168.0.160:30358”。 工作负载创建完成后设置 您可以在工作负载创建完成后对Service进行配置,此配置对工作负载状态无影响,且实时生效。具体操作如下: 步骤 1 登录CCE控制台,在左侧导航栏中选择“工作负载 > 无状态负载 Deployment”,在工作负载列表页单击要设置Service的工作负载名称。 说明: 如果当前Service被关联到Ingress,则更新Service的端口信息后Ingress将不可用,需要删除重建。 步骤 2 在“Service”页签,单击“添加Service”。 步骤 3 在“添加Service”页面,访问类型选择“节点访问 ( NodePort )”。 说明: 如果需要使用弹性IP通过公网访问该服务,请提前在集群的节点上绑定弹性IP。 步骤 4 设置节点访问参数: Service 名称:自定义服务名称,可与工作负载名称保持一致。 集群名称:工作负载所在集群的名称,此处不可修改。 命名空间:工作负载所在命名空间,此处不可修改。 关联工作 负载:要添加Service的工作负载,此处不可修改。 服务亲和: − 集群级别:集群下所有节点的IP+访问端口均可以访问到此服务关联的负载,服务访问会因路由跳转导致一定性能损失,且无法获取到客户端源IP。 − 节点级别:只有通过负载所在节点的IP+访问端口才可以访问此服务关联的负载,服务访问没有因路由跳转导致的性能损失,且可以获取到客户端源IP。 端口配置: − 协议:请根据业务的协议类型选择。 − 容器端口:容器镜像中工作负载程序实际监听的端口,需用户确定。nginx程序实际监听的端口为80。 − 访问端口:容器端口映射到节点私有IP上的端口,建议选择“自动生成”。 自动生成:系统会自动分配端口号。 指定端口:指定固定的节点端口,默认取值范围为3000032767。若指定端口时,请确保同个集群内的端口唯一性。 步骤 5 单击“创建”。工作负载已添加“节点访问 ( NodePort )”的服务。 验证访问方式 步骤 1 在管理控制台首页,单击“计算 > 弹性云主机”。 步骤 2 在弹性云主机页面,找到同一VPC内任意一台云服务器,并确认连接到访问地址中IP与端口的安全组是开放的。 步骤 3 单击“远程登录”,弹出登录页面,输入用户密码登录。 步骤 4 使用curl命令访问工作负载验证工作负载是否可以正常访问。 说明: 节点访问(NodePort)会在集群内节点上分配一个虚拟IP,即可以在集群内部通过虚拟IP的验证方式验证。其中,虚拟IP访问端口默认与容器端口一致。 如果需要使用弹性IP通过公网访问该服务,请提前在集群的节点上绑定弹性IP。 curl 192.168.0.160:30358 其中“192.168.0.160:30358”为步骤4中获取到的访问地址,即节点虚拟IP+访问端口。 回显如下表示访问成功。 Welcome to nginx! body { width: 35em; margin: 0 auto; fontfamily: Tahoma, Verdana, Arial, sansserif; } Welcome to nginx! If you see this page, the nginx web server is successfully installed and working. Further configuration is required. For online documentation and support please refer to Thank you for using nginx. 更新Service 您可以在添加完Service后,更新此Service的端口配置,操作步骤如下: 步骤 1 登录CCE控制台,在左侧导航栏中选择“资源管理 > 网络管理”,在Service页签下,选择对应的集群和命名空间,单击需要更新端口配置的Service后的“更新”。 步骤 2 在更新Service页面,访问类型选择“节点访问 ( NodePort )”。 步骤 3 更新节点访问参数: Service 名称:您创建的Service名称,此处不可修改。 集群名称:工作负载所在集群的名称,此处不可修改。 命名空间:工作负载所在命名空间,此处不可修改。 关联工作负载:要添加Service的工作负载,此处不可修改。 服务亲和: − 集群级别:集群下所有节点的IP+访问端口均可以访问到此服务关联的负载,服务访问会因路由跳转导致一定性能损失,且无法获取到客户端源IP。 − 节点级别:只有通过负载所在节点的IP+访问端口才可以访问此服务关联的负载,服务访问没有因路由跳转导致的性能损失,且可以获取到客户端源IP。 端口配置: − 协议:请根据业务的协议类型选择。 − 容器端口:容器镜像中工作负载程序实际监听的端口,需用户确定。nginx程序实际监听的端口为80。 − 访问端口:容器端口映射到节点私有IP上的端口,建议选择“自动生成”。 自动生成:系统会自动分配端口号。 指定端口:指定固定的节点端口,默认取值范围为3000032767。若指定端口时,请确保同个集群内的端口唯一性。 步骤 4 单击“更新”。工作负载已更新Service。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        网络管理
        Service
        节点访问(NodePort)
      • 策略语法
        云服务名称 是否支持条件键 云通信短信 否 弹性文件服务 否 分布式消息服务Kafka 否 账务 是 分布式消息服务RabbitMQ 否 分布式消息服务RocketMQ 否 云硬盘 是 天翼云电脑(政企版) 是 内网DNS 否 CRM业务中台 是 分布式缓存服务Redis版 否 弹性云主机 是 弹性负载均衡 否 镜像服务 是 云监控 否 弹性伸缩服务 否 虚拟私有云 是 物理机 否 云硬盘备份 否 云主机备份 否 服务器安全卫士(原生版) 否 密钥管理 否 云间高速 否 统一身份认证 是 客服工单 是 容器云服务引擎CCSE 是 微服务应用平台MSAP 否 活动与券 是 消息管理 是 Web应用防火墙(原生版) 否 云审计 否 企业组织 是 VPC终端节点 否 NAT网关 是
        来自:
        帮助文档
        统一身份认证(一类节点)
        用户指南
        策略管理
        策略语法
      • 网络策略
        本节介绍网络的用户指南: 网络策略。 背景信息 Kubernetes网络策略(NetworkPolicy)是一种用于控制容器网络访问的资源对象。它基于标签(Label)选择器定义允许的网络流量白名单,控制Pod 之间的通信、Pod与外部服务的连接行为。通过网络策略可以实现细粒度的网络隔离,提升集群的安全性。Cubecni容器网络插件的策略路由模式和IPVLAN模式支持网络策略,独占ENI模式不支持网络策略。 开启网络策略 Cubecni网络插件,若开启网络策略,会额外消耗一部分系统资源,默认不开启网络策略。可在订购集群时开启网络策略,或集群创建后再开启网络策略。 订购集群 订购集群,若使用Cubecni插件,可选择开启网络策略。 已有集群 Cubecni若不低于v1.1.1版本,可参考如下操作步骤开启网络策略: a. 登录云容器引擎控制台,左侧导航栏选择集群; b. 在集群列表页面,单击目标集群名称,进入集群管理页面; c. 左侧导航栏,选择工作负载 > 守护进程; d. 命名空间 选择kubesystem ,找到cubecni 服务,点击右侧的更多>查看YAML; e. 点击编辑,将环境变量CHAININGRUNMODE的值改为on,点击保存; f. 等待Cubecni服务重启,待运行/期望Pod数量相等,说明重启完成。 备注:如下所示,cubecnidaemon镜像版本不低于v1.1.1,则支持手动开启网络策略。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        网络
        容器网络插件
        Cubecni网络插件
        网络策略
      • 使用K8s配置项替换配置文件
        本章节介绍如何使用K8s配置项替换配置文件 概述 当您选择使用Kurbenetes进行容器化部署时,可以使用配置项去保存一些不需要加密的配置信息,如JVM堆内存、JVM属性参数等,在创建或者部署应用时,系统会自动将配置信息直接注入到容器中。 在微服务云应用平台场景下,这种配置管理方式变得更加灵活和强大。微服务云应用平台不仅支持上述的配置注入,还允许您将配置项以文件的形式直接挂载到容器内的指定目录。这意味着,除了能够动态调整应用的运行参数外,您还可以确保这些配置信息以文件的形式存在,这不仅方便了日常的管理和维护工作,也使得在需要时更新配置或进行故障排查变得更为直观和高效,从而显著提升了整体的运维体验和工作效率。 前提条件 1. 您已开通微服务云应用平台 2. 您已订购一个云容器引擎实例 常用使用场景 覆盖目录下已经存在的文件 这里以常用的nginx镜像举例,在官方的nginx镜像中,/etc/nginx目录下的nginx.conf文件是需要配置的,并且在不同的环境下,该文件内容也不相同。此时,可以使用将配置项以文件形式挂载到容器指定目录下,覆盖原文件,来实现不同环境使用不同配置的效果。 首先需要创建K8s配置项,左侧导航栏,选择容器应用实例 > Kubernetes配置,进入到配置列表,点击左上角创建配置项。需要注意的是:配置项下的键值对映射,键是文件名称,值为文件内容。 挂载配置项,左侧导航栏,选择容器应用实例 > 应用发布 > 应用实例。在应用实例列表选择需要覆盖的应用,进入应用详情界面,点击上方新增版本按钮,进入应用配置界面,在配置管理模块下配置文件挂载。 在配置管理中,可以通过挂载文件的方式,向容器中注入配置信息。需要注意的是,在挂载文件路径中,需要填写到文件名称。如下图所示: 参数 描述 配置类型 目前只支持配置项。 挂载类型 挂载到文件。 挂载源 挂载到应用容器文件系统中的配置项的名称。 挂载主目录 设置容器的挂载主目录,必须以斜杠(/)开头。 文件挂载方式 保留原文件:保留原目录下的文件,添加本次挂载文件。注意,相同文件名将保留本次挂载文件,隐藏原目录重名文件。 挂载配置 要挂载的Key:需要挂载到应用容器文件系统中的配置项指定的Key。挂载文件路径:相对挂载主目录的子路径。
        来自:
        帮助文档
        微服务云应用平台
        快速入门
        使用K8s配置项替换配置文件
      • 操作类
        为什么第一次请求会比较慢? 因为函数是冷启动的,所以如果有初始化或者函数中有第一次执行比较耗时的操作,第一次请求会比较慢,后面接着的请求就会很快,因为此时容器还没有销毁。如果间隔一分钟没有请求,容器就会销毁。 如何读取函数的请求头? 函数入口中的第一个参数里面包含请求头,您可以打印函数执行结果,从而获取想要的字段。 如下图,event为函数入口的第一个参数,headers为请求头。 为什么函数实际使用内存大于预估内存,甚至触发OOM? 1. 函数调用过程中,运行时会解析和缓存传入的event事件, 这部分操作会消耗额外的内存。 2. 函数调用结束后,回收的内存首先会放入内部内存池中,并不一定归还给操作系统,导致内存偏高,在高并发场景下这种现象会更加明显。 函数内存超限返回“runtime memory limit exceeded”,如何查看内存占用大小? 请在函数请求返回界面查看。 查看oom内存大小 如何定位自定义镜像执行失败“CrashLoopBackOff”的原因? 若出现“CrashLoopBackOff: The application inside the container keeps crashing”错误字段: 1. 请根据页面提示信息诊断原因。 查看执行结果 2. 请参见开发HTTP函数示例章节进行容器镜像自验证。 3. 排查镜像是否为x86 linux架构,目前仅支持x86 linux架构镜像。
        来自:
        帮助文档
        函数工作流
        常见问题
        操作类
      • 功能特性
        功能集 功能 功能描述 应用生命周期管理 创建/部署/更新/查看/启动/停止/删除应用 创建/部署/更新/查看/启动/停止/删除应用。 高级设置 设置启动命令 CAE 会根据预设的启动参数来启动容器 高级设置 设置环境变量 应用在系统中运行更需要配置特定的环境变量 高级设置 设置 Hosts 绑定 CAE 支持应用级别的实例,通过绑定 Hosts 对主机名进行解析,方便应用实例通过主机名进行访问 高级设置 设置持久化日志 CAE 集成了云日志服务的日志收集功能,支持将业务文件日志(容器内日志文件)、容器标准输出日志(stdio)无限制行数地收集至 ALS,便于您聚合分析。 高级设置 设置 NAS 存储 将 NAS 挂载至 CAE 应用实例,可以有效解决应用数据地持久化存储需求,并实现应用实例之间地数据共享 高级设置 设置 OSS 存储 OSS 适用于读多写少地场景,例如挂载配置文件或者前端静态文件等 高级设置 设置应用生命周期管理 如果您精通 K8s,且需要在应用容器启动前或者关闭前执行相关操作,例如运行前部署资源或者停止前优雅下线应用,可以设置应用生命周期管理 高级设置 设置配置项 配置项能够将环境配置信息和容器镜像解耦,方便您修改应用配置 配置管理 配置项(ConfigMap) 配置项是一种存储应用所需配置信息地资源类型,它可以作为容器运行环境中的环境变量,便于应用部署后灵活变更容器配置,也可以通过挂载配置文件的方式向容器中注入配置信息 配置管理 保密字典(Secret) 保密字典是一种用于存储和管理密钥、证书等敏感信息的资源类型。为避免敏感数据暴露到镜像或应用与任务部署参数中,推荐您使用 CAE 命名空间级别的保密字典 弹性管理 手动扩缩 在应用的实例负载过高时以手动方式添加新应用实例,在应用闲置时减少应用实例,能够高效利用应用资源、降低成本 弹性管理 自动扩缩 在分布式应用管理中,弹性伸缩能够感知应用内各个实例的状态,并根据实例状态自动增加或减少实例数量,即扩容或缩容 版本管理 版本回退 应用修改配置并部署后,会自动生成一个基于时间点的应用版本,您可以查看对应时间点应用版本的配置,也可以操作版本回退到指定时间点的应用版本 应用访问 基于 ELB 实现应用公网及私网访问 在 CAE 中部署应用后,可以通过添加公网 ELB 实现公网访问应用,也可以添加私网 ELB 实现同 VPC 内私网访问应用 注册中心 CAE 内置注册中心 CAE 为用户提供免费的内置 Nacos 注册中心,在无需购买或自建注册中心的情况下即可部署微服务应用到 CAE 平台 注册中心 自建 Nacos 注册中心 CAE 支持使用自建 Nacos 注册中心实现服务的注册与发现功能 微服务治理 无损上线 在应用启动过程中,无损上线为应用提供服务延迟注册、服务就绪检查和服务小流量预热的保护能力 微服务治理 无损下线 在应用执行部署、停止、回滚、缩容和重置时,通过无损下线来保证应用正常关闭 微服务治理 金丝雀灰度 对于部署在 CAE 的 Spring Cloud 或 Dubbo 微服务应用,为了确保升级操作的安全性,您可以通过启用灰度发布(即金丝雀发布)的灰度规则进行小规模验证,验证通过后再全量升级 微服务治理 限流降级 CAE 支持使用微服务引擎 MSE 实现应用的限流降级,全面保障应用的可用性 运维管理 基础监控 CAE 对应用所运行设备的 CPU、负载、内存、网络和磁盘进行数据采集与分析,并以动态图的方式展示,方便实时、直观地了解应用所运行设备地状态 运维管理 应用监控 CAE 为多种语言和框架提供无侵入的应用监控能力 运维管理 一键启停 CAE 为应用提供了一键启停按钮,方便用户进行运维操作,同时还支持批量启停操作
        来自:
        帮助文档
        云应用引擎
        产品介绍
        功能特性
      • 产品服务等级协议(SLA)
        视频 天翼云媒体存储服务等级协议 容器与企业中间件 云容器引擎服务等级协议 微服务云应用平台服务等级协议 分布式消息服务RabbitMQ服务等级协议 分布式消息服务RocketMQ服务等级协议 分布式消息服务Kafka服务等级协议 天翼云软件开发生产线CodeArts服务等级协议 天翼云应用性能监控APM服务等级协议 天翼云容器安全卫士服务等级协议 天翼云应用服务网格服务等级协议 天翼云微服务引擎服务等级协议 天翼云容器镜像服务等级协议 天翼云函数计算服务等级协议 安全 Web应用防火墙(边缘云版)服务等级协议 天翼云高防(边缘云版)服务等级协议 天翼云网站安全监测服务等级协议 天翼云爬虫管理平台服务等级协议 天翼云容器安全平台服务等级协议 天翼云托管检测与响应服务(原生版)服务等级协议 天翼云密评专区服务等级协议 天翼云日志审计服务等级协议 天翼云证书管理服务等级协议 天翼云云堡垒机服务等级协议 天翼云密钥管理服务等级协议 天翼云云安全中心服务等级协议 天翼云Web应用防火墙(原生版)服务等级协议 天翼云云防火墙(原生版)服务等级协议 天翼云Web应用防火墙(独享版)服务等级协议 天翼云漏洞扫描(专业版)服务等级协议 天翼云企业主机安全服务等级协议 天翼云态势感知(专业版)服务等级协议 天翼云云防火墙服务等级协议 天翼云运维安全中心(云堡垒机)服务等级协议
        来自:
        帮助文档
        法律声明
        服务等级协议
        产品服务等级协议(SLA)
      • 镜像基线检查
        本小节介绍镜像基线检查。 基线检查功能自动检测您私有镜像仓库中存在的配置风险,针对所发现的问题为您提供加固建议,帮助您正确地处理镜像内的各种风险配置信息,降低入侵风险并满足安全合规要求。 检测周期 企业主机安全每天凌晨自动进行一次全面的检查。 前提条件 已开启容器节点防护。 约束限制 仅支持检测Linux镜像存在的配置风险。 检测项 确保系统中不存在账号名或UID相同的账号 UID为0的非root账号检查 代码中的口令检查 确保系统中不存在相同密码哈希值的账号 禁止使用弱密码哈希算法 确保帐户密码不为空 确保系统中不存在相同组名或GID 确保没有非特权账号加入特权组 确保/etc/passwd中不存在旧的"+"条目 确保/etc/shadow中不存在旧的"+"条目 确保/etc/group中不存在旧的"+"条目 确保/etc/passwd中的所有组都存在于/etc/group中 确保配置了密码有效期 确保所有用户的密码更改日期都是过去日期 禁用建立host信任 禁止建立预置的root级别的信任关系 确保root帐户的默认组为GID 0 确保shadow组为空 操作步骤 1、登录管理控制台。 2、在弹窗界面单击“体验新版”,切换至企业主机安全页面。 说明 切换至新版后,在总览页左上角单击“返回旧版”,可切换至企业主机安全(旧版) 3、 在左侧导航树中,选择“风险预防 > 容器镜像安全”。 4、 选择“镜像基线检查”页签,查看镜像中存在的配置风险。 5、单击检测项前的,查看该检测项的详情、存在的问题及加固建议,并根据加固建议修复有风险的配置信息。
        来自:
        帮助文档
        企业主机安全
        用户指南
        风险预防
        容器镜像安全
        镜像基线检查
      • 防护配置类
        本文介绍容器安全卫士防护配置类常见问题。 标准版支持设置单条防护规则的防护状态吗? 支持。 标准版提供具体防护规则的防护开关。您可以根据业务需要选择开启或关闭规则的防护。 标准版支持对同一节点下发不同防护策略吗? 不支持。默认使用“默认策略”进行防护,创建策略时已生成防护策略的节点是不可重复选择的。若想重新配置策略,需要先解绑已有策略,然后再重新绑定。 标准版支持入侵检测规则自定义吗? 支持。可以在“容器安全 > 策略管理”中进行自定义,包括命令执行、网络活动、读写文件、文件内容。 标准版镜像安全扫描支不支持仓库镜像扫描? 支持。除了支持天翼云仓库以外,还支持Harbor、JFrog、Huawei、Huawei CCE Agile、AWS、Aliyun、Registry、Microsoft。
        来自:
        帮助文档
        容器安全卫士
        常见问题
        防护配置类
      • 配置管理(1)
        在云应用引擎中,应用配置可以通过 ConfigMap 和 Secret 管理,实现配置与容器镜像的分离。ConfigMap 适用于存储普通配置,如配置文件内容或命令行参数,更新配置无需重建镜像。 Secret 用于存储敏感信息,如密码、证书或密钥,数据在内存中安全处理并加密存储。两者都可通过文件挂载或环境变量注入容器。 资源类型 数据类型 注入方式 安全性 适用场景 ConfigMap 非敏感配置 文件挂载 / 环境变量 / 命令行参数 普通 配置频繁变动或公开数据 Secret 敏感信息 文件挂载 / 环境变量 高(加密存储) 密码、证书、密钥等机密数据 通过合理使用 ConfigMap 与 Secret,您可以实现 配置与应用解耦,提升应用管理的灵活性和安全性。
        来自:
      • 镜像缓存计费
        本文介绍弹性容器实例ECI的镜像缓存计费规则。 计费说明 镜像缓存可以加速拉取镜像,减少ECI实例启动的耗时。创建镜像缓存的方式分为手动创建和自动创建两种,两者的计费规则不同。 使用阶段 手动创建的镜像缓存 自动创建的镜像缓存 创建镜像缓存 临时资源(ECI实例)费用 快照费用 云硬盘费用 不收费 使用镜像缓存 云硬盘费用 如果镜像缓存大于40GiB,需要增加临时存储空间并为其付费 手动创建的镜像缓存 创建镜像缓存 计费项 计费说明 相关文档 临时资源(ECI实例)费用 系统将创建一个ECI实例(2 vCPU、4 GiB内存),并挂载一块普通IO云盘用于中转镜像缓存。镜像缓存创建完成后,ECI实例将被自动释放。其中ECI实例运行时长:受镜像大小影响,大的镜像相对耗时长 ECI实例计费 快照费用 一个镜像缓存对应一个普通快照。该快照的生命周期与镜像缓存的生命周期一致,保留镜像缓存需支付快照存储费用 云硬盘快照计费说明 云硬盘费用 云硬盘挂载至ECI实例用于中转镜像缓存,该云硬盘的生命周期与快照的生命周期一致,其中云硬盘容量:等于镜像缓存大小 云硬盘计费说明
        来自:
        帮助文档
        弹性容器实例
        计费说明
        计费项
        镜像缓存计费
      • 使用CAE实现微服务应用注册发现与服务调用
        部署 consumer 应用 1. 登录云应用引擎控制台 2. 左侧导航栏选择应用管理 > 应用列表 3. 点击创建应用,配置以下参数,点击下一步进入高级设置 1. 自定义应用名称,例如 consumer 2. 选择命名空间类型为系统创建,表示应用将会使用系统默认创建的命名空间,并关联 VPC、子网、安全组等网络资源 3. 设置应用部署方式为镜像部署。点击选择镜像,选择 Java 技术栈语言,在示例镜像标签页,找到 javaconsumer 镜像仓库,选择版本为v1.0,点击确定 4. 在容量设置区域,自定义单实例规格和实例数,这决定了应用初始运行的实例数量、系统为每个实例分配多少计算资源 4. 在高级设置页面中,展开服务注册发现区域,启用内置 Nacos 注册中心服务发现 5. 点击创建应用 查看应用部署结果 请耐心等待应用创建完成,大约需要1分钟。 说明 您可以在应用列表中查看已创建的应用,点击其中某个应用可以进入其详情页面。 在左侧导航栏选择基础信息,在实例列表页签中,可以查看已创建的应用实例。 配置公网访问应用 为了实现从公网访问 consumer 应用,您可以为应用绑定公网 ELB 实例。进入 consumer 应用的详情页面。在应用信息页签中,在应用访问设置区域选择基于 ELB 访问。点击添加公网 ELB 访问,在HTTP协议页签中,设置HTTP端口为80,容器端口为18082,然后点击确定。
        来自:
        帮助文档
        云应用引擎
        最佳实践
        使用CAE实现微服务应用注册发现与服务调用
      • 技术类
        本章节主要介绍故障演练服务技术类问题。 故障演练的实现原理是什么? 不同类型的故障动作实现原理各不相同,详细说明请参考故障动作库中的具体文档,下表简要概述了各类动作的核心原理: 分类 资源类型 动作类型 动作 简介 原理描述 计算 云主机 主机资源 主机宕机 使用云主机接口对实例进行关机 通过调用云主机关机OpenAPI触发关机 计算 云主机 CPU资源 CPU高负载 使用内部自研工具实施CPU高负载 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是启动自定义程序,空跑for循环来消耗CPU时间片 计算 云主机 内存资源 内存高负载 使用内部自研工具实施内存高负载 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 计算 云主机 磁盘资源 IO高负载 使用内部自研工具实施磁盘IO高负载 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 计算 云主机 磁盘资源 IO Hang 模拟磁盘产生IO Hang效果 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过fsfreeze命令模拟磁盘夯死表现 注意:设置磁盘夯死故障注入后,可能会导致应用无法读写文件产出异常,请谨慎使用 计算 云主机 磁盘资源 磁盘填充 使用内部自研工具实施磁盘填充 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过dd命令将数据写入文件 计算 云主机 网络资源 网络丢包 使用TC和Netem模拟主机内网络丢包 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络延迟 使用TC和Netem模拟主机内网络延迟 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络延迟 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络包重复 使用TC和Netem模拟主机内网络包重复 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络包重复 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络包乱序 使用TC和Netem模拟主机内网络包乱序 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络包乱序 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络包损坏 使用TC和Netem模拟主机内网络包损坏 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络包损坏 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 端口占用 模拟指定端口占用 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是启动自定义程序, 创建Socket对象并绑定到指定端口 计算 云主机 网络资源 DNS篡改 篡改指定域名解析到指定IP 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过修改本地DNS解析文件实现 计算 云主机 网络资源 DNS不可用 DNS解析不可用 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过修改本地DNS解析文件或防火墙规则实现 注意:该动作风险较大,请谨慎操作 计算 云主机 JVM故障 JVM延迟 向特定JVM进程注入方法调用延迟故障 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过Java Agent在JVM进程内插入sleep代码来实现 中间件 Redis 集群资源 主从切换 Redis主从切换 通过调用Redis主从切换OpenAPI,触发Redis集群实例进行主从切换 中间件 Redis 节点资源 Redis节点故障 Redis节点发生故障 通过调用Redis停止Redis服务OpenAPI,模拟Redis节点故障,故障会触发Redis HA机制进行自动恢复 中间件 Redis 节点资源 Proxy节点故障 Proxy节点发生故障 通过调用Redis停止Proxy服务OpenAPI,模拟Proxy节点不可用 中间件 Redis 节点资源 节点主机宕机 Redis节点关机 通过关闭节点主机,模拟节点宕机 中间件 Redis 节点资源 CPU高负载 Redis节点CPU高负载 在节点启动自定义程序,空跑for循环来消耗CPU时间片 中间件 Redis 节点资源 内存高负载 Redis节点内存高负载 在节点启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 中间件 Redis 节点资源 磁盘IO高负载 Redis节点磁盘IO高负载 在节点先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 中间件 Redis 节点资源 磁盘IO Hang Redis节点磁盘IO Hang 在节点通过fsfreeze命令模拟磁盘夯死表现 中间件 Redis 节点资源 网络丢包 Redis节点网络丢包 在节点通过增加TC和Netem规则模拟主机内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 中间件 Kafka 节点资源 Broker节点主机宕机 Broker节点关机 指定或随机一个Broker节点进行关机 中间件 Kafka 节点资源 Broker节点CPU高负载 Broker节点CPU高负载 指定或随机一个Broker节点启动自定义程序,空跑for循环来消耗CPU时间片 中间件 Kafka 节点资源 Broker节点磁盘IO高负载 Broker节点磁盘IO高负载 指定或随机一个Broker节点先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 中间件 Kafka 节点资源 分区Leader不可用 分区Leader发生故障 指定一个或多个分区Leader,通过调用Kafka模拟Leader故障OpenAPI,触发Leader重新选举 中间件 RCC 集群资源 停止服务 注册配置中心集群服务故障 通过调用RCC停止集群OpenAPI,模拟RCC集群服务故障 中间件 RCC 节点资源 停止节点 注册配置中心节点故障 通过调用RCC停止节点OpenAPI,模拟RCC节点故障 云容器 容器集群 节点资源 托管Master节点宕机 关闭云容器引擎Master节点主机 通过关闭云容器引擎Master节点主机,模拟Master节点宕机(支持托管版本和智算版) 云容器 容器集群 节点资源 节点宕机 关闭云容器引擎纳管的节点主机 通过关闭云容器引擎纳管的节点主机,模拟节点宕机(支持Worker节点或专有版容器Master节点) 云容器 容器集群 节点资源 Etcd节点宕机 停止Etcd服务,模拟Etcd节点宕机 通过停止Etcd节点上的服务,模拟Etcd节点宕机 云容器 集群Node CPU资源 CPU高负载 使用内部自研工具实施CPU高负载 启动自定义程序,空跑for循环来消耗CPU时间片 云容器 集群Node 内存资源 内存高负载 使用内部自研工具实施内存高负载 启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 云容器 集群Node 磁盘资源 IO高负载 使用内部自研工具实施磁盘IO高负载 先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 云容器 集群Node 磁盘资源 磁盘填充 使用内部自研工具实施磁盘填充 通过dd命令将数据写入文件 云容器 集群Node 网络资源 网络丢包 使用TC和Netem模拟Node内网络丢包 通过增加TC和Netem规则模拟Node内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络延迟 使用TC和Netem模拟Node内网络延迟 通过增加TC和Netem规则模拟Node内网络延迟 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络包重复 使用TC和Netem模拟Node内网络包重复 通过增加TC和Netem规则模拟Node内网络包重复 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络包乱序 使用TC和Netem模拟Node内网络包乱序 通过增加TC和Netem规则模拟Node内网络包乱序 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络包损坏 使用TC和Netem模拟Node内网络包损坏 通过增加TC和Netem规则模拟Node内网络包损坏 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 DNS篡改 篡改指定域名解析到指定IP 通过修改本地DNS解析文件实现 云容器 集群Node 应用进程 进程停止 终止节点上的指定进程 通过kill 9停止节点上的指定进程 云容器 集群Node 应用进程 进程挂起 挂起节点上的指定进程 通过kill STOP挂起节点上的指定进程 云容器 集群Pod CPU资源 CPU高负载 使用内部自研工具实施CPU高负载 启动自定义程序,空跑for循环来消耗CPU时间片 云容器 集群Pod 内存资源 内存高负载 使用内部自研工具实施内存高负载 启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 云容器 集群Pod 磁盘资源 IO高负载 使用内部自研工具实施磁盘IO高负载 先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 云容器 集群Pod 磁盘资源 磁盘填充 使用内部自研工具实施磁盘填充 通过dd命令将数据写入文件 云容器 集群Pod 网络资源 网络丢包 使用TC和Netem模拟Pod内网络丢包 通过增加TC和Netem规则模拟Pod内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络延迟 使用TC和Netem模拟Pod内网络延迟 通过增加TC和Netem规则模拟Pod内网络延迟 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络包重复 使用TC和Netem模拟Pod内网络包重复 通过增加TC和Netem规则模拟Pod内网络包重复 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络包乱序 使用TC和Netem模拟Pod内网络包乱序 通过增加TC和Netem规则模拟Pod内网络包乱序 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络包损坏 使用TC和Netem模拟Pod内网络包损坏 通过增加TC和Netem规则模拟Pod内网络包损坏 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 DNS篡改 篡改指定域名解析到指定IP 通过修改本地DNS解析文件实现 云容器 集群Pod Pod资源 Pod删除 删除指定Pod 调用云容器引擎K8S API删除Pod 云容器 集群Pod 应用进程 进程停止 终止节点上的指定进程 通过kill 9停止节点上的指定进程 云容器 集群Pod 应用进程 进程挂起 挂起节点上的指定进程 通过kill STOP挂起节点上的指定进程 云容器 集群Pod JVM故障 JAVA方法调用延迟 指定JVM进程与方法增加调用延迟 通过Java Agent拦截指定JVM进程内方法,增加sleep操作模拟调用延迟 云容器 集群Pod JVM故障 JAVA方法抛自定义异常 指定JVM进程与方法抛出自定义异常 通过Java Agent拦截指定JVM进程内方法,增加thow操作模拟抛出异常 云容器 容器镜像 Harbor服务 Harbor服务不可用 停止Harbor服务,模拟容器镜像仓库不可用 通过调用容器镜像服务OpenAPI,停止Harbor服务,模拟容器镜像仓库不可用
        来自:
        帮助文档
        应用高可用
        常见问题
        故障演练服务
        技术类
      • 为应用挂载数据卷
        本文介绍如何为应用挂载数据卷。 Docker镜像是由多个文件系统叠加而成,当启动一个容器的时候,Docker会加载只读镜像层并在上面添加一个读写层。当删除Docker容器并通过该镜像重新启动时,之前的更改将会丢失。为了能够保存数据以及共享容器间的数据,Docker提出了数据卷的概念。简单来说,数据卷就是目录或者文件,它可以绕过默认的联合文件系统,以正常的文件或者目录的形式存在于主机上。 在Docker中,数据卷只是磁盘或另一容器中的目录。其生命周期不受管理,且Docker现在提供的卷驱动程序功能非常有限。容器引擎CCE采用的是Kubernetes的数据卷的概念,Kubernetes数据卷具有完善的生命周期管理,支持多种类型的数据卷,同时实例可以使用任意数量的数据卷。 云容器引擎支持四类本地磁盘挂载类型:支持hostPath、emptyDir、configMap、secret。各类型说明如下: hostPath:指定主机中的文件或目录挂载到容器的某一路径中; EmptyDir:用于临时存储,生命周期与容器实例相同。容器实例消亡时,EmptyDir会被删除, 数据会永久丢失; ConfigMap:将配置文件中的key映射到容器中,可以用于挂载配置文件到指定容器目录; Secret:将密钥中的数据挂载到指定的容器路径。 操作步骤 1.在创建应用或升级应用流程中,进去容器设置步骤,点击【数据存储】,点击【添加本地磁盘】,进入本地磁盘添加页面; 1)卷类型选择hostPath,表示在容器上挂载宿主机上的文件或目录。通常用于“容器应用程序生成的日志文件需要永久保存”或者“需要访问宿主机上Docker引擎内部数据结构的容器应用”,具体参数说明如下所示: 参数 参数说明 存储类型 选择主机路径 主机路径 输入主机路径,如/tmp 挂载路径 数据卷挂载到容器上的路径 注意: 请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。建议挂载在空目录下,若目录不为空,请确保目录下无影响容器启动的文件,否则文件会被替换,导致容器启动异常,应用创建失败 子路径 相对路径 权限 只读:只能读容器路径中的数据卷; 读写:可修改容器路径中的数据卷,容器迁移时新写入的数据不会随之迁移,会造成数据丢失; 2)卷类型选择emptyDir:容器分配到节点时系统将自动创建卷,初始内容为空。在同一个Pod中所有容器可以读写emptyDir中的相同文件。当Pod从节点上移除时,empryDir中的数据也会永久删除。通常用于临时数据的高速存储,具体参数说明如下所示: 参数 参数说明 存储类型 选择临时路径 磁盘介质 不勾选:存储在硬盘上,适用于数据量大,读写效率要求低的场景 勾选:存储在内存中,适用于数据量少,读写效率要求高的场景 挂载路径 数据卷挂载到容器上的路径。 注意: 请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。建议挂载在空目录下,若目录不为空,请确保目录下无影响容器启动的文件,否则文件会被替换,导致容器启动异常,应用创建失败 权限 只读:只能读容器路径中的数据卷 可写:可修改容器路径中的数据卷,容器迁移时新写入的数据不会随之迁移,会造成数据丢失 3)卷类型选择configMap:平台提供应用代码和配置文件的分离,configMap用于处理应用配置参数。用户需要提前创建应用配置,操作步骤请参见创建配置项,临时数据的高速存储,具体参数说明如下所示: 参数 参数说明 存储类型 选择配置项 配置项 选择已经建立好的配置项 说明: configMap需要提前创建 挂载路径 数据卷挂载到容器上的路径 权限 只读:只能读容器路径中的数据卷 4)卷类型选择secret:用户需要提前创建私密凭据,操作步骤请参见创建私密凭据,临时数据的高速存储,具体参数说明如下所示: 参数 参数说明 存储类型 选择私密凭据 卷类型 选择已经创建好的私密凭据 说明: secret需要提前创建,请参见 创建私密凭据 挂载路径 数据卷挂载到容器上的路径 权限 只读:只能读容器路径中的数据卷 2.点击【添加容器挂载】,可新增挂载项,点击【删除】可删除之前的容器挂载配置; 3.点击【确定】,完成本地磁盘的添加。
        来自:
        帮助文档
        云容器引擎(旧版)
        用户指南
        应用资源
        应用创建配置
        为应用挂载数据卷
      • 如何使用第三方镜像
        本文主要介绍如何使用第三方镜像。 操作场景 CCE支持拉取第三方镜像仓库的镜像来创建工作负载。 通常第三方镜像仓库必须经过认证(帐号密码)才能访问,而CCE中容器拉取镜像是使用密钥认证方式,这就要求在拉取镜像前先创建镜像仓库的密钥。 前提条件 使用第三方镜像时,请确保工作负载运行的节点可访问公网。 通过界面操作 步骤 1 创建第三方镜像仓库的密钥。 单击集群名称进入集群,在左侧导航栏选择“配置项与密钥”,在右侧选择“密钥”页签,单击右上角“创建密钥”,密钥类型必须选择为kubernetes.io/dockerconfigjson,如下图所示。详细操作请参见创建密钥。 此处的“用户名”和“密码”请填写第三方镜像仓库的帐号密码。 图 添加密钥 步骤 2 创建工作负载时,可以在“镜像名称”中直接填写私有镜像地址,填写的格式为domainname/namespace/imagename:tag,并选择步骤1中创建的密钥。 步骤 3 填写其他参数后,单击“创建工作负载”。
        来自:
        帮助文档
        云容器引擎
        用户指南
        工作负载
        容器设置
        如何使用第三方镜像
      • 存储概述
        容器存储是为容器工作负载提供存储的组件,支持多种类型的存储,同一个工作负载(pod)可以使用任意数量的存储。 说明: Kubernetes1.13版本之前的CCE集群不支持端到端容器存储扩容功能,PVC容量与存储容量不一致。 存储类型选择 创建工作负载时,可以使用以下类型的存储。建议将工作负载pod数据存储在云存储上。若存储在本地磁盘上,节点异常无法恢复时,本地磁盘中的数据也将无法恢复。 本地硬盘:将容器所在宿主机的文件目录挂载到容器的指定路径中(对应Kubernetes的HostPath),也可以不填写源路径(对应Kubernetes的EmptyDir),不填写时将分配主机的临时目录挂载到容器的挂载点,指定源路径的本地硬盘数据卷适用于将数据持久化存储到容器所在宿主机,EmptyDir(不填写源路径)适用于容器的临时存储。配置项(ConfigMap)是一种用于存储工作负载所需配置信息的资源类型,内容由用户决定。密钥(Secret)是一种用于存储工作负载所需要认证信息、密钥的敏感信息等的资源类型,内容由用户决定。详情参见本地磁盘存储。 云硬盘存储卷:CCE支持将云硬盘创建的硬盘挂载到容器的某一路径下。当容器迁移时,挂载的云硬盘将一同迁移。这种存储方式适用于需要永久化保存的数据。详情参见云硬盘存储卷。 文件存储卷:CCE支持创建SFS存储卷并挂载到容器的某一路径下,也可以使用底层SFS服务创建的文件存储卷,SFS存储卷适用于多读多写的持久化存储,适用于多种工作负载场景,包括媒体处理、内容管理、大数据分析和分析工作负载程序等场景。详情参见文件存储卷。 极速文件存储卷:CCE支持创建SFS Turbo极速文件存储卷并挂载到容器的某一路径下,极速文件存储具有按需申请,快速供给,弹性扩展,方便灵活等特点,适用于DevOps、容器微服务、企业办公等应用场景。详情参见极速文件存储卷。 快照与备份:CCE通过云硬盘为您提供快照功能,云硬盘快照指的是云硬盘数据在某个时刻的完整拷贝或镜像,是一种重要的数据容灾手段,当数据丢失时,可通过快照将数据完整的恢复到快照时间点。详情参见快照与备份。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        存储管理
        存储概述
      • 1
      • ...
      • 12
      • 13
      • 14
      • 15
      • 16
      • ...
      • 511
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      天翼云新春焕新季

      云主机开年特惠28.8元/年,0元秒杀等你来抢!

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      多活容灾服务

      GPU云主机

      训推服务

      AI Store

      公共算力服务

      应用托管

      科研助手

      推荐文档

      入门教程②:windows磁盘挂载流程

      天翼云最佳实践②:toa模块安装方法

      客户端下载安装

      概念

      创建只读实例

      查看业务关键性能指标

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号