活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      云监控服务_相关内容
      • 云容器集群节点内存高负载(1)
        2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎节点。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎节点实例。 添加故障动作 :单击立即添加 ,在列表中选择内存高负载动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 内存占用率:目标占用率(取值 0100)。 注意 建议您将目标内存占用率设置在 95% 以下,为操作系统内核和 kubelet 等关键系统进程预留足够的内存。若内存被完全耗尽,可能导致节点无响应、探针失联甚至节点进入 NotReady 状态,从而需要强制重启节点才能恢复。 3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到内存高负载动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录云容器引擎控制台,进入目标实例节点的监控指标页,观测内存使用率指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 是否出现响应变慢、处理失败率升高等现象。 执行 kubectl get pod o wide 查看 Pod 状态,确认是否有 Pod 因 OOMKilled 而被重启。 如果为相关 Pod 配置了基于内存的 HPA 策略,观察是否触发了自动扩容。 验证您的业务监控告警系统是否成功捕获到节点资源异常或应用性能劣化,并触发了相应告警。
        来自:
      • 云容器集群Pod内存高负载(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到内存高负载动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录云容器引擎控制台,进入目标实例节点的监控指标页,观测内存使用率指标。 验证您的业务监控告警系统是否成功捕获到节点资源异常或应用性能劣化,并触发了相应告警 2、业务应用验证: 观察运行在目标节点上的业务 Pod 是否出现响应变慢、处理失败率升高等现象。 如果为相关 Pod 配置了基于内存的 HPA 策略,观察是否触发了自动扩容。
        来自:
      • 套件概述(1)
        本节介绍智算套件概述。 前提条件 已创建云容器引擎智算版集群。 智算套件介绍 套件名称 套件功能 驱动管理 为GPU云主机或物理机的算力调度提供硬件驱动。 弹性数据集 支持数据集版本管理,提供弹性加载能力。 GPU安全容器 支持Kata安全容器运行时,满足业务高安全需求。 智算套件控制面引擎 提供高可用控制面,管理智算套件控制台正常运行。 监控 为集群提供硬件监控能力,可采集GPU/NPU,显存等,支持可视化查看GPU的分配、使用和健康状态。 网络 为集群容器提供使用RDMA网络的能力,包括IB和RoCE。 模型预热 将模型从对象存储预热到本地盘,大幅提升模型部署效率。 智能调度 为集群提供智能任务调度策略,可支持Gang、Capacity、Binpack/Spread和Queue等智能调度。 弹性训练 为集群提供AI任务接入,兼容主流AI框架和工具,包括TensorFlow、PyTorch、Horovod、Spark等。 故障诊断 为集群提供集群巡检、故障诊断等能力。 存储 为集群容器提供挂载HPFS和ZOS的能力。 日志 为集群的系统组件以及控制面组件收集日志。
        来自:
      • 云容器集群Pod网络延迟
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现响应延迟增加或请求超时。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群Pod网络延迟
      • 云容器集群Pod网络延迟(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现响应延迟增加或请求超时。
        来自:
      • 产品特性
        节点池管理 支持创建自定义节点池,借助节点池基本功能方便快捷地创建、管理和销毁节点,而不会影响整个集群。节点池中所有节点的参数和类型都彼此相同,您无法在节点池中配置单个节点,任何配置更改都会影响节点池中的所有节点。 工作负载 工作负载是在Kubernetes上运行的应用程序。无论您的工作负载是单个组件还是协同工作的多个组件,您都可以在Kubernetes上的一组Pod中运行它。在Kubernetes中,工作负载是对一组Pod的抽象模型,用于描述业务的运行载体,包括Deployment、Statefulset、Daemonset、Job、CronJob等多种类型。 CCE提供基于Kubernetes原生类型的容器部署和管理能力,支持容器工作负载部署、配置、监控、扩容、升级、卸载、服务发现及负载均衡等生命周期管理。 亲和/反亲和性调度 云容器引擎提供工作负载和可用区、工作负载和节点以及工作负载间的亲和性/反亲和调度。您可根据业务需求设置亲和性,实现工作负载的就近部署,容器间通信就近路由,减少网络消耗;您也可以对同个工作负载的多个实例设置反亲和部署,减少宕机影响,对互相干扰的应用反亲和部署,避免干扰。 网络访问方式 云容器引擎通过将Kubernetes网络和VPC深度集成,提供了稳定高性能的网络访问方式,能够满足多种复杂场景下工作负载间的互相访问。
        来自:
        帮助文档
        云容器引擎
        产品简介
        产品特性
      • 物理机计费项
        退订规则 退订云物理机后实例会进入冻结状态,冻结周期为15天,冻结期过后如不续费会删除实例。 具体退订规则说明,请参考费用中心退订规则说明。 提醒/通知规则 到期通知:服务到期前7天、3天邮件通知,到期前1天、当天邮件通知和短信提醒。 超期通知:服务超期1天邮件通知,超期3天、7天邮件通知和短信提醒。 到期与欠费 到期 到期是针对“包年/包月”的产品而言的,“按需计费”的产品,没有到期的概念。 “包年/包月”实例到期后无法在物理机管理控制台进行该实例的操作,相关接口也无法调用,自动化监控或告警等运维也会停止。如果在冻结期结束时您没有续费,实例将终止服务,系统中的数据也将被永久删除。 欠费 欠费是针对“按需计费”的产品和账户而言的,“包年/包月”的产品,没有欠费的概念。 “按需计费”实例是按每小时扣费,当余额不足,无法对上一个小时的费用进行扣费,就会导致实例欠费。您续费后解冻实例,可继续正常使用。 各使用周期内的资源状态 使用周期 状态 计费模式 正常使用周期内 运行中 包年/包月 剩余xx天到期 超期未续费,进入冻结期 冻结 包年/包月 已冻结,xx天后删除 超期未续费,已过冻结期 已删除 包年/包月 删除
        来自:
        帮助文档
        物理机 DPS
        计费说明
        物理机计费项
      • 创建应用实例
        配置项 描述 选择集群 选择要发布的ECS集群。 选择实例 选择要发布的ECS集群下的ECS实例。 部署包来源 根据部署包来源,支持自定义程序包、已有程序包以及官方Demo。自定义程序包:用户自己上传的程序包。参考配置上传包。已有程序包:用户通过制品库预先上传的程序包。参考配置已有程序包。官方Demo:平台提供的Demo包。请参考Demo类型。 上传包 用户自己上传的程序包。文件名称以大小写字母开头,大小写字母和数字结尾,中间由大小写字母、数字、中划线、下划线和点组成。仅自定义部署包需要。 已有程序包 选择应用下预先上传的程序包。仅已有程序包需要。 Demo类型 选择要使用的Demo类型。仅官方Demo需要。 制品版本 制品版本,相同应用下同名制品版本需唯一。自定义程序包和官方Demo需要。 监控及治理方案 用户可按需选择是否接入微服务治理和应用监控。使用前提:1. 接入前必须订购开通对应的产品。2. 技术栈版本允许接入微服务治理和性能监控。 微服务治理 设置服务注册与发现配置、无损上线等服务治理能力。具体参考高级配置微服务治理。 Tomcat配置 设置Tomcat的端口、应用访问路径以及最大线程等参数信息。具体参考高级配置Tomcat配置。 Java启动参数配置 设置GC策略和JVM内存配置等参数信息。具体参考高级配置Java启动参数配置。 限流降级配置 设置应用是否启用限流降级功能。具体参考高级配置限流降级配置。
        来自:
        帮助文档
        微服务云应用平台
        用户指南
        部署运维
        ECS应用实例
        创建应用实例
      • 以Go探针方式接入
        在监控Go应用之前,您需要通过客户端将应用数据上报至应用性能监控APM服务端。本文介绍如何通过OpenTelemetry Go探针上报Go应用数据。 前提条件 完成应用性能监控vpce接入。 Go 版本大于等于1.23。 请确保依赖库以及框架满足最低版本要求。 接入步骤 步骤1:下载探针 1. 登录应用性能监控控制台。 2. 在菜单栏中选择应用列表,点击接入应用,选择GO > Go探针。 3. 在下载Agent步骤中选择对应的架构,目前只支持linux系统 x86 和 arm64架构,点击即可下载对应的探针。 步骤2:编译应用 1. 解压并赋与解压后的otel文件执行权限。 plaintext unzip goagent.zip chmod +x otel 2. 对 Go 编译命令添加 otel 前缀,完成应用编译。例如 go build ... 命令将修改为./otel go build ...。注意:需要确保编译环境的go版本 > go mod里面指定的go版本。 plaintext ./otel go build o app 步骤3:添加环境变量,运行服务 plaintext OTELEXPORTEROTLPENDPOINT{ENDPOINT} OTELSERVICENAME.. OTELEXPORTEROTLPPROTOCOLgrpc OTELTRACESEXPORTERotlp license{TOKEN} ./app OTELSERVICENAME :应用名,多个使用相同 serviceName 接入的应用进程,在 APM 中会表现为相同应用下的多个实例。应用名最长63个字符,只能包含小写字母、数字及分隔符“ ”,且必须以小写字母开头,数字或小写字母结尾。 OTELEXPORTEROTLPENDPOINT:上报地址,注意这里不管哪种协议接入都必须添加
        来自:
        帮助文档
        应用性能监控 APM
        快速入门
        接入Go应用
        以Go探针方式接入
      • ALM-18025 Yarn被终止的任务数超过阈值
        本章节主要介绍ALM18025 Yarn被终止的任务数超过阈值的告警。 告警解释 告警模块按60秒周期检测Yarn root队列上被终止的应用的数量,当root队列上该监控周期内新增的被终止的应用的数量超过50,且连续发生3次以上时,触发该告警。 告警属性 告警ID 告警级别 是否自动清除 18025 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 大量应用任务被强制终止。 可能原因 人为强制终止大量任务。 系统出于某种错误终止任务。 处理步骤 检查告警详情 1.在FusionInsight Manager界面,选择“运维 > 告警 > 告警”,打开告警页面。 2.查看“Yarn被终止的任务数超过阈值”告警详情中的“附加信息”,确认监控阈值是否设置过小。 是,执行步骤3。 否,执行步骤4。 3.选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > Yarn > 其它 > root队列下被杀死的任务数”,修改该监控的阈值。执行步骤6。 4.选择“集群 > 待操作集群的名称 > 服务 > Yarn > ResourceManager(主)”,进入ResourceManager的WebUI页面。 5.单击“Applications”下的“KILLED”,单击最上面的任务。查看“Diagnostics”对应的描述信息,根据定位的任务被终止的详情(例如:被某用户终止)处理相关问题。 6.等待3分钟,查看该告警是否消除。 是,处理完毕。 否,执行步骤7。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-18025 Yarn被终止的任务数超过阈值
      • 系统状态
        本章节为您介绍系统状态模块的相关内容 系统状态可以帮助您确认堡垒机系统的运行状况,可监控系统CPU、内存、磁盘的使用状态,及时了解系统的运行状况。 查看系统状态 1. 使用管理角色账号登录云堡垒机。 2. 在左侧导航栏选择“系统管理 > 系统状态”,进入“系统状态”页面,即可查看系统状态。 系统监控可查看堡垒机的“CPU利用率”、“内存利用率”和“磁盘利用率”的情况,每1个小时记录一次数值。
        来自:
        帮助文档
        云堡垒机(原生版)
        用户指南
        管理员手册
        系统管理
        系统状态
      • 管理订阅渠道(1)
        订阅渠道即为指标、事件数据发送的目标接收端,本文主要介绍订阅渠道的管理。 操作场景 对于指标/事件数据,您如需要进行二次消费使用,可以先定义数据订阅渠道,再创建数据订阅任务时选择已经配置额订阅渠道即可。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 订阅渠道管理 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控服务”,进入监控概览页面。 4. 选择“数据订阅”菜单,进入数据订阅任务列表页面。 5.切换至“订阅渠道”页签,即可进入订阅渠道管理页面。
        来自:
      • 管理订阅渠道
        订阅渠道即为指标、事件数据发送的目标接收端,本文主要介绍订阅渠道的管理。 操作场景 对于指标/事件数据,您如需要进行二次消费使用,可以先定义数据订阅渠道,再创建数据订阅任务时选择已经配置额订阅渠道即可。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 订阅渠道管理 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控服务”,进入监控概览页面。 4. 选择“数据订阅”菜单,进入数据订阅任务列表页面。 5.切换至“订阅渠道”页签,即可进入订阅渠道管理页面。
        来自:
        帮助文档
        云监控服务
        快速入门
        管理订阅渠道
      • 云容器集群Pod进程停止
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到进程停止动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务请求量、应用提供服务平均响应时间等指标。 2、业务应用验证: 观测业务进程被终止后的表现。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群Pod进程停止
      • 云容器集群Pod进程停止(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到进程停止动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务请求量、应用提供服务平均响应时间等指标。 2、业务应用验证: 观测业务进程被终止后的表现。
        来自:
      • 基本概念
        本节主要描述在使用云容器引擎前,需理解该产品所涉及的概念,以便于您更好地理解容器产品。 关键词 说明 集群 集群指容器运行所需要的云资源组合,关联了若干服务器节点、负载均衡、专有网络等云资源。 专有版集群:需要创建1个Master(非高可用),或者3/5个Master(高可用)节点,以及若干Worker节点,可对集群基础设施进行更细粒度的控制,需要自行规划、维护、升级服务器集群。 托管版集群:只需创建Worker节点,Master节点由CCSE创建并托管,具备操作简单、低成本无需运维等特点。 节点 一台服务器(可以是虚拟机实例或者物理服务器)已经安装了Docker Engine,可以用于部署和管理容器。容器的Agent程序会被安装到节点上并注册到一个集群上。 专有网络VPC 专有网络VPC是您自己独有的云上私有网络。您可以完全掌控自己的专有网络,例如选择IP地址范围、配置路由表和网关等,您可以在自己定义的专有网络中使用天翼云资源如云服务器、云数据库和负载均衡等。 安全组 安全组是一种虚拟防火墙,具备状态检测和数据包过滤能力,用于在云端划分安全域。安全组是一个逻辑上的分组,由同一地域内具有相同安全保护需求并相互信任的实例组成。 应用目录 应用目录功能集成了Helm,提供了Helm的相关功能,并进行了相关功能扩展,例如提供图形化界面。 编排模板 编排模板是一种保存Kubernetes YAML格式编排文件的方式。 Kubernetes Kubernetes是一个开源平台,具有可移植性和可扩展性,用于管理容器化的工作负载和服务,简化了声明式配置和自动化。 容器(Container) 打包应用及其运行依赖环境的技术,一个节点可运行多个容器。 镜像(Image) 容器镜像是容器应用打包的标准格式,封装了应用程序及其所有软件依赖的二进制数据。 镜像仓库(Image Registry) 容器镜像仓库是一种存储库,用于存储Kubernetes和基于容器应用开发的容器镜像。 管理节点(Master Node) 管理节点是Kubernetes集群的管理者,运行着的服务包括kubeapiserver、kubescheduler、kubecontrollermanager、etcd组件,和容器网络相关的组件。 工作节点(Worker Node) 工作节点是Kubernetes集群中承担工作负载的节点,可以是虚拟机也可以是物理机。工作节点承担实际的Pod调度以及与管理节点的通信等。一个工作节点上的服务包括Docker运行时环境、kubelet、KubeProxy以及其它一些可选的组件。 命名空间(Namespace) 命名空间为Kubernetes集群提供虚拟的隔离作用。Kubernetes集群初始有3个命名空间,分别是默认命名空间default、系统命名空间kubesystem和kubepublic,除此以外,管理员可以创建新的命名空间以满足需求。 容器组(Pod) Pod是Kubernetes部署应用或服务的最小的基本单位。一个Pod封装多个应用容器(也可以只有一个容器)、存储资源、一个独立的网络IP以及管理控制容器运行方式的策略选项。 副本控制器(ReplicationController,RC) RC确保任何时候Kubernetes集群中有指定数量的Pod副本在运行。通过监控运行中的Pod来保证集群中运行指定数目的Pod副本。指定的数目可以是多个也可以是1个;少于指定数目,RC就会启动运行新的Pod副本;多于指定数目,RC就会终止多余的Pod副本。 副本集(ReplicaSet,RS) ReplicaSet(RS)是RC的升级版本,唯一区别是对选择器的支持,RS能支持更多种类的匹配模式。副本集对象一般不单独使用,而是作为Deployment的理想状态参数使用。 工作负载(Workload) 工作负载是在Kubernetes上运行的应用程序。 标签(Label) Labels的实质是附着在资源对象上的一系列Key/Value键值对,用于指定对用户有意义的对象的属性,标签对内核系统是没有直接意义的。标签可以在创建一个对象的时候直接赋予,也可以在后期随时修改,每一个对象可以拥有多个标签,但key值必须唯一。 服务(Service) Service是Kubernetes的基本操作单元,是真实应用服务的抽象,每一个服务后面都有很多对应的容器来提供支持,通过KubeProxy的ports和服务selector决定服务请求传递给后端的容器,对外表现为一个单一访问接口。 路由(Ingress) Ingress是授权入站连接到达集群服务的规则集合。您可以通过Ingress配置提供外部可访问的URL、负载均衡、SSL、基于名称的虚拟主机等。通过POST Ingress资源到API Server的方式来请求Ingress。Ingress Controller负责实现Ingress,通常使用负载均衡器,它还可以配置边界路由和其他前端,这有助于以高可用的方式处理流量。 配置项(ConfigMap) 配置项可用于存储细粒度信息如单个属性,或粗粒度信息如整个配置文件或JSON对象。您可以使用配置项保存不需要加密的配置信息和配置文件。 保密字典(Secret) 保密字典用于存储在Kubernetes集群中使用一些敏感的配置,例如密码、证书等信息。 卷(Volume) 和Docker的存储卷有些类似,Docker的存储卷作用范围为一个容器,而Kubernetes的存储卷的生命周期和作用范围是一个Pod。每个Pod中声明的存储卷由Pod中的所有容器共享。 存储卷(Persistent Volume,PV) PV是集群内的存储资源,类似节点是集群资源一样。PV独立于Pod的生命周期,可根据不同的StorageClass类型创建不同类型的PV。 存储卷声明(Persistent VolumeClaim,PVC) PVC是资源的使用者。类似Pod消耗节点资源一样,而PVC消耗PV资源。 存储类(StorageClass) 存储类可以实现动态供应存储卷。通过动态存储卷,Kubernetes将能够按照用户的需要,自动创建其所需的存储。 弹性伸缩(Autoscaling) 弹性伸缩是根据业务需求和策略,经济地自动调整弹性计算资源的管理服务。典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 可观测性(Observability) Kubernetes可观测性体系包含监控和日志两部分,监控可以帮助开发者查看系统的运行状态,而日志可以协助问题的排查和诊断。 Helm Helm是Kubernetes包管理平台。Helm将一个应用的相关资源组织成为Charts,然后通过Charts管理程序包。 节点亲和性(nodeAffinity) 节点亲和性指通过Worker节点的Label标签控制Pod部署在特定的节点上。 污点(Taints) 污点和节点亲和性相反,它使节点能够排斥一类特定的Pod。 容忍(Tolerations) 应用于Pod上,允许(但并不要求)Pod调度到带有与之匹配的污点的节点上。 应用亲和性(podAffinity) 应用亲和性决定应用Pod可以和特定Pod部署在同一拓扑域。例如,对于相互通信的服务,可通过应用亲和性调度,将其部署到同一拓扑域(例如同一个主机)中,以减少它们之间的网络延迟。 应用反亲和性(podAntiAffinity) 应用反亲和性决定应用Pod不与特性Pod部署在同一拓扑域。例如,将一个服务的Pod分散部署到不同的拓扑域(例如不同主机)中,以提高服务本身的稳定性。 服务网格(Istio) Istio是一个提供连接、保护、控制以及观测服务的开放平台,兼容社区Istio开源服务网格,用于简化服务的治理,包括服务调用之间的流量路由与拆分管理、服务间通信的认证安全以及网格可观测性能力。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        产品介绍
        基本概念
      • PahoSubscriber监控
        本文主要介绍PahoSubscriber监控 介绍APM采集的PahoSubscriber监控指标的类别、名称、含义等信息。 表PahoSubscriber监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 ::::::: PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) uri serviceUri PahoSubscriber连接的MQTT服务端uri ENUM LAST PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) msgType 报文类型 发送的报文类型 ENUM LAST PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) concurrentMax 最大并发 最大并发 INT MAX PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) errorCount 错误次数 错误次数 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) invokeCount 调用次数 调用次数 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) lastError 错误信息 错误信息 STRING LAST PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) maxTime 最大响应时间 最大响应时间 INT MAX PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) totalTime 总响应时间 总响应时间 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) range1 010ms 响应时间在010ms范围请求数 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) range5 110s 响应时间在110s范围请求数 INT SUM PahoSubscriber接收Publish报文监控(message,PahoSubscriber接收Publish报文监控。) range6 10s以上 响应时间在10s以上请求数 INT SUM PahoSubscriber接收Publish报文节点维度监控(uriMessage,PahoSubscriber接收Publish报文监控。) uri serviceUri PahoSubscriber连接的MQTT服务端uri ENUM LAST PahoSubscriber接收Publish报文节点维度监控(uriMessage,PahoSubscriber接收Publish报文监控。) errorCount 错误次数 错误次数 INT SUM PahoSubscriber接收Publish报文节点维度监控(uriMessage,PahoSubscriber接收Publish报文监控。) invokeCount 调用次数 调用次数 INT SUM PahoSubscriber接收Publish报文节点维度监控(uriMessage,PahoSubscriber接收Publish报文监控。) totalTime 总响应时间 总响应时间 INT SUM 异常(exception,PahoSubscriber调用的异常信息统计。) exceptionType 异常类型 异常类型 ENUM LAST 异常(exception,PahoSubscriber调用的异常信息统计。) causeType 异常类 发生异常的类 ENUM LAST 异常(exception,PahoSubscriber调用的异常信息统计。) count 次数 该异常的发生次数 INT SUM 异常(exception,PahoSubscriber调用的异常信息统计。) message 异常消息 该异常产生的异常消息 STRING LAST 异常(exception,PahoSubscriber调用的异常信息统计。) stackTrace 异常堆栈 该异常产生的堆栈信息 CLOB LAST PahoSubscriber主题维度监控(clientReceive,PahoSubscriber主题维度监控。) clientId clientId clientId ENUM LAST PahoSubscriber主题维度监控(clientReceive,PahoSubscriber主题维度监控。) topic 主题 主题 ENUM LAST PahoSubscriber主题维度监控(clientReceive,PahoSubscriber主题维度监控。) msgReceivedCount 消息接收次数 消息接收次数 INT SUM PahoSubscriber主题维度监控(clientReceive,PahoSubscriber主题维度监控。) bytesReceived 消息接收字节数 消息接收字节数 INT SUM PahoSubscriber版本(version,PahoSubscriber版本。) version 版本 版本 STRING LAST PahoSubscriber主题汇总(total,PahoSubscriber主题汇总信息统计。) msgReceivedCount 消息接收次数 总消息接收次数 INT SUM PahoSubscriber主题汇总(total,PahoSubscriber主题汇总信息统计。) bytesReceived 消息接收字节数 总消息接收字节数 INT SUM
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        物联网
        PahoSubscriber监控
      • 只读实例简介
        本章节会介绍如何什么是只读实例。 产品简介 目前,云数据库PostgreSQL的实例支持只读实例。 在对数据库有少量写请求,但有大量读请求的应用场景下,单个实例可能无法抵抗读取压力,甚至对主业务产生影响。为了实现读取能力的弹性扩展,分担数据库压力,您可以在某个区域中创建一个或多个只读实例,利用只读实例满足大量的数据库读取需求,以此增加应用的吞吐量。您需要在应用程序中分别配置主实例和每个只读实例的连接地址,才能实现将写请求发往主实例而将读请求发往只读实例。 只读实例为单个物理节点的架构(没有备节点),采用PostgreSQL的原生复制功能将主实例的更改同步到所有只读实例,而且主实例和只读实例之间的数据同步不受网络延时的影响,只读实例跟主实例在同一区域,但可以在不同的可用区。 功能特点 规格可以与主实例不一致,并可以随时更改规格(没有时间限制),便于弹性升降级。 不需要维护账号与数据库,全部通过主实例同步。 提供系统性能监控。 关系型数据库服务提供近20个系统性能的监控视图,如磁盘容量、IOPS、连接数、CPU利用率、网络流量等,用户可以轻松查看实例的负载。 功能限制 1个主实例最多可以创建5个只读实例。 备份设置:不支持备份设置以及临时备份。 实例恢复:不支持通过备份文件或任意时间点创建临时实例,不支持通过备份集覆盖实例。 数据迁移:不支持将数据迁移至只读实例。 数据库管理:不支持创建和删除数据库。 帐号管理:只读实例不提供创建帐号权限,如需增加只读实例帐号,请在主实例上操作。
        来自:
        帮助文档
        关系数据库PostgreSQL版
        用户指南
        只读实例
        只读实例简介
      • prometheus
        插件简介 Prometheus是一套开源的系统监控报警框架。它启发于Google的borgmon监控系统,由工作在SoundCloud的Google前员工在2012年创建,作为社区开源项目进行开发,并于2015年正式发布。2016年,Prometheus正式加入Cloud Native Computing Foundation,成为受欢迎度仅次于Kubernetes的项目。 在云容器引擎CCE中,支持以插件的方式快捷安装Prometheus。 插件官网: 开源社区地址: 插件特点 作为新一代的监控框架,Prometheus具有以下特点: 强大的多维度数据模型: a. 时间序列数据通过metric名和键值对来区分。 b. 所有的metrics都可以设置任意的多维标签。 c. 数据模型更随意,不需要刻意设置为以点分隔的字符串。 d. 可以对数据模型进行聚合,切割和切片操作。 e. 支持双精度浮点类型,标签可以设为全unicode。 灵活而强大的查询语句(PromQL):在同一个查询语句,可以对多个metrics进行乘法、加法、连接、取分数位等操作。 易于管理:Prometheus server是一个单独的二进制文件,可直接在本地工作,不依赖于分布式存储。 高效:平均每个采样点仅占 3.5 bytes,且一个Prometheus server可以处理数百万的metrics。 使用pull模式采集时间序列数据,这样不仅有利于本机测试而且可以避免有问题的服务器推送坏的metrics。 可以采用push gateway的方式把时间序列数据推送至Prometheus server端。 可以通过服务发现或者静态配置去获取监控的targets。 有多种可视化图形界面。 易于伸缩。 需要指出的是,由于数据采集可能会有丢失,所以Prometheus不适用对采集数据要100%准确的情形。但如果用于记录时间序列数据,Prometheus具有很大的查询优势,此外,Prometheus适用于微服务的体系架构。 约束与限制 1.11及以上版本的CCE集群支持此插件功能。 安装插件 步骤 1 在CCE控制台中,单击左侧导航栏的“插件管理”,在“插件市场”页签下,单击Prometheus下的“安装插件”按钮。 步骤 2 在安装插件页面,选择安装的集群和插件版本,单击“下一步:规格配置”。 步骤 3 在“规格配置”步骤中,配置以下参数: 表Prometheus配置参数说明 参数 参数说明 插件规格 根据业务需求,选择插件的规格,包含如下选项: 演示规格(100容器以内):适用于体验和功能演示环境,该规模下prometheus占用资源较少,但处理能力有限。建议在集群内容器数目不超过100时使用。 小规格(2000容器以内):建议在集群中的容器数目不超过2000时使用。 中规格(5000容器以内):建议在集群中的容器数目不超过5000时使用。 大规格(超过5000容器):建议集群中容器数目超过5000时使用此规格。 实例数 选择上方插件规格后,显示插件中的实例数,此处仅作显示。 容器 选择插件规格后,显示插件容器的CPU和内存配额,此处仅作显示。 监控数据保留期 自定义监控数据需要保留的天数,默认为15天。 存储 按照界面提示配置如下参数: 类型:支持云硬盘。 可用区:请根据业务需要进行选择。可用区是在同一区域下,电力、网络隔离的物理区域,可用区之间内网互通,不同可用区之间物理隔离。 子类型:支持普通IO、高IO和超高IO三种类型。 容量:请根据业务需要输入存储容量,默认10G。 说明: 若命名空间monitoring下已存在pvc,将使用此存储作为存储源。 步骤 4 单击“安装”。 待插件安装完成后,单击“返回”,在“插件实例”页签下,选择对应的集群,可查看到运行中的实例,这表明该插件已在当前集群的各节点中安装。 步骤 5 在CCE控制台中,单击左侧导航栏的“插件管理”,在“插件实例”中,单击“Prometheus”进入详情页,可以查看插件实例的详细情况。 升级插件 步骤 1 登录CCE控制台,在左侧导航栏中选择“插件管理”,在“插件实例”页签下,选择对应的集群,单击“Prometheus”下的“ 升级”。 说明: 如果升级按钮处于冻结状态,则说明当前插件版本是最新的版本,不需要进行升级操作。 升级“Prometheus”插件时,会替换原先节点上的旧版本的“Prometheus”插件,安装最新版本的“Prometheus”插件以实现功能的快速升级。 步骤 2 在基本信息页面选择插件版本,单击“下一步”。 步骤 3 参考安装插件中参数说明配置参数后,单击“升级”即可升级“Prometheus”插件。 卸载插件 步骤 1 在CCE控制台中,单击左侧导航栏的“插件管理”,在“插件实例”页签下,选择对应的集群,单击Prometheus下的“卸载”。 步骤 2 在弹出的窗口中,单击“是”,可卸载该插件。 参考资源 Prometheus概念及详细配置请参阅Prometheus 官方文档 Node exporter安装请参考nodeexporter github 仓库
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        插件管理
        prometheus
      • 修改Pushgateway监控配置
        本节主要介绍修改Pushgateway监控配置命令。 ./stor config set { i item } monitor pushgateway PUSHGATEWAY [ pushgatewaylabels LABEL & ] [ all ] [ pushgatewaytimeout PUSHGATEWAYTIMEOUT ] [ collectinterval COLLECTINTERVAL ] [ collectmetric COLLECTMETRIC [ collectmetricitems ITEM & ] ] [ { n server } SERVERID & ] 此命令用来修改Pushgateway监控配置。 说明 不建议修改默认携带的label:job、集群ID、集群名称、ServerIP、hostname。 参数 参数 描述 pushgateway PUSHGATEWAY 需要修改Pushgateway监控配置的地址和接口,格式为IPv4 :port 、[IPv6 ]:port 或者domainname :port。 pushgatewaylabels LABEL Pushgateway对应的标签值,格式为KEY:VALUE。一次可以修改多个标签值,以英文逗号(,)分开。 all 覆盖所有的labels或者所有的metric 配置。如果pushgatewaylabels LABEL 或 collectmetricitems ITEM未指定,此参数不生效。 pushgatewaytimeout PUSHGATEWAYTIMEOUT 指定向Pushgateway发送数据的超时时间。 取值:如果单位是s,取值为[1, 1000]范围的整数;如果单位是ms,取值为[1000, 1000000]范围的整数。默认单位是s。 collectinterval COLLECTINTERVAL 指定采集时间间隔。 取值:如果单位是s,取值为负整数、[2, 1000]范围的整数;如果单位是ms,取值为负整数、[2000, 1000000]范围的整数。默认单位是s。 注意 如果与collectmetric COLLECTMETRIC同时指定时,取值可以为负整数,表示不采集指定的监控指标。 如果不指定collectmetric COLLECTMETRIC时,表示设置所有监控指标的采集间隔,取值只能是允许范围内的正整数。 collectmetric COLLECTMETRIC 指定采集的监控指标。 取值为:server、fileSystem、interface、load、disk、tcp、os。 默认采集的上述所有监控指标。 collectmetricitems ITEM 指定监控指标下的配置项,目前仅监控指标disk、fileSystem、interface可以指定配置项。 说明 如果指定collectMetric,未指定配置项,默认修改指定collectMetric下的所有配置项。 如果未指定collectMetric,不能指定此参数。 n SERVERID 或 server SERVERID 指定要修改Pushgateway监控配置的HBlock服务器ID。一次可以修改多个HBlock服务器的Pushgateway监控配置,以英文逗号(,)分开。 默认修改所有HBlock服务器的Pushgateway监控配置。
        来自:
        帮助文档
        存储资源盘活系统
        命令行参考
        HBlock系统设置
        Pushgateway监控配置
        修改Pushgateway监控配置
      • 与开源Kafka的差异
        本文主要介绍 与开源Kafka的差异。 分布式消息服务Kafka在兼容开源Kafka基础上,对版本特性做了一定程度的定制和增强,所以,除了拥有开源Kafka的优点,分布式消息服务Kafka提供了更多可靠、实用的特性。 表分布式消息服务Kafka与开源Kafka的差异说明 对比类 对比项 分布式消息服务Kafka 开源Kafka :::: 简单易用 立等可用 即开即用,可视化操作,自助创建,自动化部署,分钟级创建实例,立即使用,实时查看和管理消息实例。 自行准备服务器资源,安装配置必要的软件并进行配置,等待时间长。 易出错。 简单API 提供简单的实例管理RESTFul API,使用门槛低。 无 成本低廉 按需使用 提供多种规格,按需使用,支持一键式在线进行实例代理个数、磁盘存储空间和代理规格扩容。 搭建消息服务本身需要费用,而且即使没有使用,所占用资源本身依旧要收费。 成本低廉 完全托管 租户不需要单独采购硬件资源,直接使用就绪的服务,无需额外成本。 需要购买硬件资源,自行搭建整个消息服务,使用和维护成本高。 实践验证 成熟度高 经受电商网站大规模访问考验,并且已经在云服务平台许多产品中使用,广泛部署运行在分布于世界各地的电信级客户云业务系统里。满足严苛的电信级故障模式库标准。紧随社区主流版本,修复开源bug,持续上线新功能,进行版本升级。 使用开源软件成熟度低,无法保证关键业务,商业案例少;自研周期长,并需要长时间进行验证。 实践验证 能力强大 100%兼容开源,支持一键扩容,深度优化开源代码提升性能和可靠性,支持消息查询等高级特性。 功能不完善,需额外投入进行开发。 稳定可靠 稳定高可用 支持跨AZ部署,提升可靠性。故障自动发现并上报告警,保证用户关键业务的可靠运行。 需要自己开发或基于开源实现,开发成本高昂,无法保证业务可靠运行。 稳定可靠 无忧运维 后台运维对租户完全透明,整个服务运行具有完备的监控和告警功能。有异常可以及时通知相关人员。避免724小时人工值守。 需要自行开发完善运维功能,尤其是告警及通知功能,否则只能人工值守。 稳定可靠 安全保证 VPC隔离,支持SSL通道加密。 需要自行进行安全加固。
        来自:
        帮助文档
        分布式消息服务Kafka
        产品简介
        与开源Kafka的差异
      • 使用限制
        端口 为保障云存储网关的通信,需要使用服务器上的一些端口,默认端口如下。 单机版: 端口 协议 用途 ::: 443 TCP Web端口 1443 TCP API端口 2623 TCP 管理端口 3262 TCP 内部端口 2633 TCP 监控端口 3260 TCP iSCSI端口 集群版: 端口 协议 用途 ::: 443 TCP Web端口 1443 TCP API端口 10070、19864、19866、19867 TCP 数据端口 3260 TCP iSCSI端口 3262、2624、18021 TCP 内部端口 18480、18485、8123 TCP 数据传输端口 18020 TCP 元数据端口 2623 TCP 管理端口 2633 TCP 监控端口 12181、12888、13888 TCP 系统端口 其他 注意 在部署云存储网关前,需要明确使用单机版还是集群版,因为一旦部署后,不支持通过增减服务器进行模式切换。
        来自:
        帮助文档
        云存储网关
        产品简介
        使用限制
      • 指标监控
        监控指标 概述 本文档介绍了云工作流监控指标的取值和含义,您可以通过这些指标查看工作流的执行情况与状态转换情况。 工作流执行(次) 指标名称 指标含义 统计周期 单位 执行开始 统计周期内工作流的启动执行次数 自定义,最长14天 次 执行成功 统计周期内工作流执行完成并成功次数 自定义,最长14天 次 执行失败 统计周期内工作流执行失败次数 自定义,最长14天 次 执行超时 统计周期内工作流执行超时次数 自定义,最长14天 次 工作流状态转换(次) 指标名称 指标含义 统计周期 单位 状态转换 工作流状态转换次数,产生一个执行事件算1次 自定义,最长14天 次 执行时长(秒) 指标名称 指标含义 统计周期 单位 执行时间 统计周期内工作流的平均执行时长 自定义,最长14天 秒
        来自:
        帮助文档
        函数计算
        用户指南
        云工作流
        控制台操作
        指标监控
      • 数据安全概览
        总览页面分为云服务全景图(资产地图)、数据采集安全、数据传输/存储安全、数据使用安全和数据交换/删除安全共五大板块,实时呈现了用户资产的具体情况。 前提要求 已完成资产访问的授权,参考云资产委托授权/停止授权进行操作。 已完成添加数据库资产,参考数据库资产清单进行操作。 操作步骤 1. 登录管理控制台。 2. 单击左上角的,选择区域或项目。 3. 在左侧导航树中,单击,选择“安全> 数据安全中心”,进入数据安全中心总览界面。 4. 查看数据安全中心服务的总览—云服务全景图。 提供数据资产地图,帮助客户建立数据资产的全景视图,可视化呈现数据资产分布、数据敏感程度、当前的风险级别。 梳理云上数据资产:自动扫描并梳理云上数据资产,地图化展示资产分布,帮助用户解决数据在哪里的问题。 敏感数据展示:基于DSC的三层数据识别引擎、预置合规规则、自然语义识别技术、文件相似度检测技术,对数据资产进行分类分级。 对数据资产按照“风险VPC数”、“风险安全组数”、“风险主机数”、“风险RDS数”、“风险OBS数”进行分类展示。 每类资产按照“高危”、“中危”、“低危”、“未识别风险”对敏感数据进行分级定位。 风险监控和预警:基于风险识别引擎,对数据资产进行风险监控,展示每类资产的风险分布,并预警。 说明 将鼠标移动到数据资产图标处,可查看资产相关信息。 单击数据资产图标,在界面的右侧弹框中可详细查看该资产的“基本信息”、“风险信息”或者“风险安全组规则”等信息。 5. 查看数据安全中心服务的总览—数据采集安全。 DSC根据敏感数据规则对敏感数据进行识别和敏感等级分类,您可以在总览页面查看您资产中不同风险等级的数据的分布情况。 基于敏感字段在文件中出现的累计次数和敏感字段关联组来判断文件的敏感性,并根据文件的敏感程度将其划分为四个等级:“未识别风险”、“低风险”、“中风险”和“高风险”。风险等级依次递增。具体风险等级情况说明: 未识别风险:0级 低风险:1~3级 中风险:4~7级 高风险:8~10级 在柱状图中,不同高度代表该风险等级的资产数量。将鼠标箭头放置在柱状图上,可查看该风险等级的资产数量。 6. 查看数据安全中心服务的总览—数据传输/存储安全。 数据传输安全:DSC统计了以下可能存在传输安全的项,您可以直接单击具体项的名称,查看详细情况。 VPN连接数:您的资产中存在已创建的虚拟专用网络,具体的请参考《VPN服务用户指南》。 云专线连接数:您的资产中存在已创建的云专线物理连接,具体的请参考《云专线用户指南》。 ELB未采用加密通信的监听器:添加监听器时,未使用加密通信HTTPS协议的监听器数量的统计,建议您采用HTTS协议进行加密通信,具体的操作请参见修改监听器。 SSL证书订阅:您的资产中存在已购买或者已上传的证书数量,了解SSL证书请参考《SSL证书管理用户指南》。 WAF未采用加密通信的域名:WAF中添加域名时,未使用加密传输HTTPS协议的域名数量的统计,建议您采用HTTPS协议进行加密通信,具体的操作请参见修改服务器信息。 数据存储安全:该模块为您罗列了存在未加密的对象桶,为了防止您的资产存在不必要的存储安全,建议您单击对象桶名称,前往OBS界面,对未加密的对象桶进行加密。 7. 查看数据安全中心服务的总览—数据使用安全。 该模块统计了“近30分钟”、“近3小时”、“近24小时”、“近7天”、“近30天”内的数据使用安全信息。 未处理异常事件:按“数据访问异常”、“数据操作异常”、“数据管理异常”所占比例进行展示。同时,展示了异常事件总数、违例确认总数和违例排除总数。 单击“未处理异常事件”中的其中一个颜色区域,可查看指定数据异常占比。 当不需要展示某种类型的异常事件时,单击事件分布图右侧攻击类型对应的颜色方块,取消在事件分布圆环中的展示。 Top5访问源IP:前5的访问源IP的统计。 Top5被访问高风险对象:被访问的对象中,排在前5的高风险对象。 Top5访问帐号:前5的访问帐号的统计。 8. 查看数据安全中心服务的总览—数据交换/删除安全。 数据交换安全:展示了已创建的“静态脱敏任务数”以及“水印API调用次数”,如何创建数据脱敏任务请参考创建数据脱敏任务。 数据删除安全:DSC为您统计了数据库、ECS、OBS资产的当日删除数和总删除数。
        来自:
        帮助文档
        数据安全中心
        用户指南
        数据安全概览
      • 链路查询
        展示当前租户下所有调用链路信息 概述 展示当前租户下所有调用链路信息。您可以根据多个筛选条件租户查询您想看的调用链,可以点击「TraceID」查看具体的调用链详情。 1. 登录微服务云应用控制台,左侧菜单栏选择“应用监控 >链路分析> 链路查询”,进入列表查看数据。 2. 在左侧导航栏中选择“调用链查询“”查看该应用实例/接口的调用链信息。 具体使用说明可参考天翼云官网的应用性能监控>用户指南>Trace详情文档
        来自:
        帮助文档
        微服务云应用平台
        用户指南
        应用监控
        链路分析
        链路查询
      • 权限管理
        本文主要介绍权限管理 如果您需要在云上购买的APM资源,给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制APM资源的访问。 通过IAM,您可以在云帐号中给员工创建IAM用户,并使用策略来控制员工对APM资源的访问范围。例如您的员工中有负责软件开发的人员,您希望开发人员拥有APM的使用权限,但是不希望开发的人员拥有删除服务发现规则等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅能使用服务发现规则,但是不允许删除服务发现规则的权限策略,控制服务对服务发现规则资源的使用范围。 如果帐号已经能满足您的使用需求,不需要创建独立的IAM用户进行权限管理,您可以跳过本章节,不影响您使用APM的其它功能。 IAM是提供权限管理的基础服务,无需付费即可使用,您只需要为您帐号中的资源进行付费。 APM权限 默认情况下,管理员创建的IAM用户没有任何权限,您需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对APM进行操作。 APM是全局级服务,在授予用户APM权限时,默认对APM支持的所有区域生效。APM资源是租户隔离的,当前租户下所有子用户共享资源,如果需要隔离资源,可以通过企业项目实现。 APM部署时不区分物理区域,为全局级服务。授权时,在“企业 > 项目管理”中设置权限,访问APM时,不需要切换区域。 如表所示,包括了APM的所有系统权限。 表 APM系统权限 角色名称 描述 类别 APM FullAccess 应用性能管理服务的所有执行权限。 系统策略 APM ReadOnlyAccess 应用性能管理服务的只读权限。 系统策略 下表列出了APM常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表 常用操作与系统权限的关系 操作 APM FullAccess APM ReadOnlyAccess 获取告警列表 √ √ 获取告警详情 √ √ 获取告警通知详情 √ √ 获取应用配置 √ √ 创建应用配置 √ x 删除应用配置 √ x 修改应用配置 √ x 获取标签 √ √ 新增标签 √ x 删除标签 √ x 修改标签 √ x 查询告警模板 √ √ 添加告警模板 √ x 删除告警模板 √ x 修改告警模板 √ x 获取通知 √ √ 删除通知 √ x 添加通知 √ x 修改通知 √ x 获取URL跟踪 √ √ 删除URL跟踪 √ x 添加URL跟踪 √ x 修改URL跟踪 √ x 获取URL跟踪视图 √ √ 获取URL跟踪列表 √ √ 获取全局拓扑 √ √ 获取子应用 √ √ 获取环境配置 √ √ 添加环境配置 √ x 删除环境配置 √ x 修改环境配置 √ x 获取实例 √ √ 删除实例 √ x 修改实例 √ x 获取监控项 √ √ 修改监控项 √ x 获取采集状态 √ √ 获取自定义告警策略 √ √ 删除自定义告警策略 √ x 修改自定义告警策略 √ x 添加自定义告警策略 √ x 获取环境拓扑 √ √ 获取指标视图 √ √ 获取调用链列表 √ √ 获取调用链详情 √ √ 获取采集器信息 √ √ 获取访问密钥 √ √ 修改访问密钥 √ x 删除访问密钥 √ x 添加访问密钥 √ x 获取通用配置 √ √ 修改通用配置 √ x
        来自:
        帮助文档
        应用性能管理
        产品介绍
        权限管理
      • 巡检项:查询
        参数 参数类型 说明 示例 下级对象 productType String 本参数表示产品类型。取值范围:vm:云主机。根据以上范围取值。 vm inspectionType Integer 本参数表示巡检类型。取值范围:1:资源健康评估。2:资源风险识别。根据以上范围取值。 1 inspectionItem Integer 本参数表示巡检项。取值范围:1:云主机性能评估。2:监控数据健康评估。3:云主机闲置资源检查。4:云主机磁盘使用预警评估根据以上范围取值。 1 inspectionItemName String 本参数表示巡检项名称 云主机性能评估 level Integer 本参数表示重要等级。取值范围:1:低。2:中。3:高。根据以上范围取值。 2 description String 巡检项描述 云主机磁盘空间耗尽风险 status Boolean 本参数表示巡检项状态。取值范围:true:正常。false:异常。根据以上范围取值。 true inspectionRules Array of Objects 巡检规则列表 inspectionRule
        来自:
        帮助文档
        云监控服务
        API参考
        API(新)
        智能巡检
        巡检项管理
        巡检项:查询
      • 云安全态势管理
        本章节为您介绍云安全态势感知基本功能 云安全态势感知页面默认为每天进行扫描并展示最新的扫描结果,其中包括通过率、已通过检查项、全部检查项。 策略管理 1. 登录云安全中心控制台。 2. 在左侧导航栏选择“风险管理 > 云安全态势管理”。 3. 在页面右上角中,选择“策略管理”。 4. 在页面右侧弹出的对话框中,根据业务需求选择策略管理内容。 5. 策略配置完成后,单击“保存”即可完成策略配置。 检查项扫描 您可以通过人工方式定期执行安全检查项,对云端资产进行全面安全扫描。 1. 登录云安全中心控制台。 2. 在左侧导航栏选择“风险管理 > 云安全态势管理”。 3. 选择需要执行的检查项,单击“操作”列的“扫描”按钮,在弹出的对话框中,单击“确定”即可开始扫描。 4. 开始扫描后,对应检查项的状态会变为“处理中”。 5. 扫描完成后,状态会变为“已通过”或“未通过”,可单击“操作”列的“详情”查看检查结果。
        来自:
        帮助文档
        云安全中心
        用户指南
        风险管理
        云安全态势管理
      • 什么是短信服务
        什么是短信服务(Short Message Service),简称SMS。是一种为用户的手机或其他电信终端提供直接发送或接收文字以及数字信息的服务。 什么是短信服务 短信服务(Short Message Service),简称SMS。 是一种为用户的手机或其他电信终端提供直接发送或接收文字以及数字信息的服务,用户每次能接收和发送短信的最大字符数,是70个中文字符,英文或数字字符。 是天翼云为用户提供的一种通信服务。 是天翼云依托运营商优势为广大企业客户提供的快速触达手机用户短信发送服务。调用API即可发送验证码、通知类短信;验证短信国内秒级触达,到达率最高可达99%;安全、可靠、稳定。 产品优势 支持向国内手机用户发送验证码、短信通知等内容。国内短信支持三网合一专属通道,与工信部携号转网平台实时互联。产品具备电信级运维保障,支持实时监控自动切换,到达率高达99%。 产品功能 短信验证码: 3秒可达,国内短信采用三网合一专属通道,与工信部携号转网平台实时互联。 通道正规、覆盖率高且安全稳定。 短信通知: 安全可靠:保证99%到达率,国内短信具备电信级运维保障,支持实时监控自动切换。 大容量高并发,智能调度。 异步通知: 支持通过回调方式通知用户,进而减少等待时间。 数据统计: 提供请求量、发送成功量、失败量等统计数据。 支持通过日期、手机号等维度查看短信发送详情。 群发助手: SaaS工具,可通过控制台进行短信发送,支持所有短信模板的发送任务。
        来自:
        帮助文档
        云通信-短信(文档停止维护)
        产品介绍
        什么是短信服务
      • 产品概述
        本章节概括介绍了边缘重保服务整体服务框架及其主要应用场景。 边缘重保服务可针对各类推广活动、重要会议、赛事、晚会等业务场景中的突发性流量压力及潜在的安全隐患,为客户核心业务提供全生命周期的保障。通过“事前全面分析和准备事中严格护航值守事后复盘优化”的三级保障体系,从底层资源入手,以业务功能可用性和应用服务的安全性为要义,为企业的核心业务提供多重保险,助力企业在流量洪峰中构建高可靠数字防线。 边缘重保服务以资深重保专家团队和成熟的边缘云系列产品为核心能力基础,辅以自研及第三方权威机构的各类工具,从前期的组织规划到过程中的作战保障及事后的复盘分析,构建核心业务加固、周期监控巡检、故障应急响应三位一体多重护甲的保障体系,为业务保驾护航,让您全程无忧! 整体服务框架 应用场景 营销推广: 618购物节、双十一购物狂欢节、双十二购物狂欢节、年货节等电商促销活动;品牌发布会、产品发布会等受公众瞩目的各类发布会。 晚会与庆典:春节联欢晚会、跨年晚会、中秋晚会、地方春晚等晚会型活动;国庆阅兵、国家级大型庆典类活动。 教育活动:中高考查分、高考志愿填报、中小学生开学第一课、各类职业资格或技能考试认证等大规模教育类活动。 重要赛事:奥运会、冬奥会、世界杯、欧洲杯、亚运会、大运会、热门联赛等重要竞技赛事。 大型会晤:两会、金砖会晤、经济贸易峰会、各类大型论坛等会晤型活动。 票务活动:春运车票、演唱会门票、热门景点门票、消费券发放、纪念币发行等限量抢购类活动。 其他:攻防演练、热门游戏发布、热门应用大版本更新、企业核心业务割接及其他需要保障支持类的场景。
        来自:
        帮助文档
        边缘重保服务
        产品介绍
        产品概述
      • 使用限制
        本节主要介绍使用限制。 集群和节点 云容器引擎对单个用户的资源数量和容量限定了配额,默认情况下,您最多可以创建5个集群(每个Region下),每个集群中可以选择50节点、200节点、1000节点、2000节点几种规格。 非高可用模式的集群在控制节点故障后将不可用,影响业务功能,不适用于商用场景,建议您选择“高可用”模式。 集群创建时将默认创建名称带有“cce”标识的安全组规则,删除或修改后可能导致集群无法正常使用。 集群名称、集群规模、高可用开关、网络模型、网段配置、服务转发模式在集群创建后将无法修改,请谨慎选择。 CCE集群默认安装采集探针,方便您在Web界面查看集群资源的日志和监控信息。 集群一旦创建以后,不支持变更以下项: 变更集群的控制节点数量,例如非高可用集群(控制节点数量为1)变更为高可用集群(控制节点数量为3)。 变更控制节点可用区。 变更集群的网络配置,如所在的虚拟私有云VPC、子网、容器网段、服务网段、IPv6、kubeproxy代理(转发)模式。 变更网络模型,例如“容器隧道网络”更换为“VPC网络”。 CCE创建的ECS实例(节点)目前支持“按需计费”和“包年/包月”,其他资源(例如负载均衡)为按需计费。如果资源所属的服务支持将按需计费实例转换成包年/包月实例,您可以通过对应的控制台进行操作。 集群中纳管计费模式为“包年包月”的节点时,无法在CCE控制台为其续费,用户需前往ECS控制台单独续费。 由于ECS(节点)等CCE依赖的底层资源存在产品配额及库存限制,创建集群、扩容集群或者自动弹性扩容时,可能只有部分节点创建成功。 ECS(节点)规格要求:CPU ≥ 2核且内存 ≥ 4GB。 通过搭建VPN方式访问CCE集群,需要注意VPN网络和集群所在的VPC网段、容器使用网段不能冲突
        来自:
        帮助文档
        云容器引擎
        产品简介
        使用限制
      • 计费模式
        计费模式支持包年/包月(预付费)计费方式。 云下一代防火墙是镜像类产品,计费模式支持包年/包月(预付费)计费方式。 订购云下一代防火墙系统会自动匹配合适的云主机,用户无需再单独购买云主机,云主机和云下一代防火墙会同步计费,云主机计费模式请参照云主机计费说明。 订购云下一代防火墙需同步提供弹性IP,弹性IP计费模式和带宽请参照弹性IP及带宽的计费说明。 说明 购买本产品会根据不同的选型配置自动配置云主机,并合计计费。 购买即包含基础功能:应用识别、监控统计、应用层访问控制、入侵防御(IPS)、用户认证功能。扩展功能为增值功能,需单独选购。 本产品一经订购不支持退订、降级,也不支持升级版本,请谨慎选择。 本产品需要绑定弹性IP进行管理,成功开通后请勿解绑该IP。
        来自:
        帮助文档
        云下一代防火墙
        计费说明
        计费模式
      • 1
      • ...
      • 46
      • 47
      • 48
      • 49
      • 50
      • ...
      • 636
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      镜像服务 IMS

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      天翼云CTyunOS系统

      公共算力服务

      智算一体机

      知识库问答

      人脸检测

      人脸实名认证

      推荐文档

      Android客户端需求

      完成授权

      产品定义

      充值不成功怎么办

      服务器迁移相关术语解释

      天翼云进阶之路②:Centos更改MySQL数据库目录位置

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号