活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 聚力AI赋能 天翼云大模型专项 大模型特惠专区·Token Plan 轻享包低至9.9元起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 企业出海解决方案 NEW 助力您的业务扬帆出海,通达全球!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
Token服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V4-Flash
  • GLM-5.1
  • Qwen3.5-122B-A10B
  • DeepSeek-V3.2(旗舰版)
  • GLM-5(正式版)
智算一体机
  • 智算一体机
智能体引擎
  • 智能体引擎
智算安全专区
  • 大模型安全评测
  • 大模型安全护栏
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2026智能云生态大会
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      云监控服务_相关内容
      • PG控制台程序部署
        username: root password: TesT@@135 driverclassname: org.postgresql.Driver version: file: localpath: /app/pg/localpackage platform: standalone 7. 启动管理平台,执行命令./startup.sh。 8. 管理平台启动成功后,打开配置库database,如pgadmin,在pgzookeeperinfo表插入预先部署好的Zookeeper服务的url。 参考SQL: 如果是mysql数据库使用以下sql 。 plaintext INSERT INTO pgadmin.telepgzookeeperinfo(zookeeperid, url, primarynamespace, username, password, enableacl, description, createuser, createtime, updateuser, updatetime) VALUES (1, '10.142.90.28:8791,10.142.90.29:8791,10.142.90.30:8791', 'pgcluster', NULL, NULL, '0', NULL, 'test', NOW(), NULL, NULL); 如果是pg数据库使用以下sql。 plaintext INSERT INTO pgadmin.telepgzookeeperinfo(zookeeperid, url, primarynamespace, username, password, enableacl, description, createuser, createtime, updateuser, updatetime) VALUES (1, '10.150.106.24:2181,10.150.106.25:2181,10.150.106.26:2181', 'pgcluster', NULL, NULL, '0', NULL, 'test', NOW(), NULL, NULL); 需要把10.142.90.28:8791,10.142.90.29:8791,10.142.90.30:8791 替换成部署好的Zookeeper服务的url 控制台自建用户: root/TeleHTAP@2020 2. 部署监控采集数据服务 参考文档《部署监控数据采集服务》。 3. 部署北向接口服务 如果有送北向的需求,请参考文档《部署北向接口服务》。
        来自:
        帮助文档
        分布式融合数据库HTAP
        私有云产品历史版本
        V1.0.0版本产品文档
        安装部署手册
        安装过程
        PG控制台程序部署
      • 微服务引擎仪表盘中的数据通过ServiceStage对接到AOM
        背景信息 部署到微服务引擎的Java Chassis应用,在微服务引擎仪表盘上的实时监控数据默认保留5分钟。如果需要持久化存储历史监控数据用于后续查询分析,可以使用ServiceStage的自定义指标监控功能,将微服务显示到微服务引擎仪表盘中的数据对接到AOM。 本章节以软件包部署应用为例,指导您完成将微服务引擎仪表盘中的数据通过ServiceStage对接到AOM。 操作步骤 1.添加依赖 在开发环境中,打开需要持久化存储历史监控数据的应用项目,在微服务pom文件中添加如下依赖: org.apache.servicecomb metricscore org.apache.servicecomb metricsprometheus 2.将添加依赖后的应用项目重新编译打包并上传。 3.部署组件 4.更新已部署组件来源 5.对接监控指标到AOM a. 登录ServiceStage控制台,选择“应用管理 > 应用列表”。 b. 单击组件所在应用名称,进入应用“概览”页。 c. 在“环境视图”页签,选择部署了组件的“环境”。 d. 单击组件名称,进入组件实例“概览”页。 e. 单击“更新升级”。 f. 选择“高级设置 > 运维监控 > 自定义指标监控”,填写下表参数: 参数名称 参数值 上报路径 /metrics 上报端口 9696 6.单击“重新部署”,等待组件重新部署成功。
        来自:
        帮助文档
        微服务云应用平台
        最佳实践
        微服务引擎仪表盘中的数据通过ServiceStage对接到AOM
      • 添加Pushgateway监控配置
        本节主要介绍如何使用API添加Pushgateway监控配置。 此操作用来添加Pushgateway监控配置。 说明 添加Pushgateway监控配置时,默认携带下列label:job、集群ID、集群名称、ServerIP、hostname。用户有权限修改或删除集群ID、集群名称、ServerIP、hostname,但不建议修改和删除。用户添加的自定义label与默认label同名时,则label取值以用户设置的为准。 请求语法 plaintext POST /rest/v1/system/config/monitor?serverIdserverid1,serverid2,serveridN HTTP/1.1 Date: date ContentType: application/json; charsetutf8 ContentLength: length Host: ip:port Authorization: authorization { "pushgateway":address:port, "pushgatewayLabels": { "key1": "value1", "key2": "value2", "key3": "value3", ... } } 请求参数 参数 类型 描述 是否必须 serverId String 指定添加Pushgateway监控配置的HBlock服务器ID。一次可以指定多个HBlock服务器的ID,以英文逗号(,)分开。如果不填写,默认为所有HBlock服务器添加Pushgateway监控配置。 否 pushgateway String 指定Pushgateway的地址和接口。 取值:格式为IPv4 :port 、[IPv6 ]:port 或者domainname :port。 是 pushgatewayLabels Object 指定Pushgateway对应的标签值。 取值:格式为"key ":"value"。 否 请求示例1 为服务器hblock2、hblock3添加Pushgateway监控配置。 plaintext POST /rest/v1/system/config/monitor?serverIdhblock3,hblock2 HTTP/1.1 Date: Fri, 24 May 2024 02:24:01 GMT ContentType: application/json; charsetutf8 Authorization: HBlock userName:signature ContentLength: 138 Host: 192.168.0.110:1443 { "pushgateway": "192.168.0.1:9091", "pushgatewayLabels": { "agent": "agentname", "idc": "idcname" } }
        来自:
        帮助文档
        存储资源盘活系统
        API参考
        HBlock系统设置
        Pushgateway监控配置
        添加Pushgateway监控配置
      • MongoDB数据库迁移
        迁移步骤 1.创建迁移任务 登录管理控制台,在服务列表中选择“数据库 > 数据库复制服务”,进入数据库复制服务信息页面。 在“实时迁移管理”页面,单击右上角“创建迁移任务”,进入迁移任务信息页面。 在“迁移实例”页面,填选任务名称、通知收件人、描述和迁移实例信息。 图 迁移实例信息 表 任务信息 参数 描述 任务名称 任务名称在4位到64位之间,必须以字母开头,不区分大小写,可以包含字母、数字、中划线或下划线,不能包含其他的特殊字符。 任务异常通知设置 该项为可选参数,开启之后,需要填写手机号码或者邮箱作为指定收件人。当迁移任务状态异常时,系统将发送通知给指定收件人。 说明 收到确认短信或邮件之后,需要在48小时内处理,否则该功能订阅无效。 时延阈值 增量迁移中,源数据库和目标数据库之间的同步有时会存在一个时间差,称为时延,单位为秒。 时延阈值设置是指时延超过一定的值后(时间阈值范围为1—3600s),DRS可以发送通知给指定收件人。 说明 首次进入增量迁移阶段,会有较多数据等待同步,存在较大的时延,属于正常情况,不在此功能的监控范围之内。 描述 描述不能超过256位,且不能包含!<>&'"特殊字符。 表 迁移实例信息 参数 描述 数据流动方向 选择入云。 源数据库引擎 选择MongoDB数据库引擎。 目标数据库引擎 选择DDS数据库引擎。 网络类型 选择公网网络。建议您开启SSL安全连接,SSL约降低2030%的迁移性能,但保证了数据的安全性。 目标数据库实例 选择您所创建的本云DDS实例。 迁移模式 § 全量全量为一次性迁移,如果您只进行全量迁移时,建议停止对源数据库的操作,否则迁移过程中源数据库产生的新数据不会同步到目标数据库。§ 全量+增量增量可以在全量迁移完成的基础上实现数据的持续同步。您可选择全量+增量的迁移模式,实现迁移过程中源业务和数据库继续对外提供访问 在“源库及目标库”信息页面,迁移实例创建成功后,填选源库信息和目标库信息,建议您单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通后,勾选协议,单击“下一步”。 图 源库及目标库信息 表 源库信息 参数 描述 IP地址或域名 配置源数据库MongoDB实例的访问地址或域名。 端口 配置源数据库MongoDB实例的服务端口,可输入范围为1~65535间的整数。 数据库用户名 访问源数据库MongoDB的用户名。 数据库密码 访问源数据库MongoDB的用户名所对应的密码。 SSL安全连接 在选择公网网络进行迁移任务时,为了提升数据在网络传输过程中的安全性,建议您开启SSL安全连接,对迁移链路进行加密,如果开启,需要您上传CA证书。 表 目标库信息 参数 描述 数据库实例名称 默认为创建迁移任务时选择的已创建的DDS实例,不可进行修改。 数据库用户名 访问目标端DDS实例的用户名。 数据库密码 访问目标端DDS实例的用户名所对应的密码。 在“迁移设置”页面,设置迁移对象。 图 迁移对象 表 迁移模式和迁移对象 参数 描述 迁移对象 选择您需要迁移的对象。迁移对象选择的粒度可以为库和表,对象迁移到DDS实例后,对象名将会保持与源数据库MongoDB实例对象名一致且无法修改。 在“预检查”页面,进行迁移任务预校验,校验是否可进行任务迁移。查看检查结果,如有失败的检查项,需要修复失败项后,单击“重新校验”按钮重新进行迁移任务预校验。 预检查失败项处理建议请参见《数据库复制服务用户指南》中的“预检查失败项修复方法”。 预检查完成后,且所有检查项结果均成功时,单击“下一步”。 图 预检查 说明 所有检查项结果均成功时,若存在告警,需要阅读并确认告警详情后才可以继续执行下一步操作。 在“任务确认”页面,选择迁移任务的启动时间,勾选协议,单击“启动任务”,提交迁移任务。 说明 迁移任务的启动时间可以根据业务需求,设置为“立即启动”或“稍后启动”。 预计迁移任务启动后,会对源数据库和目标数据库的性能产生影响,建议选择业务低峰期,合理设置迁移任务的启动时间。如果迁移不可避免业务高峰期,推荐使用迁移限速功能,即“流速模式”选择“限速”。 迁移任务提交后,开始启动迁移任务,您可以返回“实时迁移管理”页面,查看迁移任务状态。 2.任务管理 迁移任务启动后,会经历全量迁移和增量迁移两个阶段,对于不同阶段的迁移任务,您可以进行任务管理。全量迁移 查看迁移进度:全量迁移中的任务,您可单击任务名称,在“迁移进度”页签下,查看全量迁移进度。当全量迁移进度显示为100%,表示全量迁移已经完成。 增量迁移查看时延监控:全量迁移完成后,开始进行增量迁移。对于增量迁移中的任务,您可单击任务名称,在“迁移进度”页签下,查看增量迁移同步时延,当时延为0s时,说明源数据库和目标数据库的数据是实时同步的。您也可以使用“迁移对比”页签进行一致性对比。 图 查看时延监控 查看迁移对比:为了尽可能减少业务的影响和业务中断时间,增量迁移中的任务,您可单击任务名称,在“迁移对比”页签下,建议按照如下流程进行迁移对比,以便确定合适的业务割接时机。 图 迁移对比流程 具体的迁移对比操作及注意事项请参考《数据库复制服务用户指南》中“对比迁移项”章节。 3.割接建议 建议您选择一个业务低峰期,开始正式系统割接流程。割接前,请您确认至少在业务低峰期有过一次完整的数据对比。可以结合数据对比的“稍后启动”功能,选择业务低峰期进行数据对比,以便得到更为具有参考性的对比结果。由于同步具有轻微的时差,在数据持续操作过程中进行对比任务,可能会出现少量数据不一致对比结果,从而失去参考意义。 先中断业务(如果业务负载非常轻,也可以尝试不中断业务)。 在源数据库端执行如下语句,并观察在15分钟内若无任何新会话执行SQL ,则可认为业务已经完全停止。 db.currentOp() 说明: 上述语句查询到的进程列表中,包括DRS迁移实例的连接,您需要确认除DRS迁移实例的连接外无任何新会话执行SQL,即可认为业务已经完全停止。 通过DRS迁移任务监控页面进行观察同步时延,保持实时同步时延为0,并稳定保持一段时间;同时,您可以使用数据级对比功能,进行割接前的最后一次数据级对比,耗时可参考之前的对比记录。如果时间允许,则选择全部对比。 如果时间不允许,则推荐对比活跃表,关键业务表,第二步对比多次存在差异的表等。 确定系统割接时机,业务系统指向本云数据库,业务对外恢复使用,迁移完成。 4.迁移结束 结束迁移任务:业务系统和数据库切换至本云后,为了防止源数据库的操作继续同步到目标数据库,造成数据覆盖问题,此时您可选择结束迁移任务,该操作仅删除了迁移实例,迁移任务仍显示在任务列表中,您可以进行查看或删除。结束迁移任务后,DRS将不再计费。 删除迁移任务:对于已结束的迁移任务,您可选择删除任务。该操作将一并删除迁移任务,删除迁移任务后,该任务将不会出现在任务列表中。
        来自:
      • 修改告警联系组
        本文为您介绍编辑告警联系组的操作场景、前提条件和操作步骤。 操作场景 当告警联系组的组名、备注、组内联系人需要发生改变时,您可以在控制台进行修改。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 您已完成告警联系组的创建。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下拉菜单,单击“告警联系人/组”,进入告警联系人管理页面。 5. 单击“告警联系组”页签,在组名称所在“操作”列,单击“修改”,进入编辑联系组页面。 6. 在编辑联系组页面,根据页面提示进行修改,单击“确认”按钮。
        来自:
        帮助文档
        云监控服务
        用户指南
        联系人管理
        修改告警联系组
      • 创建告警联系组
        本文为您介绍创建告警联系组的操作场景、前提条件和操作步骤。 操作场景 告警通知将发送给对应告警联系组中的联系人,因此需要设置告警联系组。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 您已完成告警联系人的创建。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下拉菜单,单击“告警联系人/组”,进入告警联系人管理页面。 5. 单击“告警联系组”页签,单击“添加联系组”按钮,进入新建联系组页面。 6. 在新建联系组页面,操作相关联系人。 7. 点击“确定”按钮,完成告警联系组的创建。
        来自:
        帮助文档
        云监控服务
        用户指南
        联系人管理
        创建告警联系组
      • 健康检查
        开启健康检查 操作场景 用户可以配置运行状况检查,这些检查可用来监控后端云主机的运行状况,以便负载均衡器只将请求发送到正常运行的后端云主机。而当该故障云主机恢复正常运行时,负载均衡会将其自动恢复到对外或对内的服务中。 注意 健康检查支持协议TCP、UDP、HTTP。TCP协议监听器只可选TCP,UDP协议监听器只可选UDP。 HTTP协议/HTTPS协议监听器可选HTTP或TCP。 只支持在添加监听器操作过程中开启健康检查。 弹性负载均衡使用100.89.0.0/16(IPv4)、100:0:0:2:0:0:6459:0/112(IPv6)来对后端云主机做健康检查,如果开启健康检查功能需要在安全组时需要放通此网段。 操作步骤 1. 登录弹性负载均衡控制台。 2. 在顶部右侧选择弹性负载均衡所属区域,本文选择华东华东1。 3. 打开监听器配置向导创建监听器,在监听器负载方式&健康检查页面开启“健康检查”选项,并点击“立即创建”,则完成监听器健康检查功能开启。
        来自:
        帮助文档
        弹性负载均衡 ELB
        用户指南
        后端主机组
        健康检查
      • 查看集群监控指标
        本章节主要介绍查看集群监控指标。 操作步骤 1. 登录翼MR控制台。 2. 选择“我的集群 ”,单击集群名称进入集群详情页面。 3. 在集群详情页,选择“翼MR Manager”点击“前往翼MR Manager”进入运维管理平台。 4. 进入到翼MR Manager以后,选择“监控与告警 > 指标查询” ,即可查看集群监控指标。 5. 在“所属集群服务”选择需要查看的集群。 6. 在“IP”处选择待查询的相关角色实例的节点IP,可复选。 7. 在“分类”处选择需要设置的指标分类。默认勾选常用指标分类,可自主再添加其他选项,可供选择的选项如下:进程基础、线程基础、网络、CPU、磁盘、内存、edac、文件描述符、系统、文件系统、进程、socket、软中断、时钟、虚拟内存、xfs文件系统、ARP。 8. 在“时间范围”选择需要查看监控数据的时间段。可供选择的选项如下:昨天、上周、本周、上月、本月、去年、自定义。 9. 点击“查询”并显示所选指标分类。 10. 选择任意一种指标分类,点击左侧箭头展开,显示某一指标分类下的所有指标。 说明 常用指标类别共计18项,包含如下指标: 网卡接收比特率 网卡接收丢包率 网卡接收错误包率 网卡发送比特率 网卡发送丢包率 网卡发送错误包率 CPU使用率 磁盘读取平均用时 磁盘IO使用率 磁盘写入平均用时 磁盘IO操作平均用时 内存空闲率 1分钟平均负载 5分钟平均负载 15分钟平均负载 磁盘inode空闲率 磁盘容量空闲率 Blocked状态进程数 11. 选择任一类别下的某一指标,点击右侧的“展开绘图”即查看对应集群的监控指标。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        管理集群
        集群概览
        查看集群监控指标
      • 多云主机访问互联网,通过共享带宽降低成本
        多台云主机通过共享带宽可以极大的降低公网带宽的成本,本文向您介绍将多台云主机的弹性IP绑定至共享带宽的方式。 当有多台云主机需要访问互联网,每台主机有独立IP需求的场景。将云主机的弹性IP加入到一条共享带宽线路来实现云主机对互联网资源的访问,可以极大的降低公网带宽的成本。 通常多台云主机同时需要访问互联网时,每台主机对网络需求的时段并不完全统一。因此,如果要保障每个主机的带宽访问,而给云主机购买按照独占带宽计费方式的弹性IP的方式,会造成成本的增加。如果选择共享带宽,对于错峰访问或被访问互联网的云主机,在任何时间中网络总带宽都能达到共享带宽的最大值,通过多台主机复用同一个带宽线路的方式,可大幅减少带宽占用的成本。 具体步骤如下: 1. 进入云监控,查看弹性IP监控,可以看到弹性IP的峰值。 2. 对于峰值时段有明显区别的弹性IP,可以考虑加入到同一个共享带宽中。 3. 创建一个共享带宽。 4. 点击共享带宽信息列表中的“添加公网IP”选项,找到需要加入共享带宽的弹性IP。重复此步骤将全部弹性IP加入到共享带宽。 5. 在弹性IP页面可以看到弹性IP的带宽变为“共享”。 6. 可以尝试登录主机测试带宽速度。 7. 操作成功后,弹性IP将不会再单独计费,仅对共享带宽进行收费。
        来自:
        帮助文档
        共享带宽 SBW
        最佳实践
        多云主机访问互联网,通过共享带宽降低成本
      • 异常
        本文主要介绍异常 异常监控项是对应用的异常日志进行监控,比如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 查看异常日志 步骤 1 登录管理控制台。 步骤 2 单击左侧,选择“应用性能管理 APM”,进入APM服务页面。 步骤 3 在左侧导航栏选择“应用监控 > 指标”。 步骤 4 在界面左侧树单击待查看接口调用的环境后的。 步骤 5 单击“异常”,切换至异常页签。页面默认展示所“全部实例”的“异常日志”异常日志信息。 异常指标包括:类名、异常类型、日志类型、总次数、消息以及以及异常堆栈。请参照下表 日志版本指标包括:logType以及版本。 图 异常监控数据 表 指标说明 指标集 参数 说明 ::: 异常 类名 发生异常的所在类 异常 异常类型 该异常的类型 异常 日志类型 该异常打印所属的日志类型 异常 次数 异常发生的次数 异常 异常消息 该异常产生的异常消息 异常 异常堆栈 该异常产生的异常堆栈 日志版本 日志类型 日志类型 日志版本 日志版本 日志类型对应的版本 单击蓝色数值,可以查看所选时间段内该线程的趋势图。 单击“消息”列的蓝色文字,可以查看消息的详细内容,包括:时间和消息内容。 单击“异常堆栈”列的“查看详情”可以查看异常的详细信息。 单击“异常堆栈”列的“历史信息”可以查看该类名的历史异常堆栈列表。 单击“版本”列的蓝色文字,可以查看该版本的日志详情。 步骤 6 在异常页签选择您想要查看的“实例名称”,并选择“异常日志”,可以查看该实例在对应采集器下的应用异常监控数据。 图 选择实例、异常日志
        来自:
        帮助文档
        应用性能管理
        用户指南
        应用指标监控
        应用监控详情
        异常
      • 停用告警规则
        本文为您介绍停用告警规则的操作场景、前提条件和操作步骤。 操作场景 当您的告警规则临时需要停用时,您可以在控制台停用此告警规则。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 您已完成告警规则的创建。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下拉菜单,单击“告警规则”,进入告警规则详情页面。 5. 在“告警规则”界面,单击告警规则所在行“操作”列的“停用”,在弹出的“停用”界面,单击“确定”按钮,可以停用告警规则。 6. 或在“告警规则”界面,可勾选多个告警规则,单击批量“停用”,在弹出的“停用”界面,单击“确定”按钮,可以批量停用多个告警规则。
        来自:
        帮助文档
        云监控服务
        用户指南
        告警规则
        停用告警规则
      • 删除告警规则
        本文为您介绍删除告警规则的操作场景、前提条件和操作步骤。 操作场景 当您业务发生变更或告警规则不需要使用时,您可以删除该告警规则。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 您已完成告警规则的创建。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下拉菜单,单击“告警规则”,进入告警规则详情页面。 5. 在“告警规则”界面,单击告警规则所在行“操作”列的“删除”,在弹出的“删除告警规则”界面,单击“确定”,可以删除告警规则。 6. 或在“告警规则”界面,可勾选多个告警规则,单击“删除”,在弹出的“删除告警规则”界面,单击“确定”,可以删除多个告警规则。
        来自:
        帮助文档
        云监控服务
        用户指南
        告警规则
        删除告警规则
      • 高频问题
        本章节主要介绍高频问题 新创建应用、服务等资源后,AOM界面为何不实时显示监控数据? 当您新创建了主机、应用、组件、进程等资源后,ICAgent会以10分钟为周期进行周期性监控数据上报,AOM界面需要等待一个上报周期后方可展示相关监控数据。 删除主机、工作负载等资源后,AOM界面为何仍然显示资源状态为正常? 当您在CCE集群中删除了主机或工作负载等资源后,在AOM“主机监控”或“容器监控”界面显示资源状态仍为正常。此为正常现象,这是由于AOM“主机监控”或“容器监控”界面不会立即将资源状态置为已删除,而是会等待30分钟后将已删除的资源状态置为已删除。 如果界面上点击升级操作失败,该怎么办? 自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。 ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。 采集的日志文件是什么类型的? 在配置日志采集路径时,若日志采集路径配置的是目录,则默认采集目录下的日志(只采集.log、 .trace和 .out类型的文本日志文件);若配置的为具体某个文件,则直接采集对应文件。指定文件必须为文本文件,不支持其他类型(例如二进制日志文件)的日志文件。 采集器ICAgent对资源的占用大吗?例如内存、CPU。 AOM对基础指标的采集,包含VM、容器、进程的CPU、内存等基础指标。 资源消耗:对此类指标采集时,采集器ICAgent对资源的消耗和容器、进程个数相关。 正常业务量情况下,采集器ICAgent消耗内存约30M、单核CPU约3%。 使用限制:单节点上运行容器个数小于1000个。 保护机制: 采集器ICAgent对CPU资源的消耗最大不超过2核。 当采集器ICAgent对内存的消耗超过min{4G,节点物理内存/2}时,AOM将启动采集器重启保护。
        来自:
        帮助文档
        应用运维管理
        常见问题
        高频问题
      • 应用场景
        日志同步 在大型业务系统设计中,为了快速定位问题,全链路追踪日志,以及故障及时预警监控,通常需要将各系统应用的日志集中分析处理。 Kafka设计初衷就是为了应对大量日志传输场景,应用通过异步方式将日志消息同步到消息服务,再通过其他组件对日志做实时或离线分析,也可用于关键日志信息收集进行应用监控。 日志同步主要有三个关键部分:日志采集客户端,Kafka消息队列以及后端的日志处理应用。 1. 日志采集客户端,负责用户各类应用服务的日志数据采集,以消息方式将日志“批量”、“异步”发送Kafka客户端。 Kafka客户端批量提交和压缩消息,对应用服务的性能影响非常小。 2. Kafka将日志存储在消息文件中,提供持久化。 3. 日志处理应用,如Logstash,订阅并消费Kafka中的日志消息,最终供文件搜索服务检索日志,或者由Kafka将消息传递给Hadoop等其他大数据应用系统化存储与分析。 图 日志同步示意图 上图中Logstash、ElasticSearch分别为日志分析和检索的开源工具,Hadoop表示大数据分析系统。
        来自:
        帮助文档
        分布式消息服务Kafka
        产品简介
        应用场景
      • cstor-csi插件
        产品 provisioner storageClass type 类型 绑定模式 应用场景 备注 云硬盘 disk.csi.cstor.com cstorcsidisksatasc SATA 普通IO 立即绑定 由SATA存储介质构成的云硬盘。提供可靠的块存储,可运行关键应用程序 无 云硬盘 disk.csi.cstor.com cstorcsidisksatasctopology SATA 普通IO 延迟绑定 由SATA存储介质构成的云硬盘。提供可靠的块存储,可运行关键应用程序 为延迟绑定模式,它将在Pod调度后,根据调度所在的可用区,才创建该可用区的云硬盘。 云硬盘 disk.csi.cstor.com cstorcsidisksassc SAS 高IO 立即绑定 由SAS存储介质构成的云硬盘。提供高IO和低延迟性能,支持NoSQL/关系型数据库,数据仓库,文件系统等应用 无 云硬盘 disk.csi.cstor.com cstorcsidiskssdgenricsc SSDgenric 通用型SSD 立即绑定 通用型SSD类型,由SSD存储介质构成的云硬盘。提供可靠的块存储,适用于企业关键应用 无 云硬盘 disk.csi.cstor.com cstorcsidiskssdsc SSD 超高IO 立即绑定 由SSD存储介质构成的云硬盘。适用于超大带宽的读写密集型应用场景 无 云硬盘 disk.csi.cstor.com cstorcsidiskfastssdsc FASTSSD 极速型SSD 立即绑定 由SSD存储介质构成的云硬盘。适用于超大IOPS、超大带宽和超低时延的大型数据库应用场景 无 云硬盘 disk.csi.cstor.com cstorcsidiskxssd0sc XSSD0 XSSD0 立即绑定 高吞吐、低时延的场景 系统盘 中型开发测试 Web应用 中小型数据库 无 云硬盘 disk.csi.cstor.com cstorcsidiskxssd1sc XSSD1 XSSD1 立即绑定 超高吞吐和超低时延的场景 超大带宽的读写密集型场景 中大型数据库 无 云硬盘 disk.csi.cstor.com cstorcsidiskxssd2sc XSSD2 XSSD2 立即绑定 超高IOPS、超高吞吐量和超低时延 高负载、核心关键业务系统 超大型数据库 无 弹性文件 nas.csi.cstor.com cstorcsinascapacitysc capacity 容量型 立即绑定 适用于大容量、低时延的业务,如代码存储、日志存储、Web服务、虚拟桌面等 挂载弹性文件时,不涉及可用区概念,支持跨可用区访问 弹性文件 nas.csi.cstor.com cstorcsinascapacityperformancesc performance 性能型 立即绑定 适用于海量小文件、随机IO密集型以及时延敏感型业务,如高性能计算、文件共享、内容管理等 挂载弹性文件时,不涉及可用区概念,支持跨可用区访问 对象存储 zos.csi.cstor.com cstorcsizosstandardsc STANDARD 标准存储 立即绑定 提供高可靠、高可用、高性能的存储服务,适用于频繁访问(平均一月访问多次)的存储场景,比如移动应用、网站、音视频、社交图片、大数据分析等业务场景。 由于storageClass中需要保存用户对象存储的AK/SK的secret信息,不便于在部署时安装,所以需要用户在使用过程中自行构建storageClass 对象存储 zos.csi.cstor.com cstorcsizosstandardiasc STANDARDIA 低频存储 立即绑定 提供高可靠、低成本的存储服务,适用于不频繁访问(平均一月访问一次)的存储场景,但在需要时也能快速实时访问数据的业务场景,比如数据备份、监控数据存储等场景。 由于storageClass中需要保存用户对象存储的AK/SK的secret信息,不便于在部署时安装,所以需要用户在使用过程中自行构建storageClass 海量文件存储 oceanfs.csi.cstor.com cstorcsioceanfsmassivescsharepath massive 容量型 立即绑定 天翼云推出的全托管、可扩展海量文件系统,满足海量数据、高带宽型应用场景的需求。OceanFS能够弹性扩展至PB规模,具备高可用性和持久性,适用于多种应用场景,包括HPC、媒体处理、文件共享、内容管理和Web服务等。 海量文件存储 oceanfs.csi.cstor.com cstorcsioceanfsmassivescsubpath massive 容量型 立即绑定 天翼云推出的全托管、可扩展海量文件系统,满足海量数据、高带宽型应用场景的需求。OceanFS能够弹性扩展至PB规模,具备高可用性和持久性,适用于多种应用场景,包括HPC、媒体处理、文件共享、内容管理和Web服务等。 并行文件存储 hpfs.csi.cstor.com cstorcsihpfsperfsc hpfsperf 性能型 立即绑定 天翼云提供的高性能并行文件存储,支持全 NVMe 闪存、RDMA 技术,最高提供千万 IOPS 和 TBps 吞吐,同时保证亚毫秒级时延。具有高性能,高可靠性,高可扩展性的特点,充分满足影视渲染、气象分析、石油勘探、EDA 仿真、基因分析、AI 训练、自动驾驶等数据密集型场景的需求。 本地存储 local.csi.cstor.com cstorcsilocallocalpvsc 无 本地存储 立即绑定 天翼云CCSE容器引擎,基于云主机/裸金属的已有的文件系统,提供的本地存储的能力。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        存储
        cstor-csi插件
      • ALM-13008 ZooKeeper Znode数量使用率超出阈值
        本章节主要介绍 ALM13008 ZooKeeper Znode数量使用率超出阈值。 告警解释 系统每小时周期性检测ZooKeeper服务数据目录下二级znode状态,当检测到二级znode的总数量超过阈值时产生该告警。 告警属性 告警ID 告警级别 是否自动清除 13008 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 服务目录 产生告警的目录名称。 角色名 产生告警的角色名称。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 向ZooKeeper数据目录空间写入大量数据,导致ZooKeeper无法对外正常提供服务。 可能原因 往ZooKeeper数据目录空间写入大量数据。 自定义阈值设置不合理。 处理步骤 检查告警目录是否写入大量数据 1. 登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 >ZooKeeper”,单击“资源”,在精细化监控“资源使用(按二级Znode)”中单击“按Znode数量”,查看监控中是否有顶级Znode被写入较多数据。 是,执行步骤2。 否,执行步骤4。 2. 登录FusionInsight Manager,选择“运维 > 告警 > 告警”,打开告警“ALM13008 ZooKeeper Znode数量使用率超出阈值”左侧下拉菜单,在“定位信息”的“服务目录”中获取告警的Znode路径。 3. 以集群用户登录ZooKeeper客户端,删除告警对应Znode下的无用数据。 4. 登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 >ZooKeeper > 配置 > 全部配置”,搜索“max.znode.count”,即ZooKeeper目录的数量配额的最大值,告警阈值为该值的80%,修改调大该配置项,单击“保存”,重启服务使配置生效。 5. 观察界面告警是否清除。 是,处理完毕。 否,执行步骤 6。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-13008 ZooKeeper Znode数量使用率超出阈值
      • 版本特性
        版本 功能特性 1.10.14.4 基于开源Eureka版本1.10.14扩展,除了支持基本的Eureka注册中心功能之外,还提供引擎监控、服务上下线、服务数据轨迹功能。 说明:MSE注册配置中心Eureka引擎相比开源版本在一定程度上增强了可用性,使用注册配置中心Eureka可以更好地支撑生产业务
        来自:
        帮助文档
        微服务引擎
        用户指南
        注册配置中心
        Eureka
        版本特性
      • 产品定义
        本小节介绍云堡垒机产品定义。 云堡垒机(原生版)是一款运维安全管理产品,提供云上安全运维通道,集中管理云上资产及特权账号,统一监控审计运维操作行为,帮助企业满足等保合规测评要求。 产品功能 资产账密管理 支持统一管理、授权资产特权账户,账户在堡垒机中统一存储管理; 特权账户由堡垒机统一代理单点登录, 运维人员登录堡垒机后,无需输入资产账密即可自动登录服务器等资产,降低账密泄漏风险。 资产运维 支持WEB运维,支持主流浏览器无插件化运维,让运维脱离工具和操作系统束缚,随时随地远程运维; 支持PuTTY、SecureCRT、Xshell、WinSCP、Mstsc等专业运维工具完成运维。 安全认证 支持账密+OTP+短信双因子身份认证,保证运维用户登录堡垒机及资产的认证安全。 运维安全管控 支持命令控制、文件操作控制,对服务器中敏感、高危操作进行管控。 支持工单管理审批模式,重要运维需要授权人审批授权才能执行运维指令,保障敏感核心资源安全。 资产访问授权 集中管控用户访问系统和资源的权限,对系统和资源的访问权限进行细粒度设置,保障了系统管理安全和资源运维安全。
        来自:
        帮助文档
        云堡垒机(原生版)
        产品介绍
        产品定义
      • 架构地图
        本章节介绍应用容灾多活的架构地图功能。 概述 架构地图展示应用系统的容灾架构拓扑。 前提条件 已创建应用系统。 查看架构地图 1. 登录应用高可用服务控制台。 2. 单击左侧菜单栏应用容灾多活 ,在应用容灾多活菜单下单击数据双活/应用双活 ,进入数据双活/应用双活管理页面。 3. 在应用系统列表中找到需要查看的应用系统,单击应用系统名称 ,进入应用系统概览页。 4. 在左侧导航栏选择运维监控 ,在运维监控菜单下单击架构地图,进入架构地图页面。 5. 点击接入层节点图标,可以查看该节点的基本信息、接入信息、路由信息、节点列表和告警信息。 6. 点击应用层节点图标,可以查看该节点基本信息、服务列表、节点列表和告警信息。 7. 点击数据层节点图标,可以查看该节点的基本信息、节点列表和告警信息。 8. 点击数据同步节点图标,可以查看该节点的基本信息、同步配置和告警信息。 9. 鼠标悬停在任意节点上方,可以查看与此节点相关的数据流向信息。 说明 数据同步节点:未开启同步时会显示成红色,开启同步后则显示成黑色。
        来自:
        帮助文档
        应用高可用
        用户指南
        应用容灾多活
        运维监控
        架构地图
      • 设置检测规则
        本节介绍如何设置文件完整性保护检测规则。 操作步骤 1. 登录服务器安全卫士(原生版)控制台。 2. 在左侧导航栏,选择“文件安全 > 文件完整性保护”,进入文件完整性保护页面。 3. 单击列表右上方的“检测设置”,进入检测设置页面。 4. 配置相关参数。 参数 说明 启用文件变更检测 开启或关闭文件变更检测功能。 关键文件监控 系统内置:对系统关键文件、文件路径、文件目录进行实时监控,发现文件变更篡改行为进行告警。 自定义:根据用户特定的防护场景,自定义添加监控路径,发现文件变更篡改行为进行告警。 监控排除设置 对用户添加的信任文件路径不再进行监控,方便用户更加灵活创建检测策略。 设置生效范围 自定义选择需要执行文件变更篡改行为监控的服务器。 5. 配置完成后,单击“确认提交”。
        来自:
        帮助文档
        服务器安全卫士(原生版)
        用户指南
        文件安全
        文件完整性保护
        设置检测规则
      • Redis节点磁盘IO高负载(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到磁盘IO高负载 动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,可以通过以下多种方式验证演练效果。 1、观测实例指标: 在演练运行详情 页的监控指标 页签,观测磁盘读速率 和磁盘写速率指标。 登录分布式缓存服务Redis版 控制台, 进入目标实例的性能监控 页, 观测磁盘读速率 和磁盘写速率指标。 2、业务应用验证: 观察业务应用表现,查看是看是否出现请求响应变慢、写入延迟升高,部分读写请求可能超时或失败,整体吞吐量下降。
        来自:
      • 概览
        本文主要介绍CMDB管理概述。 应用性能监控默认内置了一个资源配置管理信息CMDB,您可用于组织应用结构信息以及相关配置信息,主要概念如下: 项目:用于组织和管理应用,在项目下还可以通过应用分组精细化管理应用。 环境: 即我们常说的开发环境、生产环境,是用于应用部署和运行的计算、网络、中间件等资源的集合。 例如可以把同VPC下的云容器引擎、注册中心、数据库等实例组成一个环境。 分组:在一个项目下面可以创建多个分组,主要起文件夹和管理的功能。 应用:应用是组成项目的某个业务实现,可独立部署运行,可以简单理解为一份代码程序对应一个应用,例如电商项目里的订单应用。一个应用可以部署到多个环境。 下图是一个CMDB结构示例: 在应用监控指标浏览页面,您可通过该组织结构进行更方便快捷的指标管理。
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        应用列表
        CMDB管理
        概览
      • Kafka Broker节点磁盘IO高负载
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到Broker 磁盘IO高负载动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 在演练运行详情 页的监控指标 页签,观测磁盘读/写速率指标。 登录分布式消息服务Kafka控制台,进入目标实例的监控指标页,观测磁盘读/写速率指标。 2、业务应用验证: 检查生产者和消费者应用的日志,确认是否存在因连接超时、请求处理缓慢或发送/拉取失败而产生的错误或警告。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        中间件
        分布式消息服务Kafka
        Kafka Broker节点磁盘IO高负载
      • Kafka Broker节点磁盘IO高负载(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到Broker 磁盘IO高负载动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 在演练运行详情 页的监控指标 页签,观测磁盘读/写速率指标。 登录分布式消息服务Kafka控制台,进入目标实例的监控指标页,观测磁盘读/写速率指标。 2、业务应用验证: 检查生产者和消费者应用的日志,确认是否存在因连接超时、请求处理缓慢或发送/拉取失败而产生的错误或警告。
        来自:
      • 入门概述
        本文主要介绍弹性负载均衡的入门概述。 您可以使用独享型负载均衡或共享型负载均衡创建一个负载均衡实例,将访问请求分发到多台弹性云主机上。 该快速入门以具体场景为例,指引您使用共享型负载均衡快速创建一个负载均衡实例,将访问请求分发到两台弹性云主机上。 适用于业务有大量访问请求,需要通过ELB实例将访问流量分发到两台弹性云主机进行处理,实现业务流量的负载分担。同时,通过配置健康检查,负载均衡实例可以监控弹性云主机的运行状况,自动将访问流量分发到正常工作的弹性云主机进行处理,消除单点故障,提升业务的可用性。 图:快速入门方案示意图 方案延伸 :可根据业务的实际访问量,将快速入门场景中的两台弹性云主机扩展到多台。以满足实际业务流量下的负载分担需求。
        来自:
        帮助文档
        弹性负载均衡 ELB
        快速入门
        入门概述
      • 产品定义
        本文带您了解什么是Token服务。 Token服务是面向企业开发者的模型服务平台,提供功能全面、安全可靠且具有价格优势的模型调用服务。 功能模块 模型体验:提供多场景模型展示与试用,支持开发者在模型广场快速体验主流AI模型,体验中心可零门槛测试基础推理能力。 模型服务:主流大模型提供标准化API接口,支持高并发在线推理服务,内置调用量监控与延迟分析功能,保障企业级应用稳定高效运行。 插件服务:支持接入私有知识库增强领域应答,集成联网搜索获取实时信息,通过插件组合扩展模型边界,应对复杂业务需求。
        来自:
        帮助文档
        Token服务(原模型推理服务)
        产品介绍
        产品定义
      • 云容器集群Pod磁盘IO高负载(1)
        4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到磁盘IO高负载动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录云容器引擎控制台,进入目标实例节点的监控指标页,观测磁盘读写速率(Bps)指标。 2、业务应用验证: 观察运行在目标节点上、且挂载了持久化存储(PVC)的业务 Pod(如数据库、中间件等),确认其读写性能是否下降或出现超时。 检查无状态应用的日志写入是否出现延迟或失败。 验证您的业务监控告警系统是否成功捕获到节点磁盘I/O异常或应用性能劣化,并触发了相应告警。
        来自:
      • 云容器集群节点网络延迟
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现响应延迟增加或请求超时。 检查应用日志,确认是否有因超时而触发的重试、熔断或降级逻辑。 确认 Kubernetes 的 liveness/readiness 探针是否因网络延迟而探测超时,导致 Pod 被重启。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点网络延迟
      • 云容器集群节点网络延迟(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现响应延迟增加或请求超时。 检查应用日志,确认是否有因超时而触发的重试、熔断或降级逻辑。 确认 Kubernetes 的 liveness/readiness 探针是否因网络延迟而探测超时,导致 Pod 被重启。
        来自:
      • 游戏行业最佳实践
        高并发支持和负载均衡 业务挑战:在线游戏常常面临大量玩家同时在线,特别是在游戏更新、新活动或重要事件时,服务器可能面临高并发的访问需求。 方案优势:AOne通过自动扩展和负载均衡等技术,能够灵活应对高并发的访问需求,确保游戏服务器的稳定性和性能。这样可以提供稳定的游戏服务,避免因高并发导致的服务器崩溃和服务中断。 游戏网站安全防护 业务挑战:游戏网站也常常成为黑客攻击的目标,如SQL注入、XSS攻击等,可能导致网站被篡改、用户数据泄露等。 方案优势:AOne提供WAF能力,可以检测和阻止网站的安全威胁,保护游戏网站免受恶意攻击。这样可以加强游戏网站的安全性,确保用户数据和网站内容的安全。 客户收益 提供卓越的游戏体验:通过内容分发网络(CDN)和优化网络传输,减少游戏延迟,玩家可以获得更流畅的游戏体验,增强游戏乐趣和满足感。 系统持续稳定可用:通过AOne的弹性扩展和负载均衡技术,避免由于服务器过载或不足导致的系统崩溃和服务中断,提高系统的稳定性。 实时监控与数据分析:AOne提供态势感知实时监控安全及性能,帮助游戏公司及时发现问题并做出相应调整,提高游戏服务的质量和玩家满意度。 优化带宽利用成本降低:AOne通过优化网络传输和资源缓存,降低了游戏内容的传输成本和带宽需求,减少带宽开支,降低运营成本。
        来自:
        帮助文档
        边缘安全加速平台
        最佳实践
        行业最佳实践
        游戏行业最佳实践
      • 功能特性
        安全 透明双向认证:支持界面基于拓扑配置服务间的双向认证。 细粒度访问授权:支持界面基于拓扑配置服务间的访问授权(后台API可以配置Namespace级别授权,授权可以给一个特定的接口)。 可观察性 应用访问拓扑:支持网格应用访问拓扑,体现服务间依赖。 服务运行监控:支持服务访问信息,包括服务和服务各个版本的QPS和延时等指标。 访问日志:支持收集和检索服务的访问日志。 网格数据面服务框架 Spring Cloud:支持Spring Cloud SDK开发的服务在网格上统一管理。 Dubbo:支持Dubbo SDK开发的服务在网格上统一管理。
        来自:
        帮助文档
        应用服务网格
        产品简介
        功能特性
      • 产品功能
        一级功能 二级功能 功能说明 离线训练 训练框架管理 兼容Tensorflow、Pytorch、Horovod、Mindspore等主流训练框架。 离线训练 数据集管理 提供数据集仓库,支持数据集导入导出、数据加速和数据集指标看板。 离线训练 智能调度 提供多种调度策略,支持拓扑感知、故障感知、优先级队列等调度策略。 离线训练 断点续训 任务分钟级别故障检测和任务重调度,支持优雅容错和断点续训。 离线训练 模型管理 支持模型输出到制品仓库、模型多版本管理。 离线训练 运维管理 支持集群、节点、卡、任务维度监控&日志,软硬件故障检测,AIOps智能恢复。 在线推理 推理框架管理 支持分布式vLLM、SGLang、国产MindIE和单机Ollama。 在线推理 AI网关 AI推理应用的接入层必要组件,通过开启多模型流量智能调度和管理,确保对外服务的稳定性以及灵活性。 在线推理 模型加速 支持模型权重加载加速、镜像卷加速、PD分离架构加速。 在线推理 KVCache缓存 支持KVCache缓存加速、KVCache offload、多级缓存、分布式KVCache。 在线推理 弹性扩缩容 支持LWS推理业务扩缩容、HPA、VPA、Cron HPA、ECI弹性推理。 在线推理 全链路可观测 支持推理框架指标监控、资源利用率监控、业务流量监控、推理全链路透明埋点,业务故障可观测。
        来自:
        帮助文档
        智算套件
        产品介绍
        产品功能
      • 1
      • ...
      • 52
      • 53
      • 54
      • 55
      • 56
      • ...
      • 687
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      聚力AI赋能 天翼云大模型专项

      大模型特惠专区·Token Plan 轻享包低至9.9元起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      企业出海解决方案

      助力您的业务扬帆出海,通达全球!

      天翼云信创专区

      “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      多活容灾服务 MDR

      GPU云主机

      镜像服务 IMS

      轻量型云主机

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      训推服务

      推荐文档

      常见问题

      如何修改发票抬头

      导入数据

      创建监控视图

      安全类问题

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 息壤智算平台
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号