活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      Web应用防火墙(独享版)_相关内容
      • 产品定义
        本节介绍天翼云息壤一体化智算服务平台的产品定义。 天翼云息壤是基于算力加速、训练推理、算网调度三个层面的技术一体化核心竞争力,构建的领先开放的一体化智算服务平台,其包含以下核心产品: 公共算力服务:统一的资源调度和交易平台,提供多维度的核心调度能力。 训推服务:为大模型训练、推理、应用提供全栈工具链的智算服务平台,预置丰富的基座大模型和镜像,支持国产化等异构算力,提供算子加速与模型加速,极大提升大模型训练推理效率。 模型推理服务:面向企业开发者的一站式大模型服务平台,提供功能全面、安全可靠且具有价格优势的模型调用服务,同时配备完整的大模型开发工具链,帮助企业开发者实现大模型服务与应用对接。 应用托管:提供一站式应用托管平台,免运维底层资源,支持跨域算力调度与分布式服务部署,具备自适应弹性伸缩能力,提供应用构建、部署、运维和治理全生命周期管理,构建息壤应用生态体系。 科研助手:一站式科研实训平台,可调度各种类型的计算资源,针对各科研场景搭载开箱即用的科研软件。 产品形态及其使用场景 天翼云息壤一体化智算服务平台面向细分客户群体的不同使用场景,提供多种产品形态,如下表所示。 产品形态 产品定位 使用场景 公共算力服务 统一资源调度和交易平台,提供多维度的核心调度能力,支持多方算力接入,实现跨地域跨服务商异构算力一体化供给,满足算力互联接入、促成算力交易、闭环算力运营流程、符合算力政策四大核心需求。 适用于对算力有特定要求的客户,比如算力所在区域、算力卡型、成本等,需要在全国范围内寻匹配的供应商。 训推服务 训推平台是为大模型训练、推理、应用提供全栈工具链的智算服务平台,包含数据处理、模型开发、训练任务、智算资产管理、模型服务等模块。预置丰富的基座大模型和镜像,支持国产化等异构算力,提供算子加速与模型加速,极大提升大模型训练推理效率。 用户无需自建平台,基于训推服务开箱即用,快速、高效训练模型,部署服务用于业务生产。 模型推理服务 面向企业开发者的一站式大模型服务平台,提供功能全面、安全可靠且具有价格优势的模型调用服务,同时配备完整的大模型开发工具链,帮助企业开发者实现大模型服务与应用对接。 适用于缺少资源、缺乏算力管理和分布式框架底层经验,希望低门槛使用,或需要基于用户的行业数据,对基础大模型进行调优训练,快速部署并与业务系统进行集成等场景。 应用托管 提供一站式应用托管平台,免运维底层资源,支持跨域算力调度与分布式服务部署,具备自适应弹性伸缩能力,提供应用构建、部署、运维和治理全生命周期管理,构建息壤应用生态体系。 可基于息壤公有云便捷托管部署自己的应用,并全面掌控资源运行状态。 科研助手 一款适用于高校科研场景的一站式科研实训平台,实现可调度各种类型的计算资源,并针对仿真、流体计算、材料化学、数学计算等科研场景搭载常用科研软件,支持一键部署、随时随地、无需配置开箱即用。 适用于高校科研场景,解决高校科研团队在日常科研场景中面临的算力分散、算力短缺、科研软件不好找等核心痛点问题。
        来自:
        帮助文档
        天翼云息壤一体化智算服务平台
        产品介绍
        产品定义
      • 敏感列权限管控
        本文介绍敏感列权限管控功能,使用户可以快速熟悉敏感列权限管控功能的相关操作。 前提条件 用户需要具有进入数据授权页面的菜单权限,菜单权限参考权限说明。 敏感数据保护为企业版功能,请切换到DMS企业版后使用该功能,切换步骤及实例注意事项详见版本说明。 当前仅支持MySQL、PostgreSQL、SQL Server、DRDS数据库。 使用敏感列权限管控功能前,需先增加敏感实例和敏感列,详见敏感实例、敏感列。 注意事项 当敏感实例的某个列被设置为敏感列后,所有用户查询或导出该列,均为脱敏后的数据。 当用户获得敏感列的查询/导出半脱敏权限后,查询/导出该列,为应用脱敏算法后的脱敏数据;当用户获得敏感列的查询/导出明文权限后,查询/导出该列,为原始明文数据;否则,查询/导出该列,均为。 超级管理员、系统管理员可以授权组织内所有敏感实例的敏感列权限,运维管理员可以授权拥有运维权限的敏感实例的敏感列权限,团队管理员可以授权团队内所有敏感实例的敏感列权限。 管理敏感列权限 拥有敏感列权限的用户可主动将敏感列权限授予给其他用户,其中超级管理员、系统管理员可以授权组织内所有敏感实例的敏感列权限,运维管理员可以授权拥有运维权限的敏感实例的敏感列权限,团队管理员可以授权团队内所有敏感实例的敏感列权限。
        来自:
        帮助文档
        数据管理服务
        用户指南
        数据资产
        敏感数据保护
        敏感列权限管控
      • vLLM NPU单机推理
        本节介绍如何创建vLLM NPU单机推理任务。 前置条件 1. 确认智算套件已经安装并且全部运行中。 2. 进入智算套件,AI应用管理,队列管理,确保队列存在并且有足够的资源(NPU,CPU,内存) [参考创建队列的文档]。 操作步骤 创建任务 进入智算套件,AI应用列表,在线推理菜单,创建AI应用。 基本信息 应用类型:vLLM 推理类型选择:单机 配置信息 推理框架,框架版本,推理模型,模型版本根据实际情况选择。简单的示例: 推理框架: ascendvllm 框架版本:v0.13.0rc1 推理模型:deepseekr1distillqwen1.5b 模型版本:v1 资源:CPU,内存,共享内存可以不填 选择 NPU:2 队列:选择存在且资源足够的的队列 Master 点击确认完成创建。
        来自:
        帮助文档
        智算套件
        用户指南
        应用管理
        在线推理
        创建推理应用
        vLLM NPU单机推理
      • 云容器集群Pod网络延迟
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现响应延迟增加或请求超时。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群Pod网络延迟
      • 云容器集群Pod网络延迟(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现响应延迟增加或请求超时。
        来自:
      • 查看实例信息
        本节主要介绍如何查看实例信息 本节介绍如何在管理控制台查看分布式缓存Redis实例的详细信息。 操作步骤 1. 登录 Redis管理控制台。 2. 在管理控制台左上角选择实例所在的区域。 3. 查询分布式缓存Redis实例。支持通过实例名称搜索对应的Redis缓存实例。直接在搜索栏输入关键字即可。 4. 在实例列表页,单击目标实例名称进入实例详情管理。 说明 在实例列表中可以查看租户当前地域所有实例。 实例详情页面具体内容说明如下: 信息类型 参数 说明 基本信息 实例名称 实例的名称。单击“名称”后的【修改】按钮可以修改实例名称。 基本信息 实例ID 实例的ID。 基本信息 维护时间 运维操作时间。单击参数后的【变更按钮】可以修改时间窗。 基本信息 实例类型 实例的类型,包括:标准版单机、标准版主备、集群版单机、集群版主备等类型。 基本信息 实例规格 实例的规格。 基本信息 引擎版本 实例引擎的内核版本。 基本信息 实例项目 实例所属的项目。 基本信息 部署模式 实例的部署模式,包括:标准等模式。 基本信息 CPU 架构 实例的CPU架构,包括:x86、arm等类型。 基本信息 主机类型 实例主机的类型。 基本信息 磁盘类型 实例磁盘的类型。 基本信息 实例描述 实例描述信息。 实例状态 运行状态 实例运行状态,包括:运行中等。 实例状态 已用内存及配额 实例已使用的内存以及配额。 实例状态 创建时间 实例的创建时间。 实例状态 到期时间 实例的到期时间。 实例状态 计费模式 实例的计费模式,包含:按需计费等。 实例状态 实例退订保护 是否开启实例退订保护。 网络信息 可用区 实例可用区信息。 网络信息 虚拟私有云 实例所属虚拟私有云信息。 网络信息 子网 实例所属子网信息。 网络信息 安全组 实例所关联的安全组。单击“安全组”后的【修改】按钮可以修改安全组。 连接信息 IPv4连接地址 实例IPV4连接地址。点击修改端口可修改实例端口,点击连接诊断可进行实例连接诊断。 连接信息 IPv6连接地址 实例IPV6连接地址。点击设置可设置IPV6连接地址。 连接信息 内网域名 实例的内网域名。点击修改可修改内网域名。 连接信息 公网IP 实例绑定的弹性IP地址。点击公网IP后面的【绑定】按钮可以绑定弹性公网IP,若绑定了弹性IP,则可以通过公网连接实例。 连接信息 密码 实例的密码(不展示),点击密码后的【重置密码】按钮图标可修改实例密码。
        来自:
        帮助文档
        分布式缓存服务Redis版
        用户指南
        实例日常操作
        查看实例信息
      • 产品定义
        本文介绍实时云渲染的产品定义。 天翼云实时云渲染平台,基于智能边缘云的GPU算力提供视频实时渲染计算并串流同步输出到终端设备的PaaS服务。通过分布式GPU集群,提供弹性云端渲染算力、音视频串流、应用云化服务,用户按需扩容、按需付费使用,解决软硬件对用户的使用限制、降低成本、方便使用。 通过“上传应用、实时渲染、应用发布”三步实现应用包的渲染和发布、交互。
        来自:
        帮助文档
        实时云渲染(文档停止维护)
        产品简介
        产品定义
      • 术语解释
        本节介绍云解析相关术语。 域名 域名类似于网络上的门牌号码,是用于识别和定位互联网上计算机的层次结构式字符标识,与该计算机的互联网协议(IP)地址相对应。但相对于IP地址而言,更便于使用者理解和记忆。 DNS 域名系统(Domain Name System,DNS)是一个全球性的分布式系统,独立于任何系统平台和网络,是全球域名体系的承载体,完成易于记忆的域名与难以记忆的IP地址之间的映射。 DNS结构 全球域名体系从结构上呈倒立树型分层结构。整个系统体系可以划分成四个服务环节,分别是根域权威解析、顶级域权威解析、二级和二级以下域的权威解析、递归解析服务。 域名解析 将域名映射为IP地址的过程,由DNS客户端和DNS服务器完成整个解析过程。 域名解析涉及的四个DNS服务器: 根域名服务器(Root nameserver),提供域名所在顶级区域的权威服务器名称和地址。 顶级域名服务器(Tld nameserver),提供域名所在二级区域中权威名称服务器列表。 权威域名服务器,提供域名在本区域内与IP地址的对应关系,例如天翼云云解析。 本地域名服务器(Local DNS),处理来自解析器发出的递归查询请求,并最终返回准确的DNS服务器。 主机名 因特网上的主机或Web站点的名称。主机名映射到IP地址,但是主机名和IP地址之间没有一对一关系。
        来自:
        帮助文档
        云解析
        产品介绍
        术语解释
      • 通过云原生网关访问bookinfo应用
        本章节介绍如何通过云原生网关访问bookinfo应用 前提条件 1. 已开通云容器引擎,至少有一个云容器引擎实例。产品入口:云容器引擎。 2. 开通天翼云应用服务网格实例。 3. 开通天翼云微服务引擎,并在应用服务网格控制面集群同VPC内创建云原生网关实例。产品入口:微服务引擎MSE。 操作步骤 我们在当前云容器引擎实例同VPC下预先开了一个云原生网关实例;通过云原生网关,我们可以从外部访问到云容器引擎内的服务,具体操作如下说明。 1. 首先通过云原生网关实例内服务来源>创建来源,将当前云容器引擎集群添加为服务来源。 2. 然后通过服务列表>创建服务,将sample命名空间下的bookinfo应用入口服务productpage添加为云原生网关的服务。 3. 在路由配置内,通过配置网关路由规则,将bookinfo的访问流量路由到productpage服务,需要添加路由匹配如下路径: /logout /login /api/v1/products/ /static/ /productpage 请求转发到productpage服务。 4. 通过网绑定的ELB地址可以访问到bookinfo应用的首页(
        来自:
        帮助文档
        应用服务网格
        快速入门
        通过云原生网关访问bookinfo应用
      • 技术类
        本章节主要介绍故障演练服务技术类问题。 故障演练的实现原理是什么? 不同类型的故障动作实现原理各不相同,详细说明请参考故障动作库中的具体文档,下表简要概述了各类动作的核心原理: 分类 资源类型 动作类型 动作 简介 原理描述 计算 云主机 主机资源 主机宕机 使用云主机接口对实例进行关机 通过调用云主机关机OpenAPI触发关机 计算 云主机 CPU资源 CPU高负载 使用内部自研工具实施CPU高负载 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是启动自定义程序,空跑for循环来消耗CPU时间片 计算 云主机 内存资源 内存高负载 使用内部自研工具实施内存高负载 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 计算 云主机 磁盘资源 IO高负载 使用内部自研工具实施磁盘IO高负载 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 计算 云主机 磁盘资源 IO Hang 模拟磁盘产生IO Hang效果 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过fsfreeze命令模拟磁盘夯死表现 注意:设置磁盘夯死故障注入后,可能会导致应用无法读写文件产出异常,请谨慎使用 计算 云主机 磁盘资源 磁盘填充 使用内部自研工具实施磁盘填充 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过dd命令将数据写入文件 计算 云主机 网络资源 网络丢包 使用TC和Netem模拟主机内网络丢包 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络延迟 使用TC和Netem模拟主机内网络延迟 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络延迟 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络包重复 使用TC和Netem模拟主机内网络包重复 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络包重复 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络包乱序 使用TC和Netem模拟主机内网络包乱序 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络包乱序 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 网络包损坏 使用TC和Netem模拟主机内网络包损坏 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过增加TC和Netem规则模拟主机内网络包损坏 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 计算 云主机 网络资源 端口占用 模拟指定端口占用 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是启动自定义程序, 创建Socket对象并绑定到指定端口 计算 云主机 网络资源 DNS篡改 篡改指定域名解析到指定IP 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过修改本地DNS解析文件实现 计算 云主机 网络资源 DNS不可用 DNS解析不可用 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过修改本地DNS解析文件或防火墙规则实现 注意:该动作风险较大,请谨慎操作 计算 云主机 JVM故障 JVM延迟 向特定JVM进程注入方法调用延迟故障 预先在探针管理处将内部自研Agent安装至云主机上,使用管控通道下发动作执行命令 原理是通过Java Agent在JVM进程内插入sleep代码来实现 中间件 Redis 集群资源 主从切换 Redis主从切换 通过调用Redis主从切换OpenAPI,触发Redis集群实例进行主从切换 中间件 Redis 节点资源 Redis节点故障 Redis节点发生故障 通过调用Redis停止Redis服务OpenAPI,模拟Redis节点故障,故障会触发Redis HA机制进行自动恢复 中间件 Redis 节点资源 Proxy节点故障 Proxy节点发生故障 通过调用Redis停止Proxy服务OpenAPI,模拟Proxy节点不可用 中间件 Redis 节点资源 节点主机宕机 Redis节点关机 通过关闭节点主机,模拟节点宕机 中间件 Redis 节点资源 CPU高负载 Redis节点CPU高负载 在节点启动自定义程序,空跑for循环来消耗CPU时间片 中间件 Redis 节点资源 内存高负载 Redis节点内存高负载 在节点启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 中间件 Redis 节点资源 磁盘IO高负载 Redis节点磁盘IO高负载 在节点先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 中间件 Redis 节点资源 磁盘IO Hang Redis节点磁盘IO Hang 在节点通过fsfreeze命令模拟磁盘夯死表现 中间件 Redis 节点资源 网络丢包 Redis节点网络丢包 在节点通过增加TC和Netem规则模拟主机内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 中间件 Kafka 节点资源 Broker节点主机宕机 Broker节点关机 指定或随机一个Broker节点进行关机 中间件 Kafka 节点资源 Broker节点CPU高负载 Broker节点CPU高负载 指定或随机一个Broker节点启动自定义程序,空跑for循环来消耗CPU时间片 中间件 Kafka 节点资源 Broker节点磁盘IO高负载 Broker节点磁盘IO高负载 指定或随机一个Broker节点先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 中间件 Kafka 节点资源 分区Leader不可用 分区Leader发生故障 指定一个或多个分区Leader,通过调用Kafka模拟Leader故障OpenAPI,触发Leader重新选举 中间件 RCC 集群资源 停止服务 注册配置中心集群服务故障 通过调用RCC停止集群OpenAPI,模拟RCC集群服务故障 中间件 RCC 节点资源 停止节点 注册配置中心节点故障 通过调用RCC停止节点OpenAPI,模拟RCC节点故障 云容器 容器集群 节点资源 托管Master节点宕机 关闭云容器引擎Master节点主机 通过关闭云容器引擎Master节点主机,模拟Master节点宕机(支持托管版本和智算版) 云容器 容器集群 节点资源 节点宕机 关闭云容器引擎纳管的节点主机 通过关闭云容器引擎纳管的节点主机,模拟节点宕机(支持Worker节点或专有版容器Master节点) 云容器 容器集群 节点资源 Etcd节点宕机 停止Etcd服务,模拟Etcd节点宕机 通过停止Etcd节点上的服务,模拟Etcd节点宕机 云容器 集群Node CPU资源 CPU高负载 使用内部自研工具实施CPU高负载 启动自定义程序,空跑for循环来消耗CPU时间片 云容器 集群Node 内存资源 内存高负载 使用内部自研工具实施内存高负载 启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 云容器 集群Node 磁盘资源 IO高负载 使用内部自研工具实施磁盘IO高负载 先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 云容器 集群Node 磁盘资源 磁盘填充 使用内部自研工具实施磁盘填充 通过dd命令将数据写入文件 云容器 集群Node 网络资源 网络丢包 使用TC和Netem模拟Node内网络丢包 通过增加TC和Netem规则模拟Node内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络延迟 使用TC和Netem模拟Node内网络延迟 通过增加TC和Netem规则模拟Node内网络延迟 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络包重复 使用TC和Netem模拟Node内网络包重复 通过增加TC和Netem规则模拟Node内网络包重复 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络包乱序 使用TC和Netem模拟Node内网络包乱序 通过增加TC和Netem规则模拟Node内网络包乱序 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 网络包损坏 使用TC和Netem模拟Node内网络包损坏 通过增加TC和Netem规则模拟Node内网络包损坏 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Node 网络资源 DNS篡改 篡改指定域名解析到指定IP 通过修改本地DNS解析文件实现 云容器 集群Node 应用进程 进程停止 终止节点上的指定进程 通过kill 9停止节点上的指定进程 云容器 集群Node 应用进程 进程挂起 挂起节点上的指定进程 通过kill STOP挂起节点上的指定进程 云容器 集群Pod CPU资源 CPU高负载 使用内部自研工具实施CPU高负载 启动自定义程序,空跑for循环来消耗CPU时间片 云容器 集群Pod 内存资源 内存高负载 使用内部自研工具实施内存高负载 启动自定义程序不断申请内存,模拟主机内存负载升高 注意:设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用 云容器 集群Pod 磁盘资源 IO高负载 使用内部自研工具实施磁盘IO高负载 先通过dd命令将数据写入文件中,然后再通过循环读写文件占用磁盘带宽 云容器 集群Pod 磁盘资源 磁盘填充 使用内部自研工具实施磁盘填充 通过dd命令将数据写入文件 云容器 集群Pod 网络资源 网络丢包 使用TC和Netem模拟Pod内网络丢包 通过增加TC和Netem规则模拟Pod内网络丢包 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络延迟 使用TC和Netem模拟Pod内网络延迟 通过增加TC和Netem规则模拟Pod内网络延迟 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络包重复 使用TC和Netem模拟Pod内网络包重复 通过增加TC和Netem规则模拟Pod内网络包重复 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络包乱序 使用TC和Netem模拟Pod内网络包乱序 通过增加TC和Netem规则模拟Pod内网络包乱序 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 网络包损坏 使用TC和Netem模拟Pod内网络包损坏 通过增加TC和Netem规则模拟Pod内网络包损坏 注意:只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败 云容器 集群Pod 网络资源 DNS篡改 篡改指定域名解析到指定IP 通过修改本地DNS解析文件实现 云容器 集群Pod Pod资源 Pod删除 删除指定Pod 调用云容器引擎K8S API删除Pod 云容器 集群Pod 应用进程 进程停止 终止节点上的指定进程 通过kill 9停止节点上的指定进程 云容器 集群Pod 应用进程 进程挂起 挂起节点上的指定进程 通过kill STOP挂起节点上的指定进程 云容器 集群Pod JVM故障 JAVA方法调用延迟 指定JVM进程与方法增加调用延迟 通过Java Agent拦截指定JVM进程内方法,增加sleep操作模拟调用延迟 云容器 集群Pod JVM故障 JAVA方法抛自定义异常 指定JVM进程与方法抛出自定义异常 通过Java Agent拦截指定JVM进程内方法,增加thow操作模拟抛出异常 云容器 容器镜像 Harbor服务 Harbor服务不可用 停止Harbor服务,模拟容器镜像仓库不可用 通过调用容器镜像服务OpenAPI,停止Harbor服务,模拟容器镜像仓库不可用
        来自:
        帮助文档
        应用高可用
        常见问题
        故障演练服务
        技术类
      • Ingress相关问题
        本节介绍了云容器引擎的Ingress类常见问题。 从外面通过nginxingresscontroller访问Pod时,Pod运行的应用怎么获取真实客户端的IP地址? 需要配置nginxingresscontroller,把客户端真实的源IP保存在转发报文的Header中,key可以自定义(比如XRemoteAddr或其它key),不过需要和应用约定好使用哪个Key。 从Pod访问外部应用,外部应用拿到的是什么IP? 拿到的是Pod所在K8S主机的IP。 修改ELB Ingress引用的TLS证书后,需要更新对应负载均衡器的证书 在“网络控制台>弹性负载均衡”找到ELB Ingress对应负载均衡器的HTTPS监听器,然后找到监听器对应的证书,点击证书在证书管理界面中修改证书,将TLS证书内容和私钥上传即可完成更新。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        常见问题
        网络
        Ingress相关问题
      • 产品优势
        本节主要介绍产品优势 快速接入 客户应用的快速接入。可以选择使用容器、虚机等方式部署应用,快速实现分布式微服务应用的细粒度治理和高可用保障。 开源开放 多种微服务开发框架支持。支持SpringCloud、ServiceComb等主流微服务框架,支持使用service mesh接入客户的既有应用。 稳定可靠 帮助用户实现云原生化改造。提供业务的微服务基础支撑底座,满足云原生用户严苛的性能、可用性和安全合规要求。 多语言 兼容客户的异构遗留系统。提供Java、Go、.NET、Node.js、PHP等多语言微服务解决方案。
        来自:
        帮助文档
        微服务引擎
        产品简介
        产品优势
      • PostgreSQL迁移/同步到PostgreSQL
        失败原因 处理建议 源数据库账号或密码不正确。 输入正确的数据库账号和密码后重新执行预检查。 源数据库所在网络或服务器设置了防火墙。 查看数据库所在的网络防火墙是否限制了DTS的IP地址段,如果有,关闭防火墙或者将DTS的IP地址加入防火墙白名单中。 源库迁移账号登录权限不足。 登录源库,为迁移账号添加相应的远程访问权限。 网络互通问题。 联系数据库所在机器管理人员和DTS部署机器管理人员排查问题。
        来自:
        帮助文档
        数据传输服务DTS
        故障排除
        预检查不通过修复方法
        PostgreSQL迁移/同步到PostgreSQL
      • MySQL迁移/同步到MySQL
        失败原因 处理建议 目标数据库账号或密码不正确。 输入正确的数据库账号和密码后重新执行预检查。 目标数据库所在网络或服务器设置了防火墙。 查看数据库所在的网络防火墙是否限制了DTS的IP地址段,如果有,关闭防火墙或者将DTS的IP地址加入防火墙白名单中。 目标库迁移账号登录权限不足。 登录目标库,为迁移账号添加相应的远程访问权限。 网络互通问题。 联系数据库所在机器管理人员和DTS部署机器管理人员排查问题。
        来自:
        帮助文档
        数据传输服务DTS
        故障排除
        预检查不通过修复方法
        MySQL迁移/同步到MySQL
      • 设置Bot策略白名单
        本文将向您介绍如何通过边缘安全加速平台安全与加速服务提供的Bot防护策略功能设置白名单。 功能介绍 若您希望请求针对Bot防护策略加白,可以配置Bot防护策略白名单。 背景信息 您的域名接入边缘安全加速平台安全与加速服务后,配置防护策略将默认作用于所有符合策略的请求,若您希望某类请求不经过某个防护策略,可以分别配置对应的白名单功能。 若您希望请求针对任意防护策略加白,可以配置网站白名单,配置详情可见设置网站白名单。 若防护规则集中的某条规则出现误报情况,可以配置规则白名单,配置详情可见设置Web规则白名单。 若您希望请求针对Bot防护策略加白,可以配置Bot策略白名单,配置详情可见下文。 前提条件 已经订购边缘安全加速平台安全与加速服务,若未订购,请参见服务开通。 在控制台新增域名,请参见添加服务域名。 购买Bot防护扩展服务,支持设置Bot防护策略白名单功能。 操作步骤 1. 登录边缘安全加速平台控制台。 2. 在左侧导航栏中选择【安全能力】【Bot防护】,选择您要配置的域名,进入基础配置【Bot策略白名单】详细设置页。
        来自:
        帮助文档
        边缘安全加速平台
        安全与加速
        安全
        防护白名单
        设置Bot策略白名单
      • MindIE NPU单机PD分离
        本节介绍如何创建MindIE NPU单机PD分离任务。 本示例基于 MindIE 推理框架,选用 deepseekr1distillqwen1.5b 模型进行单机 PD(Prefill/Decode)分离部署。部署形态为 2P × 2D 架构,其中 Prefill 阶段使用 2 个实例,每个实例占用 1 张 NPU 卡;Decode 阶段使用 2 个实例,每个实例占用 1 张 NPU 卡。因此,本任务共需 4 张 NPU 卡,实现 Prefill 与 Decode 解耦,以提升首 Token 时延与整体吞吐性能。 前置条件 1. 确认智算套件已经安装并且全部运行中。 2. 进入智算套件,AI应用管理,队列管理,确保队列存在并且有足够的资源(NPU,CPU,内存) [参考创建队列的文档]。 操作步骤 创建应用 进入智算套件,AI应用列表,在线推理菜单,创建AI应用。 基本信息 应用类型:MindIE 开启PD分离选择 静态PD分离 配置信息 推理类型选择单机,推理框架,框架版本,推理模型,模型版本根据实际情况选择。简单的示例: 推理框架: ascendmindie 框架版本:2.2.RC1800IA2py311openeuler24.03lts 推理模型:deepseekr1distillqwen1.5b 模型版本:v1 队列:选择存在且资源足够的的队列
        来自:
        帮助文档
        智算套件
        用户指南
        应用管理
        在线推理
        创建推理应用
        MindIE NPU单机PD分离
      • 云容器集群节点磁盘填充
        本章节介绍云容器集群节点磁盘填充故障演练。 背景介绍 失控的日志文件、未经清理的临时数据或异常进程持续写入,都可能导致云容器引擎(CCE)节点的磁盘空间被耗尽。这种情况会直接导致Pod无法写入新数据、服务功能异常,甚至因 ephemeralstorage 压力过大而被kubelet驱逐。本演练模拟磁盘空间被占满的场景,帮助您检验系统的磁盘空间监控告警、日志轮转机制以及应用在无可用存储空间时的处理逻辑。 基本原理 通过dd命令将数据写入文件。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点磁盘填充
      • 调用链
        调用链搜索 调用链搜索主要是搜索span信息,就是一个节点的根event。一个调用链可能从多个环境下面搜索到。比如A调用B调用C的场景,对于同一个调用链路,从A、B、C可能都可以搜索到同一个调用链。 1、登录管理控制台。 2、单击左侧,选择“应用性能管理 APM”,进入APM服务页面。 3、在左侧导航栏选择“应用监控 > 调用链”,进入调用链界面。 4、输入如下查询条件查询具体的调用链列表,也可在界面下方新增自定义查询条件。 表 调用链查询条件 查询条件 具体含义 必填/选填 应用 调用链所在应用。 必填 区域 调用链所在区域。 必填 组件 调用链所在组件。 选填 环境 调用链所在环境。 选填 实例 调用链所在实例。 选填 URL 调用链的URL,分为Rest URL和Real URL两种搜索条件:Rest URL为restful风格的URL,URL中带有变量名称,如/apm/get/{id};Real URL为实际访问的URL。 选填 精确 对URL是否精确匹配,开启状态下为精确查询URL,不开启则进行模糊查询。 选填 调用方法 调用链的HttpMethod。 选填 状态码 调用链返回的HTTP状态码。 选填 响应时间 调用链的响应时间范围,可以填写最小响应时间和最大响应时间搜索调用链,两个值都可以为空。 选填 是否异常 调用链是否有异常。 选填 Trace ID 调用链的TraceID,填写该搜索条件后,其他搜索条件全部失效,只根据该TraceID搜索。 选填 自定义参数 已配置url监控项的拦截header指定key值、拦截url参数指定key值、拦截cookie指定key值参数后,在这里可以设置keyvalue进行搜索。 选填 全局Trace ID 调用链的全局TraceID,填写该搜索条件后,其他搜索条件全部失效,只根据该全局TraceID搜索。 选填 应用码 已配置url监控项的业务code采集长度限制、解析业务code的key、业务code的正确值参数后,会采集响应的应用码,这这里可以根据应用码进行搜索。 选填
        来自:
        帮助文档
        应用性能管理
        用户指南
        调用链
      • 日志收集系统Flume接入Kafka
        Flume安装 Apache Flume官网下载地址: 下载apacheflume1.9.0bin.tar.gz。 解压安装tar zxvf apacheflume1.9.0bin.tar.gz 设置环境变量:   vi ~/.bashprofile   export FLUMEHOME /usr/local/apacheflume1.9.0bin   export PATH FLUMEHOME/bin:PATH   source ~/.bashprofile 修改Flume配置文件($ FLUMEHOME/conf): 按照模板复制出env.sh配置文件:cp flumeenv.sh.template flumeenv.sh 修改配置文件:vi flumeenv.sh,设置JAVAHOME: export JAVAHOME /usr/local/java/jdk1.8.0311 验证Flume安装是否成功: 至此,已完成Flume的安装与验证。 获取Kafka实例信息 1.登录天翼云Kafka专享版实例控制台。 2.在Kafka专享版页面,选择对应的实例,单击实例“名称”,进入实例基本信息页面。 3.在实例的基本信息页面的连接地址模块,可获取实例的IP地址与端口。 4.选择对应的Topic,如需创建Topic,请参考创建Topic。 配置Flume与Kafka互联 在$FLUMEHOME/conf下添加连接Kafka的配置文件:flumetokafka.conf,如下: 启动Flume并测试连接情况 启动Flume: bin/flumeng agent conf conf conffile conf/flumetokafka.conf name flumekafka Dflume.root.loggerINFO,console >./data.log 2>&1 &
        来自:
        帮助文档
        分布式消息服务Kafka
        最佳实践
        日志收集系统Flume接入Kafka
      • 查看流控监控
        本文主要介绍 查看流控监控。 本章节指导您在控制台查看每个代理上用户/客户端/Topic的流控使用量。 操作步骤 步骤 1 登录管理控制台。 步骤 2 在管理控制台右上角单击,选择区域。 说明 请选择Kafka实例所在的区域。 步骤 3 在管理控制台左上角单击,选择“企业中间件”“分布式消息服务”“Kafka专享版”,进入分布式消息服务Kafka专享版页面。 步骤 4 单击Kafka实例的名称,进入实例详情页面。 步骤 5 在左侧导航栏单击“流控管理 > 流控监控”,进入流控监控页面。 步骤 6 设置查询流控的参数。 表查询流控的参数说明 参数 说明 :: 统计方式 设置流控的统计方式。 前n个:统计带宽使用量排名前x 个的用户/客户端/Topic,x由您自行输入 带宽速率:统计带宽速率大于x MB/s的用户/客户端/Topic,x由您自行输入 带宽使用量:统计带宽使用量超过x %的用户/客户端/Topic,x由您自行输入 统计类型 设置流控的统计类型。 生产:统计生产消息的流控 消费:统计消费消息的流控 统计维度 设置流控的统计维度。 User/Client:统计用户/客户端的流控 Topic:统计Topic的流控 图 查询流控的参数 步骤 7 单击“查询”,查看每个代理上用户/客户端/Topic的流控使用量。
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        流控管理
        查看流控监控
      • 创建流控
        创建Topic流控 步骤 1 登录管理控制台。 步骤 2 在管理控制台右上角单击,选择区域。 说明 请选择Kafka实例所在的区域。 步骤 3 在管理控制台左上角单击,选择“企业中间件”“分布式消息服务”“Kafka专享版”,进入分布式消息服务Kafka专享版页面。 步骤 4 单击Kafka实例的名称,进入实例详情页面。 步骤 5 在左侧导航栏单击“流控管理 > 流控列表”,进入流控列表页面。 步骤 6 在页面顶端单击“Topic”,进入“Topic”页签。 步骤 7 在页面左上角单击“创建流控”,弹出“创建流控”对话框。 步骤 8 设置流控参数。 表 流控参数说明 参数名称 说明 Topic名称 输入指定Topic名称,对此Topic进行流控。流控创建完后,无法修改“Topic名称”。 生产上限速率 设置生产上限速率,单位为MB/s。为空时,表示不设置速率。 消费上限速率 设置消费上限速率,单位为MB/s。为空时,表示不设置速率。 说明 “生产上限速率”和“消费上限速率”不可同时为空。 步骤 9 单击“确定”,跳转到“后台任务管理”页面,当流控任务的“状态”为“成功”时,表示流控创建成功。 进入“流控管理 > 流控列表”页面,在“Topic”页签中,在页面右上角的搜索框中输入新创建的流控名称,单击,查看新创建的流控。
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        流控管理
        创建流控
      • 重置SASL_SSL密码
        本文主要介绍重置SASLSSL密码。 操作场景 在“用户管理”页签创建的SASLSSL用户,如果忘记了SASLSSL密码,通过重置SASLSSL密码功能,重新设置一个新的密码,可使用新密码连接Kafka实例。 如果忘记了创建实例时设置的SASLSSL密码,请参考重置Kafka密码,重置密码。 说明 仅开启Kafka SASLSSL认证的Kafka实例才可以重置SASLSSL密码。 只有处于“运行中”状态的Kafka实例支持重置SASLSSL密码。 操作步骤 步骤 1 登录管理控制台。 步骤 2 在管理控制台右上角单击,选择区域。 说明 请选择Kafka实例所在的区域。 步骤 3 在管理控制台左上角单击,选择“企业中间件”“分布式消息服务”“Kafka专享版”,进入分布式消息服务Kafka专享版页面。 步骤 4 单击待重置SASLSSL密码的Kafka实例名称,进入实例详情页面。 步骤 5 在“用户管理”页签,在待重置SASLSSL密码的用户所在行,单击“重置密码”。 步骤 6 输入“新密码”,单击“确定”,完成密码重置。 如果重置密码成功,界面提示重置实例的密码成功。 如果重置密码失败,界面提示重置实例的密码失败,请重新尝试重置密码操作。如果多次重置失败,请联系客服处理。 说明 只有所有代理都重置密码成功,系统才会提示重置密码成功,否则会提示重置失败。
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        SASL_SSL用户管理
        重置SASL_SSL密码
      • 重置Kafka密码
        本文主要介绍 重置Kafka密码。 操作场景 如果您忘记了创建实例时设置的SASLSSL密码,通过重置Kafka密码功能,重新设置一个新的密码,可使用新密码连接Kafka实例。 说明 仅开启Kafka SASLSSL认证的Kafka实例才可以重置Kafka密码。 只有处于“运行中”状态的Kafka实例支持重置Kafka密码。 操作步骤 步骤 1 登录管理控制台。 步骤 2 在管理控制台右上角单击,选择区域。 说明 请选择Kafka实例所在的区域。 步骤 3 在管理控制台左上角单击,选择“企业中间件”“分布式消息服务”“Kafka专享版”,进入分布式消息服务Kafka专享版页面。 步骤 4 通过以下任意一种方法,重置Kafka密码。 在需要重置Kafka密码的Kafka实例右侧,单击“更多 > 重置Kafka密码”,弹出重置Kafka密码对话框。 单击Kafka实例名称,进入实例详情页面。在“基本信息”页签,在“连接信息 > 用户名”后,单击“重置密码”,弹出重置Kafka密码对话框。 单击Kafka实例名称,进入实例详情页面。在“用户管理”页签,在待重置Kafka密码的用户所在行,单击“重置密码”,弹出重置Kafka密码对话框。 步骤 5 输入“新密码”,单击“确定”,完成密码重置。 如果重置密码成功,界面提示重置实例的密码成功。 如果重置密码失败,界面提示重置实例的密码失败,请重新尝试重置密码操作。如果多次重置失败,请联系客服处理。 说明 只有所有代理都重置密码成功,系统才会提示重置密码成功,否则会提示重置失败。
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        实例管理
        重置Kafka密码
      • 必须配置的监控告警
        操作步骤 步骤 1 登录管理控制台。 步骤 2 在管理控制台右上角单击,选择区域。 说明 请选择Kafka实例所在的区域。 步骤 3 在管理控制台左上角单击,选择“企业中间件”“分布式消息服务”“Kafka专享版”,进入分布式消息服务Kafka专享版页面。 步骤 4 在Kafka实例名称后,单击。 进入云监控该实例的监控指标页面。 步骤 5 在实例监控指标页面中,找到需要创建告警的指标项,鼠标移动到指标区域,然后单击指标右上角的,创建告警规则,跳转到创建告警规则页面。 步骤 6 在告警规则页面,设置告警信息。 创建告警规则操作,请查看《云监控服务用户指南》的“创建告警规则和告警通知”章节。 1. 设置告警名称和告警的描述。 2. 设置告警策略和告警级别。 如下图所示,在进行指标监控时,如果连续3个周期,磁盘容量使用率原始值超过85%,则产生告警,如果未及时处理,则产生告警通知。 图设置告警策略和告警级别 3. 设置“发送通知”开关。当开启时,设置告警生效时间、产生告警时通知的对象以及触发的条件。 4. 单击“立即创建”,等待创建告警规则成功。
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        监控
        必须配置的监控告警
      • 设置RabbitMQ告警规则
        操作步骤 步骤 1 登录管理控制台。 步骤 2 在管理控制台右上角单击,选择区域。 说明 此处请选择RabbitMQ实例所在的区域。 步骤 3 在管理控制台左上角单击,选择“企业中间件”>“分布式消息服务”>“RabbitMQ专享版”,进入分布式消息服务RabbitMQ专享版页面。 步骤 4 通过以下任意一种方法,查看监控数据。 在RabbitMQ实例名称后,单击“查看监控数据”。跳转到云监控页面,查看实例、节点和队列的监控数据,数据更新周期为1分钟。 单击RabbitMQ实例名称,进入实例详情页。在左侧导航栏单击“监控”,进入监控页面,查看实例、节点和队列的监控数据,数据更新周期为1分钟。 步骤 5 在实例监控指标页面中,找到需要创建告警的指标项,鼠标移动到指标区域,然后单击指标右上角的,进入“创建告警规则”页面。 步骤 6 在告警规则页面,设置告警信息。 创建告警规则操作,请查看《云监控服务用户指南》的创建告警规则和告警通知。 1. 设置告警名称和告警的描述。 2. 设置告警策略和告警级别。 例如,在进行指标监控时,如果连续3个周期,连接数原始值超过设置的值,则产生告警,如果未及时处理,则每一天发送一次告警通知。 3. 设置“发送通知”开关。当开启时,设置告警生效时间、产生告警时通知的对象以及触发的条件。 4. 单击“立即创建”,等待创建告警规则成功。
        来自:
        帮助文档
        分布式消息服务RabbitMQ
        用户指南
        监控
        设置RabbitMQ告警规则
      • 云日志服务
        云日志服务是天翼云打造的一款云原生日志观测分析平台产品,可为应用的海量日志数据提供大规模、低成本、集中式的平台化服务,具备一站式的日志采集、加工、查询分析、可视化、告警等能力,全面满足应用研发、运维、服务监控与业务分析等应用场景。
        来自:
        帮助文档
        云日志服务
      • 云日志服务(1)
        云日志服务是天翼云打造的一款云原生日志观测分析平台产品,可为应用的海量日志数据提供大规模、低成本、集中式的平台化服务,具备一站式的日志采集、加工、查询分析、可视化、告警等能力,全面满足应用研发、运维、服务监控与业务分析等应用场景。
        来自:
      • 产品优势
        本文介绍镜像服务的产品优势。 快速部署 相比于传统的手工部署方式,利用包含应用的镜像可实现相同应用的弹性云主机批量快速部署。 方式比较项 镜像部署 手动部署 部署时长 3分钟 5分钟 1天 2天 部署过程 镜像里面已经包含了应用依赖的操作系统,运行环境以及预装的组件,因此使用镜像创建实例能够实现客户业务系统的快速部署。 选择合适的操作系统、数据库、应用软件、插件等,并需要安装和调试。 安全性 除私有镜像和共享镜像需要用户自行判断,其他公共镜像、安全产品镜像、应用镜像都经过天翼云测试和审核。 依赖开发部署人员的水平。 适用情况 公共镜像:正版操作系统,包含天翼云提供的初始化组件。 私有镜像:快速创建跟已有云主机相同软件环境,或进行环境备份。 共享镜像:快速创建跟其他用户已有云主机相同软件环境。 安全产品镜像:快速创建带有安全组件的云主机。 应用镜像:快速创建预装应用与工具的云主机。 完全自行配置,无基础设置。 安全可靠 公共镜像均经过天翼云的安全测试与审核,安全可靠。 公共镜像覆盖Windows、Ubuntu、CentOS等多款主流操作系统,皆经过严格测试,能够保证镜像安全、稳定。 镜像文件后端采用了冗余的方式存储,保证了高可用性。
        来自:
        帮助文档
        镜像服务 IMS
        产品简介
        产品优势
      • 云容器集群节点磁盘填充(1)
        本章节介绍云容器集群节点磁盘填充故障演练。 背景介绍 失控的日志文件、未经清理的临时数据或异常进程持续写入,都可能导致云容器引擎(CCE)节点的磁盘空间被耗尽。这种情况会直接导致Pod无法写入新数据、服务功能异常,甚至因 ephemeralstorage 压力过大而被kubelet驱逐。本演练模拟磁盘空间被占满的场景,帮助您检验系统的磁盘空间监控告警、日志轮转机制以及应用在无可用存储空间时的处理逻辑。 基本原理 通过dd命令将数据写入文件。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
      • 应用场景
        本文介绍分布式消息服务RocketMQ可广泛应用于分布式系统异步通信、数据同步和交换、削峰填谷等场景。 行业应用 RocketMQ在多个行业中都有广泛的应用。以下是一些典型的行业应用场景: 1. 电子商务:在电子商务行业中,RocketMQ可以用于订单处理、库存管理、支付通知等异步通信和事件驱动的场景。它可以实现订单的可靠传递和处理,同时支持高并发和高可扩展性的需求。 2. 金融服务:在金融服务行业中,RocketMQ可以用于实时交易通知、资金结算、风险控制等关键业务场景。它可以确保交易消息的可靠传递和顺序处理,同时支持高吞吐量和低延迟的要求。 3. 物流与供应链:在物流与供应链行业中,RocketMQ可以用于实时物流跟踪、订单状态更新、库存管理等消息通知和事件驱动的场景。它可以确保供应链各个环节的信息同步和协调,提高物流效率和准确性。 4. 社交媒体:在社交媒体行业中,RocketMQ可以用于实时消息推送、用户关系管理、活动通知等场景。它可以支持大规模用户同时在线的需求,确保消息的低延迟和高可靠性。 5. 物联网:在物联网行业中,RocketMQ可以用于设备状态监控、告警通知、数据采集等场景。它可以处理大量的设备消息,并支持设备之间的实时通信和协作。 这些是一些典型的RocketMQ行业应用场景,由于RocketMQ的高性能和可靠性,它在更多行业中也有广泛的应用。 分布式消息服务RocketMQ主要适用于以下几种业务场景:
        来自:
        帮助文档
        分布式消息服务RocketMQ
        产品简介
        应用场景
      • 云容器集群节点网络包损坏
        本章节介绍云容器集群节点网络包损坏故障演练。 背景介绍 由于物理链路噪声、网络设备故障或恶意攻击,数据包在云容器引擎(CCE)集群的节点间传输过程中可能被篡改。接收端的 TCP/IP 协议栈会通过校验和检查发现这种损坏,丢弃该数据包并请求重传。虽然这确保了数据的完整性,但频繁的重传会显著增加网络延迟、降低有效吞吐量,并可能导致应用层超时。本演练模拟此场景,帮助您评估应用在恶劣网络条件下的鲁棒性。 基本原理 通过增加TC和Netem规则模拟Node内网络包损坏。 注意 只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点网络包损坏
      • 云容器集群节点网络包损坏(1)
        本章节介绍云容器集群节点网络包损坏故障演练。 背景介绍 由于物理链路噪声、网络设备故障或恶意攻击,数据包在云容器引擎(CCE)集群的节点间传输过程中可能被篡改。接收端的 TCP/IP 协议栈会通过校验和检查发现这种损坏,丢弃该数据包并请求重传。虽然这确保了数据的完整性,但频繁的重传会显著增加网络延迟、降低有效吞吐量,并可能导致应用层超时。本演练模拟此场景,帮助您评估应用在恶劣网络条件下的鲁棒性。 基本原理 通过增加TC和Netem规则模拟Node内网络包损坏。 注意 只对出方向流量生效,不会影响入流量;如果系统已配置有TC规则,动作执行会失败。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 4. 在应用资源 页面的云容器引擎 列表中,找到您的目标集群,单击其操作列的节点列表。 5. 在弹出的对话框中,单击添加节点。 6. 勾选您希望进行故障演练的一个或多个节点 ,然后单击确定。 注意 当您首次对 CCE 集群执行演练时,系统会自动在该集群中安装演练探针(以 Deployment 和 DaemonSet 形式部署)。 您也可以提前在 故障演练 > 目标应用 > 探针管理 > 云容器引擎 界面查看探针的基本信息,并手动执行安装或更新操作。
        来自:
      • 1
      • ...
      • 129
      • 130
      • 131
      • 132
      • 133
      • ...
      • 351
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      多活容灾服务 MDR

      GPU云主机

      镜像服务 IMS

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      天翼云CTyunOS系统

      公共算力服务

      模型推理服务

      应用托管

      推荐文档

      网页防篡改集中管理中心安装

      产品续订

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号