活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      弹性伸缩服务_相关内容
      • 网关服务管理
        本章节为您介绍网关服务管理的基本操作。 网关服务管理是用于维护网关服务,提供开通网关服务、删除、配置、查询详情等功能。 新增网关服务 1. 登录综合安全网关实例。 2. 在左侧导航栏选择“SSL网关服务 > 网关服务管理”,在页面左上角单击“开通网关服务”。 3. 在弹出的“新增网关服务”的对话框中配置网关服务参数。 参数 参数说明 服务名称 自定义新增的网关服务名称,完成创建后不可修改。 服务类型 选择新增的服务类型。 服务端口 选择新增的服务端口,完成创建后不可修改。 端口选择范围为:1844418454。 4. 确认填写的内容后,单击“确定”完成新增网关服务。 配置网关服务 1. 登录综合安全网关实例。 2. 在左侧导航栏选择“SSL网关服务 > 网关服务管理”,选择需要配置的网关服务,单击操作列的“配置”。 3. 在弹出的“配置网关服务”窗口中,配置相关参数。 参数 参数说明 服务名称 不可修改,服务名称是您创建时填写的。 服务类型 选择服务类型。 服务端口 不可修改。 SSL类型 选择需要配置的SSL类型。支持单向认证、双向认证。 协议类型 选择网关服务的协议类型。支持国际协议、国密协议、国际+国密协议。 SSL协议 选择网关服务的SSL协议,目前支持选择:SSLv3、TLSv1、TLSv1.1、TLSv1.2、TLSv1.3、HTTP2。 算法类型 选择“默认算法”或“自定义算法”。 SSL算法 选择自定义算法时可选择,根据您业务的需求选择SSL算法。 负载策略 选择网关服务的负载策略。 服务器组 选择服务器组。 证书 选择网关服务的证书。 4. 配置完成后,单击“确定”即可完成配置。
        来自:
        帮助文档
        云密评专区
        用户指南
        云密评专区—综合安全网关操作指南
        SSL网关服务
        网关服务管理
      • 开通云审计服务
        本文主要介绍开通云审计服务 操作场景 使用云审计服务前需要开启云审计服务,开启云审计服务后系统会自动创建一个名称为“system”,类型为“管理事件”的追踪器,系统记录的所有操作将关联在该追踪器中。 为了保存操作记录,需要将事件文件保存至对象存储服务中的存储对象的容器,即OBS桶。因此,开通云审计服务之前,需要开通对象存储服务,且用户对即将要使用的OBS桶具有完全的使用权限。云服务平台默认仅开通OBS的服务所有者能够访问OBS桶及其包含的所有对象,但服务所有者可以通过编写访问策略来向其他服务和用户授予访问权。 本节介绍如何开通云审计服务。 前提条件 已开通对象存储服务。 操作步骤 1. 登录管理控制台。 2. 单击“服务列表”,选择“管理与部署 > 云审计服务 CTS”,进入云审计服务信息页面。 3. 单击左侧导航树的“追踪器”,进入追踪器信息页面。 4. 单击“开通云审计服务”。 5. 在开启云审计服务详情页面,单击“开启”,完成开启云审计服务,系统会自动分配一个追踪器。 开启云审计服务成功后,您可以在追踪器信息页面查看系统自动创建的追踪器的详细信息。 追踪器记录创建追踪器的该租户的云服务资源的相关操作。云审计服务当前支持的云服务的详细信息,请参见支持审计的服务列表。
        来自:
        帮助文档
        云审计
        快速入门
        开通云审计服务
      • 服务降级
        本章节介绍Dubbo应用的服务降级功能 概述 业务高峰期时。您可以通过服务降级功能,对部分的服务消费者进行降级操作,让不重要的业务方不进行真实地调用,直接返回降级的结果,将宝贵的下游服务提供者资源保留给重要的业务调用方使用,从而提升整体服务的稳定性。 查看服务降级规则列表 在左侧导航栏,Dubbo治理 > 服务降级。查看当前账号下的服务降级规则。服务降级规则展示了规则名称、服务提供者应用、服务降级应用、应用框架、状态等信息,如果服务较多,可以通过环境、规则名称、被调用方进行筛选或搜索。 创建服务降级规则 在服务降级规则页面单击创建降级规则。 ● 环境:选择一个环境。 ● 规则名称:服务降级规则名称,例如 ordersales。 ● 规则描述:服务降级规则描述。 ● 服务提供者应用:选择提供服务的应用。 ● 降级应用:选择被调用的降级服务应用。 ● 降级规则: 框架类型:选择dubbo类型框架。 服务路径:选择服务应用和Path。 请求方法:选择应用的请求方式。 执行策略:选择服务降级的执行策略,包括所有请求生效和请求异常生效,请根据实际需求进行选择。 降级策略:选择服务降级的具体策略,包含返回Null值、返回Exception异常、返回自定义JSON数据和自定义回调,请根据实际需求选择。
        来自:
        帮助文档
        微服务云应用平台
        用户指南
        微服务治理
        Dubbo治理
        服务降级
      • 迁移专家服务工作说明书
        本文为您提供迁移专家服务的工作说明书。 迁移专家服务工作说明书 第1章 服务概述 天翼云迁移专家服务,包含:云迁移专家服务和存储数据迁移专家服务。 本服务针对客户迁移上云需求,开展迁移方案设计、组织迁移实施,向客户提供一站式上云业务迁移服务,满足客户迁移上云需求。 第2章 应用场景 迁移专家服务包含的应用场景主要包括: 1. 提供业务上云迁移咨询和实施服务,服务方式包括远程或现场支持。 2. 提供对象存储数据上云迁移咨询和实施服务,服务方式为远程支持。 第3章 前提条件 客户与天翼云双方指定对接人作为服务期间的信息交流渠道,明确需求细节后签订服务合同,按合同约定完成交付、验收。若仅需订购迁移专家服务中的某项服务,则以工作书中的该服务的具体服务内容为准,视该服务情况签订服务合同或协议。 在迁移服务启动前,双方应充分明确迁移前后资源情景、前置条件、验收标准等内容,天翼云迁移专家根据客户需求,输出详细迁移方案并通过双方评审,并完成各项准备后,启动迁移服务。 对于需要现场支持服务的迁移场景,客户需至少提前5个工作日申请。 对于需要远程支持服务的迁移场景,客户需至少提前3个工作日申请。
        来自:
        帮助文档
        云迁移服务CMS
        迁移专家服务
        迁移专家服务工作说明书
      • 服务权重
        本章节介绍如何实现服务实例按照配置权重分配流量. 前提条件 1. 已开通微服务引擎MSE; 2. 开通MSE实例并且状态正常; 3. 注册服务提供者,服务至少包含两个两个实例; 4. 注册服务消费者,服务至少包含两个两个实例; 5. 服务提供者和服务消费者必须在同一命名空间下; 6. 服务提供者和服务消费者客户端使用 SpringCloud和Feign作为服务调用框架; 服务端配置 1. 登录微服务引擎MSE注册配置中心管理控制台,选择资源池; 2. 在左侧导航栏,选择注册配置中心 > 实例列表; 3. 在实例列表页面,单击目标实例ID、实例名称或者目标行“管理”按钮均可跳转至实例基础信息页面; 4. 在基础信息页面,点击服务管理> 服务列表,选择命名空间,查看当前命名空间下注册的服务列表; 5. 找到目标服务所在行,点击查看按钮查看服务详情; 6. 点击服务详情页面"提供者" tab页,查看当前服务的实例,点击右侧操作列权重按钮,可以修改服务实例的权重,权重取值范围为[010000],含义为万分之N,数值与权重成正比; 说明 1. 服务实例的权重会影响该服务的消费者对该服务下所有实例的调用权重,例如,某个服务nacosprovider下存在提供者实例1.1.1.1:11和1.1.1.1:22,此时设置1.1.1.1:11权重为1,1.1.1.1:22权重为2,则服务nacosprovider的消费者nacosconsumer在进行服务消费时将可实现调用1.1.1.1:11和1.1.1.1:22的理论调用次数比例为1:2,据此可细粒度控制nacosprovider服务的负载均衡策略。 2. 权重设置的取值范围为010000,需要注意的是,当权重设置为0时,该实例将无法被消费者发现,从而无法接收请求。
        来自:
        帮助文档
        微服务引擎
        用户指南
        注册配置中心
        Nacos
        服务权重
      • HBlock服务
        本节主要介绍HBlock服务。 服务 服务名称 作用 stor:mdm 元数据管理服务(仅集群版支持) 管理整个系统的元数据。 stor:fc 故障转移控制服务(仅集群版支持) 进行系统健康检测,实现故障转移控制。 stor:ls 日志服务(仅集群版支持) 提供基于日志的数据同步功能。 stor:dsx 数据服务(仅集群版支持) 管理用户的文件数据块。 stor:cs 协调服务(仅集群版支持) 监视各服务器的状态,触发通知事件,确保集群服务高可用。 stor:ms 管理服务 处理请求信息,维护集群运行状态。 stor:ws 监控服务 监控各个服务的状态,并负责服务的启动。 stor:ps 协议解析服务 负责iSCSI协议解析与数据存储。 stor:ag 数据采集服务 负责采集性能数据。 stor:ua 升级监听服务 负责接收升级请求,执行升级相关操作。
        来自:
        帮助文档
        存储资源盘活系统
        用户指南
        附录
        HBlock服务
      • 配置服务参数
        导出服务配置参数 1. 单击“服务管理”。 2. 选中某项服务。 3. 单击“服务配置”。 4. 单击“导出服务配置”,选择一个位置保存配置文件。 导入服务配置参数 1. 单击“服务管理”。 2. 选中某项服务。 3. 单击“服务配置”。 4. 单击“导入服务配置”。 5. 选择一个指定的配置文件。 6. 单击“保存配置”,勾选“重新启动受影响的服务或实例。”并单击“确定”。 界面提示“操作成功。”,单击“完成”,服务成功启动。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        MRS Manager操作指导(适用于2.x及之前)
        对象管理
        配置服务参数
      • 同步服务配置
        本章节主要介绍翼MapReduce服务同步服务配置。 操作场景 当用户发现部分服务的“配置状态”为“过期”或“失败”时,您可以尝试使用同步配置功能,以恢复配置状态。或者集群中所有服务的配置状态为“失败”时,同步指定服务的配置数据与后台配置数据。 对系统的影响 同步服务配置后,需要重启配置过期的服务。重启时对应的服务不可用。 操作步骤 在MRS Manager,单击“服务管理”。 1.在服务列表中,单击指定服务名称。 2.在服务状态及指标信息上方,选择“更多 > 同步配置”。 3.在弹出窗口根据提示输入密码,单击“确认”完成身份验证。身份验证后勾选“重启配置过期的服务或实例。”,并单击“确定”重启配置过期的服务。 界面提示“操作成功”,单击“完成”,服务成功启动。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        MRS Manager操作指导(适用于2.x及之前)
        对象管理
        同步服务配置
      • ALM-16004 Hive服务不可用
        本章节主要介绍ALM16004 Hive服务不可用的告警。 告警解释 系统每60秒周期性检测Hive服务状态。当Hive服务不可用时产生该告警。 当Hive服务恢复时,告警恢复。 说明 MRS 3.X支持Hive多实例,若集群启用了多实例功能且安装了多个Hive服务,请根据“定位信息”的“服务名”值来确定具体产生告警的Hive服务。例如Hive1服务不可用,则“定位信息”中显示服务名Hive1,处理步骤中的操作对象也应由Hive调整为Hive1。 告警属性 告警ID 告警级别 是否自动清除 16004 紧急 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 系统无法提供数据加载,查询,提取服务。 可能原因 Hive服务不可用可能与ZooKeeper、HDFS、Yarn和DBService等基础服务有关,也可能由Hive自身的进程故障引起。 − ZooKeeper服务异常。 − HDFS服务异常。 − Yarn服务异常。 − DBService服务异常。 − Hive服务进程故障,如果告警由Hive进程故障引发,告警上报时间可能会延迟5分钟左右。 Hive服务和基础服务间的网络通信中断。 处理步骤 检查HiveServer/MetaStore进程状态 1.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Hive > 实例”,在Hive实例列表中,查看所有HiveServer或MetaStore实例状态是否都呈现未知状态。 是,执行步骤2。 否,执行步骤4。 2.在Hive实例列表上方,选择“更多 > 重启实例”,重启HiveServer/MetaStore进程。 3.在告警列表中,查看“Hive服务不可用”告警是否清除。 是,处理完毕。 否,执行步骤4。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-16004 Hive服务不可用
      • 创建终端节点服务
        本文将向您介绍创建终端节点服务的步骤,以便您根据实际需求进行操作。 操作场景 终端节点服务是将云服务或用户私有服务配置为VPC终端节点支持的服务。目前支持"接口"类型的终端节点服务的创建。 约束及限制 单个VPC可以创建终端节点服务实例数为20个。 单个终端节点服务可连接终端节点实例数为500个。 单个终端节点只能连接1个终端服务节点实例。 前提条件 在同一VPC内已创建了后端资源。 操作步骤 1. 点击天翼云门户首页的“控制中心”,输入登录的用户名和密码,进入控制中心页面。 2. 在管理控制台上方点击图标,选择所需的资源池节点,以下操作选择华东华东1。 3. 在系统首页,选择“网络>VPC终端节点”,进入“终端节点”页面。 4. 在左侧导航栏选择“终端节点服务”,点击“创建终端节点服务”。 5. 在“创建终端节点服务”页面根据“接口型”终端节点服务配置说明配置参数,点击“确定”完成创建。 “接口型”终端节点服务配置说明 参数 说明 地域 终端节点服务所在地域,页面左上角可切换地域。不同地域的资源之间内网不互通,为了最优化的性能,请选择靠近您的地域,以降低网络时延并提高访问速度。 名称 终端节点服务的名称。名称由数字、字母、中文、、组成,不能以数字、和开头。 VPC 终端节点服务所属虚拟私有云。 服务类型 终端节点服务的类型,当前支持“接口”类型终端节点服务。 IP地址类型 服务IP地址类型,IPV4:仅自持IPV4类型终端节点连接,实现IPV4地址私网访问服务,双栈:支持IPV4和IPV6类型终端节点连接,实现IPV4和IPV6地址的私网访问服务。选择双栈类型时,挂载的后端服务资源池必须也是双栈类型资源。 是否自动接收连接 是否自动接收终端节点与终端节点服务的连接,审核权由终端节点服务控制。 可选择“是”或“否”。选择“否”不自动接受连接,则创建的终端节点为“待审核”状态,需要终端节点服务审核后方可使用。 服务计费 是否开启服务计费,可选择“是”或“否”。 默认连接服务的终端节点费用有终端节点创建账户支付,如服务开启服务计费后,则连接服务的终端节点费用将由服务所在账户支付,功能仅创建时指定,服务创建后不可修改。 端口映射 终端节点服务与终端节点建立连接,支持通过TCP/UDP协议进行通信。 服务端口:终端节点服务绑定了后端资源,作为提供服务的端口。 终端端口:终端节点提供给用户,作为访问终端节点服务的端口。 服务端口和终端端口取值范围1~65535,单次操作最多可添加20条端口映射。 访问终端节点服务时,通过"终端端口 → 服务端口"的方式进行数据传输和通信。 后端资源类型 实际提供服务的后端资源。可创建为终端节点服务的后端资源包括: 云主机:作为服务器使用。 物理机:作为服务器使用。 虚拟IP:适用于需要主备高可靠的业务。 内网负载均衡:适用于高访问量业务和对可靠性和容灾性要求较高的业务。此处选择“内网负载均衡”。 说明:终端节点服务配置的后端资源所在安全组,安全组添加的规则是白名单,需要添加源地址为198.19.128.0/20的白名单入方向规则,详细操作请参考《虚拟私有云用户指南》中的添加安全组规则。 后端资源子网 选择后端资源所属的子网。 描述(可选) 可添加终端节点服务相关的描述。
        来自:
        帮助文档
        VPC终端节点
        用户指南
        终端节点服务管理
        创建终端节点服务
      • 服务降级
        本章节介绍Spring Cloud应用服务降级功能 概述 业务高峰期时,您可以通过服务降级功能,对部分的服务消费者进行降级操作,让不重要的业务方不进行真实地调用,直接返回降级的结果,将宝贵的下游服务提供者资源保留给重要的业务调用方使用,从而提升整体服务的稳定性。 查看服务降级规则列表 在左侧导航栏,Spring Cloud治理 > 服务降级。查看当前账号下的服务降级规则。服务降级规则展示了规则名称、服务提供者应用、服务降级应用、应用框架、状态等信息,如果服务较多,可以通过环境、规则名称、被调用方进行筛选或搜索。 创建服务降级规则 在服务降级规则页面单击创建降级规则。 ● 环境:选择一个环境。 ● 规则名称:服务降级规则名称,例如 ordersales。 ● 规则描述:服务降级规则描述。 ● 服务提供者应用:选择提供服务的应用。 ● 降级应用:选择被调用的降级服务应用。 ● 降级规则: 框架类型:选择Spring Cloud类型框架。 服务路径:选择服务应用和Path。 请求方法:选择应用的请求方式。 执行策略:选择服务降级的执行策略,包括所有请求生效和请求异常生效,请根据实际需求进行选择。 降级策略:选择服务降级的具体策略,包含返回Null值、返回Exception异常、返回自定义JSON数据和自定义回调,请根据实际需求选择。
        来自:
        帮助文档
        微服务云应用平台
        用户指南
        微服务治理
        Spring Cloud治理
        服务降级
      • 服务来源管理
        删除服务来源 在网关实例服务来源列表页,右侧操作栏可以对已经添加的服务来源进行删除操作 说明 如果有服务定义依赖当前服务来源,则不能删除该服务来源;需要删除该服务来源下定义的所有服务才可以删除该服务来源。
        来自:
        帮助文档
        微服务引擎
        用户指南
        云原生网关
        服务来源管理
      • 翼MapReduce MRS支持的事件列表
        翼MapReduce(翼MR)是一种基于云计算平台的数据处理分析服务,打造了高可靠、高安全、易使用的运行维护平台,对外提供大容量数据的存储和分析能力,可解决用户实时性要求不高的海量数据存储和处理需求,可以独立申请和使用托管Hadoop、Spark、HBase和Hive组件。 支持的事件列表如下: 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 DBServer主备倒换 dbServerSwitchover 次要 DBServer主备倒换 主备倒换需要和运维人员确认是否为正常操作导致。 连续触发主备倒换可能影响Hive服务正常使用,导致Hive服务不可用。 Flume Channel溢出 flumeChannelOverflow 次要 Flume Channel溢出 确认flume的channel配置是否合理,业务量是否有突增。 Flume任务无法正常写入数据到后端。 NameNode主备倒换 namenodeSwitchover 次要 NameNode主备倒换 主备倒换需要和运维人员确认是否为正常操作导致。 连续触发主备倒换可能影响HDFS服务正常使用,读写HDFS文件可能失败。 ResourceManager主备倒换 resourceManagerSwitchover 次要 ResourceManager主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响Yarn服务正常使用,导致任务出现异常甚至失败 JobHistoryServer主备倒换 jobHistoryServerSwitchover 次要 JobHistoryServer主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响MapReduce服务正常使用,导致任务日志读取异常 HMaster主备倒换 hmasterFailover 次要 HMaster主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响HBase服务正常使用 Hue发生主备切换 hueFailover 次要 Hue发生主备切换 主备倒换需要和运维人员确认是否为正常操作导致 主备倒换可能影响HUE服务正常使用,导致页面无法使用等问题 Impala HaProxy服务发生主备切换 impalaHaProxyFailover 次要 Impala HaProxy服务发生主备切换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响Impala服务正常使用 Impala StateStoreCatalog服务发生主备切换 impalaStateStoreCatalogFailover 次要 Impala StateStoreCatalog服务发生主备切换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响Impala服务正常使用 LdapServer主备倒换 ldapServerFailover 次要 LdapServer主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响LdapServer服务正常使用 Loader主备倒换 loaderSwitchover 次要 Loader主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 主备倒换可能影响Loader服务正常使用 Manager主备倒换 managerSwitchover 提示 Manager主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 Manager主备倒换可能导致Manager页面无法正常访问,部分监控可能出现异常数值 作业执行失败 jobRunningFailed 提示 作业执行失败 查看作业管理页面,确认失败任务是否有异常 作业执行过程出现失败 作业被终止 jobkilled 提示 作业被终止 确认任务是否人为下发终止命令 作业执行过程被终止 Oozie工作流执行失败 oozieWorkflowExecutionFailure 次要 Oozie工作流执行失败 查看Oozie日志,确认任务失败原因 Oozie工作流执行失败 Oozie定时任务执行失败 oozieScheduledJobExecutionFailure 次要 Oozie定时任务执行失败 查看Oozie日志,确认任务失败原因 Oozie定时任务执行失败 ClickHouse服务不可用 clickHouseServiceUnavailable 紧急 ClickHouse服务不可用 请参考《MapReduce服务用户指南》的“ALM45425 ClickHouse服务不可用”章节。 ClickHouse服务异常,无法通过FusionInsight Manager对ClickHouse进行集群操作,无法使用ClickHouse服务功能。 DBService服务不可用 dbServiceServiceUnavailable 紧急 DBService服务不可用 请参考《MapReduce服务用户指南》的“ALM27001 DBService服务不可用”章节。 数据库服务不可用,无法对上层服务提供数据入库、查询等功能,使部分服务异常。 DBService主备节点间心跳中断 dbServiceHeartbeatInterruption BetweentheActiveAndStandbyNodes 重要 DBService主备节点间心跳中断 请参考《MapReduce服务用户指南》的“ALM27003 DBService主备节点间心跳中断”章节。 DBService主备间心跳中断时只有一个节点提供服务,一旦该节点故障,再无法切换到备节点,就会服务不可用。 DBService主备数据不同步 dataInconsistencyBetween ActiveAndStandbyDBServices 紧急 DBService主备数据不同步 请参考《MapReduce服务用户指南》的“ALM27004 DBService主备数据不同步”章节。 主备DBServer数据不同步,如果此时主实例异常,则会出现数据丢失或者数据异常的情况。 数据库进入只读模式 databaseEnterstheReadOnlyMode 紧急 数据库进入只读模式 请参考《MapReduce服务用户指南》的“ALM27007 数据库进入只读模式”章节。 数据库进入只读模式,业务数据丢失。 Flume服务不可用 flumeServiceUnavailable 紧急 Flume服务不可用 请参考《MapReduce服务用户指南》的“ALM24000 Flume服务不可用”章节。 当Flume服务不可用时,Flume不能正常工作,数据传输业务中断。 Flume Agent异常 flumeAgentException 重要 Flume Agent异常 请参考《MapReduce服务用户指南》的“ALM24001 Flume Agent异常”章节。 产生告警的Flume Agent实例无法正常启动,定义在该实例下的数据传输任务暂时中断,对于实时数据传输,会丢失实时数据。 Flume Client连接中断 flumeClientDisconnected 重要 Flume Client连接中断 请参考《MapReduce服务用户指南》的“ALM24003 Flume Client连接中断”章节。 产生告警的Flume Client无法与Flume Server端进行通信,Flume Client端的数据无法传输到Flume Server端。 Flume读取数据异常 exceptionOccursWhenFlumeReadsData 重要 Flume读取数据异常 请参考《MapReduce服务用户指南》的“ALM24004 Flume读取数据异常”章节。 如果数据源有数据,Flume Source持续读取不到数据,数据采集会停止。 Flume传输数据异常 exceptionOccursWhenFlumeTransmitsData 重要 Flume传输数据异常 请参考《MapReduce服务用户指南》的“ALM24005 Flume传输数据异常”章节。 Flume Channel的磁盘空间使用量有继续增长的趋势,将会使数据导入到指定目的地的时间增长,当Flume Channel的磁盘空间使用量达到100%时会导致Flume Agent进程暂停工作。 Flume 证书文件非法或已损坏 flumeCertificateFileIsinvalid 重要 Flume 证书文件非法或已损坏 请参考《MapReduce服务用户指南》的“ALM24010 Flume证书文件非法或已损坏”章节。 Flume证书文件已经非法或损坏,功能受限,Flume客户端将无法访问Flume服务端。 Flume 证书文件即将过期 flumeCertificateFileIsAboutToExpire 重要 Flume 证书文件即将过期 请参考《MapReduce服务用户指南》的“ALM24011 Flume证书文件即将过期”章节。 Flume证书文件即将失效,对系统目前运行无影响。 Flume 证书文件已过期 flumeCertificateFileIsExpired 重要 Flume 证书文件已过期 请参考《MapReduce服务用户指南》的“ALM24012 Flume证书文件已过期”章节。 Flume证书文件已过期,功能受限,Flume客户端将无法访问Flume服务端。 Flume MonitorServer证书文件失效 flumeMonitorServerCertificateFileIsInvalid 重要 Flume MonitorServer证书文件失效 请参考《MapReduce服务用户指南》的“ALM24013 Flume MonitorServer证书文件非法或已损坏”章节。 MonitorServer证书文件已经非法或损坏,功能受限,Flume客户端将无法访问Flume服务端。 Flume MonitorServer证书文件即将过期 flumeMonitorServerCertificate FileIsAboutToExpire 重要 Flume MonitorServer证书文件即将过期 请参考《MapReduce服务用户指南》的“ALM24014 Flume MonitorServer证书文件即将过期”章节。 MonitorServer证书文件即将失效,对系统目前运行无影响。 Flume MonitorServer证书文件已过期 flumeMonitorServerCertificateFileIsExpired 重要 Flume MonitorServer证书文件已过期 请参考《MapReduce服务用户指南》的“ALM24015 Flume MonitorServer证书文件已过期”章节。 MonitorServer证书文件已过期,功能受限,Flume客户端将无法访问Flume服务端。 HDFS服务不可用 hdfsServiceUnavailable 紧急 HDFS服务不可用 请参考《MapReduce服务用户指南》的“ALM14000 HDFS服务不可用”章节。 无法为基于HDFS服务的HBase和MapReduce等上层部件提供服务。用户无法读写文件。 NameService服务异常 nameServiceServiceUnavailable 重要 NameService服务异常 请参考《MapReduce服务用户指南》的“ALM14010 NameService服务异常”章节。 无法为基于该NameService服务的HBase和MapReduce等上层部件提供服务。用户无法读写文件。 DataNode数据目录配置不合理 datanodeDataDirectoryIsNotConfiguredProperly 重要 DataNode数据目录配置不合理 请参考《MapReduce服务用户指南》的“ALM14011 DataNode数据目录配置不合理”章节。 如果将DataNode数据目录挂载在根目录等系统关键目录,长时间运行后会将根目录写满,导致系统故障。不合理的DataNode数据目录配置,会造成HDFS的性能下降。 Journalnode数据不同步 journalnodeIsOutOfSynchronization 重要 Journalnode数据不同步 请参考《MapReduce服务用户指南》的“ALM14012 Journalnode数据不同步”章节。 当一个JournalNode节点工作状态异常时,其数据就会与其他JournalNode节点的数据不同步。如 果超过一半的JournalNode节点的数据不同步时,NameNode将无法工作,导致HDFS服务不可用。 NameNode FsImage文件更新失败 failedToUpdateTheNameNodeFsImageFile 重要 NameNode FsImage文件更新失败 请参考《MapReduce服务用户指南》的“ALM14013 NameNode FsImage文件更新失败”章节。 如果主NameNode数据目录的FsImage没有更新,则说明HDFS元数据合并功能异常,需要修复。 如不修复,HDFS在运行一段时间后,Editlog会一直增长。此时如果重启HDFS,由于要加载非常多的Editlog,会导致启动非常耗时。另外,该告警的产生也说明备NameNode功能异常,导致NameNode的HA机制失效。一旦主NameNode故障,则整个HDFS服务将不可用。 DataNode磁盘故障 datanodeDiskFault 重要 DataNode磁盘故障 请参考《MapReduce服务用户指南》的“ALM14027 DataNode磁盘故障”章节。 上报DataNode磁盘故障告警时,表示该DataNode节点上存在故障的磁盘分区,可能会导致已写入的文件丢失。 Yarn服务不可用 yarnServiceUnavailable 紧急 Yarn服务不可用 请参考《MapReduce服务用户指南》的“ALM18000 Yarn服务不可用”章节。 集群无法提供Yarn服务。用户无法执行新的application。已提交的application无法执行。 NodeManager心跳丢失 nodemanagerHeartbeatLost 重要 NodeManager心跳丢失 请参考《MapReduce服务用户指南》的“ALM18002 NodeManager心跳丢失”章节。 丢失的NodeManager节点无法提供Yarn服务。容器减少,集群性能下降。 NodeManager不健康 nodemanagerUnhealthy 重要 NodeManager不健康 请参考《MapReduce服务用户指南》的“ALM18003 NodeManager不健康”章节。 故障的NodeManager节点无法提供Yarn服务。容器减少,集群性能下降。 Yarn 任务执行超时 yarnApplicationTimeout 次要 Yarn 任务执行超时 请参考《MapReduce服务用户指南》的“ALM18020 Yarn任务执行超时”章节。 任务执行超时后的运行时间内,该告警一直存在,但任务仍继续正常执行,没有任何影响。 Mapreduce服务不可用 mapreduceServiceUnavailable 紧急 Mapreduce服务不可用 请参考《MapReduce服务用户指南》的“ALM18021 Mapreduce服务不可用”章节。 集群无法提供Mapreduce服务,如无法通过Mapreduce查看任务日志,无法提供Mapreduce服务的日志归档功能等。 Yarn队列资源不足 insufficientYarnQueueResources 次要 Yarn队列资源不足 请参考《MapReduce服务用户指南》的“ALM18022 Yarn队列资源不足”章节。 应用任务结束时间变长。新应用提交后长时间无法运行。 HBase服务不可用 hbaseServiceUnavailable 紧急 HBase服务不可用 请参考《MapReduce服务用户指南》的“ALM19000 HBase服务不可用”章节。 无法进行数据读写和创建表等操作。 HBase系统表目录或文件丢失 systemTablePathOrFileOfHBaseIsMissing 紧急 HBase系统表目录或文件丢失 请参考《MapReduce服务用户指南》的“ALM19012 HBase系统表目录或文件丢失”章节。 HBase服务重启/启动失败。 Hive服务不可用 hiveServiceUnavailable 紧急 Hive服务不可用 请参考《MapReduce服务用户指南》的“ALM16004 Hive服务不可用”章节。 Hive无法提供数据加载,查询,提取服务。 Hive数据仓库被删除 hiveDataWarehouseIsDeleted 紧急 Hive数据仓库被删除 请参考《MapReduce服务用户指南》的“ALM16045 Hive数据仓库被删除”章节。 Hive默认数据仓库被删除,会导致在默认数据仓库中创建库、创建表失败,影响业务正常使用。 Hive数据仓库权限被修改 hiveDataWarehousePermissionIsModified 紧急 Hive数据仓库权限被修改 请参考《MapReduce服务用户指南》的“ALM16046 Hive数据仓库权限被修改”章节。 Hive默认数据仓库的权限被修改,会影响当前用户,用户组,其他用户在默认数据仓库中创建库、创建表等操作的操作权限范围。会扩大或缩小权限。 HiveServer已从Zookeeper注销 hiveServerHasBeenDeregisteredFromZookeeper 重要 HiveServer已从Zookeeper注销 请参考《MapReduce服务用户指南》的“ALM16047 HiveServer已从Zookeeper注销”章节。 当无法在Zookeeper上读取到Hive的配置,将会导致HiveServer不可用。 tez或者spark库路径不存在 tezlibOrSparklibIsNotExist 重要 tez或者spark库路径不存在 请参考《MapReduce服务用户指南》的“ALM16048 Tez或者Spark库路径不存在”章节。 Tez或者Spark库路径不存在,会影响Hive on Tez,Hive on Spark的功能。 Hue服务不可用 hueServiceUnavailable 紧急 Hue服务不可用 请参考《MapReduce服务用户指南》的“ALM20002 Hue服务不可用”章节。 系统无法提供数据加载,查询,提取服务。 Impala服务不可用 impalaServiceUnavailable 紧急 Impala服务不可用 请参考《MapReduce服务用户指南》的“ALM29000 Impala服务不可用”章节。 Impala服务异常,无法通过FusionInsight Manager对Impala进行集群操作,无法使用Impala服务功能。 Kafka服务不可用 kafkaServiceUnavailable 紧急 Kafka服务不可用 请参考《MapReduce服务用户指南》的“ALM38000 Kafka服务不可用”章节。 集群无法对外提供Kafka服务,用户无法执行新的Kafka任务。 Kafka默认用户状态异常 statusOfKafkaDefaultUserIsAbnormal 紧急 Kafka默认用户状态异常 请参考《MapReduce服务用户指南》的“ALM38007 Kafka默认用户状态异常”章节。 Kafka默认用户状态异常,会影响Broker之间的元数据同步,以及Kafka与ZooKeeper之间的交互,进而影响业务生产、消费和Topic的创建、删除等操作。 Kafka数据目录状态异常 abnormalKafkaDataDirectoryStatus 重要 Kafka数据目录状态异常 请参考《MapReduce服务用户指南》的“ALM38008 Kafka数据目录状态异常”章节。 Kafka数据目录状态异常,会导致该数据目录上所有Partition的当前副本下线,多个节点同时出现数据目录状态异常,可能会导致部分Partition不可用。 存在单副本的Topic topicsWithSingleReplica 警告 存在单副本的Topic 请参考《MapReduce服务用户指南》的“ALM38010 存在单副本的Topic”章节。 单副本的Topic存在单点故障风险,当副本所在节点异常时,会直接导致Partition没有leader,影响该Topic上的业务。 KrbServer服务不可用 krbServerServiceUnavailable 紧急 KrbServer服务不可用 请参考《MapReduce服务用户指南》的“ALM25500 KrbServer服务不可用”章节。 告警发生时,不能对集群中的组件KrbServer进行任何操作。其它组件的KrbServer认证将受影响。集群中依赖KrbServer的组件运行状态将为故障。 Kudu服务不可用 kuduServiceUnavailable 紧急 Kudu服务不可用 请参考《MapReduce服务用户指南》的“ALM29100 Kudu服务不可用”章节。 用户无法使用Kudu服务。 LdapServer服务不可用 ldapServerServiceUnavailable 紧急 LdapServer服务不可用 请参考《MapReduce服务用户指南》的“ALM25000 LdapServer服务不可用”章节。 告警发生时,不能对集群中的KrbServer和LdapServer用户进行任何操作。 例如,无法在FusionInsight Manager页面添加、删除或修改任何用户、用户组或角色,也无法修改用户密码。集群中原有的用户验证不受影响。 LdapServer数据同步异常 abnormalLdapServerDataSynchronization 紧急 LdapServer数据同步异常 请参考《MapReduce服务用户指南》的“ALM25004 LdapServer数据同步异常”章节。 LdapServer数据不一致时,有可能是Manager上的LdapServer数据损坏,也有可能是集群上的LdapServer数据损坏,此时数据损坏的LdapServer进程将无法对外提供服务,影响Manager和集群的认证功能。 Nscd服务异常 nscdServiceIsAbnormal 重要 Nscd服务异常 请参考《MapReduce服务用户指南》的“ALM25005 Nscd服务异常”章节。 nscd服务异常时,可能会影响该节点从LdapServer上同步数据,此时,使用id命令可能会获取不到Ldap中的数据,影响上层业务。 Sssd服务异常 sssdServiceIsAbnormal 重要 Sssd服务异常 请参考《MapReduce服务用户指南》的“ALM25006 Sssd服务异常”章节。 sssd服务异常时,可能会影响该节点从LdapServer上同步数据,此时,使用id命令可能会获取不到ldap中的数据,影响上层业务。 Loader服务不可用 loaderServiceUnavailable 紧急 Loader服务不可用 请参考《MapReduce服务用户指南》的“ALM23001 Loader服务不可用”章节。 如果Loader服务不可用,数据加载,导入,转换的功能也不可用。 Oozie服务不可用 oozieServiceUnavailable 紧急 Oozie服务不可用 请参考《MapReduce服务用户指南》的“ALM17003 Oozie服务不可用”章节。 无法使用Oozie服务提交作业。 Ranger服务不可用 rangerServiceUnavailable 紧急 Ranger服务不可用 请参考《MapReduce服务用户指南》的“ALM45275 Ranger服务不可用”章节。 当Ranger服务不可用时,Ranger无法正常工作,Ranger原生UI无法访问。 RangerAdmin状态异常 abnormalRangerAdminStatus 重要 RangerAdmin状态异常 请参考《MapReduce服务用户指南》的“ALM45276 RangerAdmin状态异常”章节。 当存在单个RangerAdmin状态异常时,不影响Ranger原生UI访问;当两个RangerAdmin状态异常时,Ranger原生UI无法访问,无法执行创建、修改、删除策略等操作。 Spark2x服务不可用 spark2xServiceUnavailable 紧急 Spark2x服务不可用 请参考《MapReduce服务用户指南》的“ALM43001 Spark2x服务不可用”章节。 用户提交的Spark任务执行失败。 Storm服务不可用 stormServiceUnavailable 紧急 Storm服务不可用 请参考《MapReduce服务用户指南》的“ALM26051 Storm服务不可用”章节。 集群无法对外提供Storm服务,用户无法执行新的Storm任务。 ZooKeeper服务不可用 zooKeeperServiceUnavailable 紧急 ZooKeeper服务不可用 请参考《MapReduce服务用户指南》的“ALM13000 ZooKeeper服务不可用”章节。 ZooKeeper无法为上层组件提供协调服务,依赖ZooKeeper的组件可能无法正常运行。 ZooKeeper中组件顶层目录的配额设置失败 failedToSetTheQuotaOfTopDirectoriesOf ZooKeeperComponent 次要 ZooKeeper中组件顶层目录的配额设置失败 请参考《MapReduce服务用户指南》的“ALM13005 ZooKeeper中组件顶层目录的配额设置失败”章节。 组件可以向对应的ZooKeeper顶层目录中写入大量数据,导致Zookeeper服务不可用。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        翼MapReduce MRS支持的事件列表
      • 服务流程
        本页为您介绍数据库专家服务的服务流程。 服务流程图 数据库专家服务流程图如下: 服务流程 用户购买和使用数据库专家服务的流程,具体如下: 1. 用户可以根据自己的实际需要,提前或者在问题发生时购买数据库专家服务,专家服务包含基础服务、保驾护航服务和数据库增值服务包等三种服务类型。购买前建议先咨询客服了解情况、初步达成一致意见。 2. 购买专家服务时,按实际需要选择服务类型和服务内容,并按要求填写用户联系方式、详细需求、购买量等信息。详细需求请尽量描述得清晰而具体,便于专家团队初步了解需求情况。 3. 专家团队收到服务请求后,会根据用户需求安排合适的服务专家。 4. 服务专家在3天内联系用户进行需求的详细沟通并进行技术评估。 5. 技术评估通过后进入实施阶段,服务专家按与用户约定的时间和服务内容处理和解决问题,并把处理结果反馈给用户。 6. 用户对专家团队提供的服务成果进行验收(增值服务包不涉及验收环节)。
        来自:
        帮助文档
        数据库专家服务
        产品介绍
        服务流程
      • 通用类问题
        本章节介绍天翼云边缘重保服务的常见通用类问题。 如何获得天翼云边缘重保服务? 请联系专属客户经理提交服务开通申请,或者拨打天翼云客服电话4008109889进行订购,天翼云将根据您在天翼云上的产品及业务类型进行审核确认。 天翼云边缘重保服务具体针对哪些产品提供服务? 天翼云边缘重保服务目前覆盖的产品范围为:CDN 加速、视频直播、全站加速、边缘安全加速平台、安全加速、Web 应用防火墙(边缘云版)、DDoS 高防(边缘云版)、智能边缘云,不同服务版本可支持产品差异详见服务版本差异一览表。 天翼云边缘重保服务目前提供哪些服务版本?不同服务版本之间有何差异? 天翼云边缘重保服务提供体验版、基础护航服务、尊享护航服务、安全护航服务、尊享安全护航服务五个服务版本,不同版本差异详见服务版本差异一览表。 若某场需要重保的活动中,同时使用了边缘安全加速平台和视频直播产品,是否需要重复订购不同版本的边缘重保服务? 无需重复订购, 每一个服务版本均可支持其所覆盖范围中的一款或多款产品,请根据实际保障方式和需要保障的产品列表按需选择对应版本进行订购即可。
        来自:
        帮助文档
        边缘重保服务
        常见问题
        通用类问题
      • 启动、停止单集群服务
        本章节主要介绍翼MR Manager的单个集群服务的启动、停止。 启动集群服务 操作场景 一键启动单个集群服务。 操作步骤 1. 登录翼MR管理控制台。 2. 单击“我的集群”,单击指定的集群名称,进入集群信息页面。 3. 单击“翼MR Manager”tab,单击“前往翼MR Manager”。 4. 进入到翼MR Manager以后,单击菜单“集群服务”,进入集群服务列表页面。 5. 选择指定集群服务,单击集群服务名称进入集群服务详情页面。 6. 单击“运维操作>启动集群服务”,弹出确认操作弹框。 7. 单击“确定”,进入到启动集群服务页面,展示当前集群服务支持启动的实例列表。如图所示: 8. 单击“下一步”,按照实例分组顺序进行实例启动,等待所有实例完成启动后即可。如图所示: 停止集群服务 操作场景 一键停止单个集群服务。 操作步骤 1. 登录翼MR管理控制台。 2. 单击“我的集群”,单击指定的集群名称,进入集群信息页面。 3. 单击“翼MR Manager”tab,单击“前往翼MR Manager”。 4. 进入到翼MR Manager以后,单击菜单“集群服务”,进入集群服务列表页面。 5. 选择指定集群服务,单击集群服务名称进入集群服务详情页面。 6. 单击“运维操作>停止集群服务”,弹出确认操作弹框。 7. 单击“确定”,进入到停止集群服务页面,展示当前集群服务支持停止的实例列表。 8. 单击“下一步”,按照实例分组顺序进行实例停止,等待所有实例完成停止后即可。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        翼MR Manager操作指导
        集群服务
        启动、停止单集群服务
      • 服务
        后续操作 配置服务:选择需要配置的服务,单击“操作”列的“配置”按钮可以开始配置服务。 添加API:选择需要添加API的服务,单击“操作”列的“API”按钮即可开始添加API,具体添加方式请参见:API章节。 查看服务:选择需要查看的服务,单击“操作”列的“查看”按钮可以开始查看服务。 删除服务:选择需要删除的服务,单击“操作”列的“删除”按钮可以开始删除服务。
        来自:
        帮助文档
        数据安全专区
        用户指南
        API安全网关操作指导
        资源
        服务
      • ALM-38000 Kafka服务不可用
        本章节主要介绍ALM38000 Kafka服务不可用的告警。 告警解释 系统按照30秒的周期检测Kafka服务是否可用,当Kafka服务不可用,系统产生此告警。 当Kafka服务恢复正常,告警自动清除。 告警属性 告警ID 告警级别 是否自动清除 38000 紧急 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 集群无法对外提供Kafka服务,用户无法执行新的Kafka任务。 可能原因 KrbServer服务故障。(非普通模式集群) ZooKeeper服务故障或无响应。 Kafka服务中Broker实例状态异常。 处理步骤 检查KrbServer服务状态(普通模式集群跳过此步骤) 1. 在FusionInsight Manager管理界面,选择“集群 > 待操作集群的名称 > 服务 > KrbServer”。 2. 查看KrbServer服务的运行状态是否为“良好”。 是,执行步骤5。 否,执行步骤3。 3. 参考“ALM25500 KrbServer服务不可用”的处理步骤进行操作。 4. 再次执行步骤2。 检查ZooKeeper服务状态 5. 查看ZooKeeper服务的运行状态是否为“良好”。 是,执行步骤8。 否,执行步骤6。 6. 如果ZooKeeper服务已停止,则启动ZooKeeper服务,否则参考“ALM13000 ZooKeeper服务不可用”的处理步骤进行操作。 7. 再次执行步骤5。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-38000 Kafka服务不可用
      • 管理类
        本节介绍N100管理类常见问题。 N100过期后无法配置? N100授权过期后会锁定配置,需导入续订授权后重启恢复。如过期时间较长会影响业务正常访问。 建议:过期后还请尽快续订,如不续订,还请解绑弹性IP至业务主机,防止出现业务影响。 N100如何创建管理员用户? 要创建管理员用户,请登录N100的Web管理页面,导航到系统设备管理选项,然后选择管理员管理。在此处,您可以新建管理员用户,分配唯一用户名和强密码,以及为其分配适当的角色和权限。 注意 创建管理员用户涉及系统权限,因此确保定期审计管理员用户,启用多因素身份验证,并使用最小权限原则来降低管理上的风险。 N100是否满足三权分离? 三权分离用于确保权力不会集中在一个单一的实体或个人手中,以防止滥用权力、促进监督和平衡,从而维护公共机构的透明性和效力。在信息安全领域,三权分离原则通常应用于管理系统和数据的访问和操作,以保护网络安全和防止内部滥用权力。 N100提供内置的管理员、操作员和审计员权限,允许实现三权分离。您可以登录N100的Web管理页面,导航到系统设备管理选项,然后选择管理员管理并分配相应权限,以确保合适的角色和职责,但需要定期审计和管理用户权限,以最大程度地减少潜在的管理上风险。
        来自:
        帮助文档
        云防火墙(原生版)
        常见问题
        N100常见问题
        管理类
      • 删除协议服务
        协议服务提供标准NFS协议访问HPFS文件系统的能力,本文介绍删除协议服务的场景说明和操作步骤。 场景说明 当用户不再使用协议服务时,可以删除相应的协议服务。需要注意,删除协议服务会导致云主机实例无法通过协议服务挂载访问HPFS,删除协议服务不会删除文件系统内的数据,但会立即中断当前正在通过协议服务访问此目录的所有I/O,请谨慎操作。删除后可以通过创建新的协议服务访问原有数据。 注意 如您需要删除文件系统,需先删除文件系统下的所有协议服务。 操作步骤 1. 登录天翼云控制中心,单击管理控制台左上角的,选择地域。 2. 选择“存储>并行文件服务HPFS”,进入并行文件服务的控制台页面。 3. 点击目标文件系统,进入文件系统详情页,点击协议服务页签,即可进入协议服务页面。 4. 在协议服务列表,找到目标协议服务,单击目标所在行的"操作"列下的"删除"。 5. 在弹出的对话框中再次确认是否删除。 6. 等待一段时间后,在列表页可以看到该协议服务已经不存在,即表示删除成功。
        来自:
        帮助文档
        并行文件服务 HPFS
        用户指南
        协议服务
        删除协议服务
      • 到期
        产品企业版、护航版、应急响应、安全评估、全流量分析服务到期策略说明。 基础版/企业版 根据订购时长提供服务,服务到期后,立即停止基础版/企业版服务,对使用过程中的安全数据进行清除。 护航版 护航版服务订购的有效期为1年,按照用户购买天数进行交付,交付完成或未交付但购买时长超过一年,则服务到期,到期仍未使用不退款。 应急响应 应急响应服务订购的有效期为1年,交付完或未交付但购买时长超过一年,则应急响应服务到期,到期仍未使用不退款。 安全评估 安全评估服务订购的有效期为1年,交付完或未交付但购买时长超过一年,则安全评估服务到期,到期仍未使用不退款。 全流量分析服务 根据订购时长提供服务,服务到期后,立即停止全流量分析服务。
        来自:
        帮助文档
        托管检测与响应服务(原生版)
        计费说明
        到期
      • 产品类
        托管检测与响应服务(原生版)提供几种服务项目? 托管检测与响应服务(原生版)提供: 基础版:为中小型客户提供远程交付的基础安全运营能力。 企业版:满足安全托管服务需求,解决日常安全运营人力不足、缺少标准流程的问题。 护航版:满足重要时期安全保障需求,护航版含蓝军攻击服务。 应急响应:满足突发安全事件时的应急处置需求,快速止损,威胁溯源。 安全评估:帮助您了解整体安全状况。 全流量分析服务:为用户提供更加强大的安全监控服务能力,全面检测主机流量,发现病毒木马、APT攻击等,提高托管服务价值。 护航版的有效期是多长? 从您成功购买托管检测与响应服务(原生版)护航版起计算,1年内您可以随时发起服务需求。我们的服务团队也会主动联系您,确认服务内容及服务时间。 请您务必在有效期内使用,到期以后,需重新购买本服务。 应急响应的有效期是多长? 从您成功购买托管检测与响应服务(原生版)应急响应起计算,1年内您可以随时发起服务需求。建议您提前购买应急服务,我们会指派专门的服务经理与您保持联系,第一时间响应,快速开展服务。 请您务必在有效期内使用,到期以后,需重新购买。
        来自:
        帮助文档
        托管检测与响应服务(原生版)
        常见问题
        产品类
      • 启动、停止所有集群服务
        本章节主要介绍翼MR Manager的启动所有集群服务、停止所有集群服务操作。 启动所有集群服务 操作场景 一键启动所有集群服务。 操作步骤 1. 登录翼MR管理控制台。 2. 单击“我的集群”,单击指定的集群名称,进入集群信息页面。 3. 单击“翼MR Manager”tab,单击“前往翼MR Manager”。 4. 进入到翼MR Manager以后,单击菜单“集群服务”,进入集群服务列表页面。 5. 单击“更多操作>启动所有集群服务”,弹出确认操作弹框。 6. 单击“确定”,开始启动所有集群服务,等待所有集群服务完成启动后即可 注意 启动所有集群服务时按照集群依赖关系串行执行。 在执行过程中,可以取消当前操作,已启动的集群服务无法取消。 停止所有集群服务 操作场景 一键停止所有集群服务。 操作步骤 1. 登录翼MR管理控制台。 2. 单击“我的集群”,单击指定的集群名称,进入集群信息页面。 3. 单击“翼MR Manager”tab,单击“前往翼MR Manager”。 4. 进入到翼MR Manager以后,单击菜单“集群服务”,进入集群服务列表页面。 5. 单击“更多操作>停止所有集群服务”,弹出确认操作弹框。 6. 单击“确定”,开始停止所有集群服务,等待所有集群服务完成停止后即可。 注意 停止所有集群服务时按照集群依赖关系串行执行。 在执行过程中,可以取消当前操作,已停止的集群服务无法取消。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        翼MR Manager操作指导
        集群服务
        启动、停止所有集群服务
      • 服务测试
        本章节介绍 Spring Cloud应用服务测试功能 概述 在日常开发中,开发人员或测试人员需要临时调用线上服务来调试已经部署的服务或查询线上数据。服务测试功能可以让您在控制台填写调用参数、发起服务调用,并得到服务调用的结果。 查看服务列表 在左侧导航栏,Spring Cloud治理 > 服务测试。查看当前账号下可以进行测试的Spring Cloud服务。如果服务较多,可以通过环境、服务名、应用名进行筛选或搜索,服务名和应用名大小写不敏感。 服务测试 再服务测试列表操作列,单击测试,在测试服务面板中设置参数,然后单击执行,等待返回结果。 调用IP:服务的实例(ECS或Pod)IP。如果部署了多个实例,在列表中选择其中一个IP,进行测试,只能单选。 Path:请求服务的接口路径,在列表中选择其中一个路径,只能单选。 请求方法:该所属类的请求方法,包含GETPUTPOSTDELETE多个请求方法,在列表中选择其中一种方法,只能单选。
        来自:
        帮助文档
        微服务云应用平台
        用户指南
        微服务治理
        Spring Cloud治理
        服务测试
      • 与其他服务关系
        本章节介绍数据库复制与其他服务的关系。 关系型数据库 数据库复制服务可将已有数据库迁移到本云关系型数据库(Relational Database Service,简称RDS)。 目前数据库复制服务支持将如下场景的关系型数据库迁移到本云关系型数据库: VPC网络 VPN网络 专线网络 公网网络 文档数据库服务 数据库复制服务可将已有数据库迁移到本云文档数据库服务(Document Database Service)。 目前数据库复制服务支持将如下场景的MongoDB数据库迁移到本云文档数据库服务: VPC网络 VPN网络 专线网络 公网网络 分布式关系型数据库 数据库复制服务可将已有数据库迁移到本云分布式数据库中间件(Distributed Database Middleware,简称DDM)。 目前数据库复制服务支持将如下场景的数据库迁移到本云分布式数据库中间件服务: VPC网络 VPN网络 专线网络 公网网络 云监控 当用户开通了数据库复制后,无需额外安装其他插件,即可在云监控查看对应服务的实例状态。 云审计服务 云审计服务(Cloud Trace Service,简称CTS)记录数据库复制服务相关的操作事件,方便您日后的查询、审计和回溯。 对象存储服务 对象存储服务为数据库复制服务提供海量、安全、高可靠、低成本的数据存储能力。
        来自:
        帮助文档
        数据库复制
        产品简介
        与其他服务关系
      • 扩容云硬盘扩展逻辑卷的容量
        步骤二:扩展逻辑卷的容量 1. 以root用户登录弹性云主机。 2. 执行 fdisk l 命令,查看系统是否正确识别扩容后的磁盘。具体回显如图所示: 扩容前/dev/vdb的容量是10GB,扩容后为20GB。 3. 执行pvdisplay命令,查看LVM的物理卷相关信息。具体回显如图所示: /dev/vdb的容量是10GB,说明物理卷容量未增加。 4. 执行 pvresize v 磁盘设备名,扩容该云硬盘对应的物理卷。此处执行命令pvresize v /dev/vdb,具体回显如图所示: 说明/dev/vdb对应的物理卷扩容成功。 5. 如果还需要对现有分区进行扩容,执行 lvextend l +100%FREE 逻辑卷路径,扩容对应逻辑卷。 此处执行命令lvextend l +100%FREE /dev/vgdata/lvdata,具体回显如图所示: 6. 执行 resize2fs 逻辑卷路径,扩展磁盘分区文件系统的大小。此处执行命令resize2fs /dev/vgdata/lvdata,具体回显如图所示: 7. 执行lvdisplay命令,查看扩容最终结果。具体回显如图所示: 可以看到,逻辑卷容量“LV Size”已经增加10GB。
        来自:
        帮助文档
        云硬盘 EVS
        最佳实践
        使用LVM管理云硬盘
        实施步骤
        扩容云硬盘扩展逻辑卷的容量
      • 监控指标
        弹性IP和共享带宽支持的监控指标 监控指标 说明 入网带宽 该指标用于统计测试对象入云方向单位时间内网络消耗带宽的平均值 出网带宽 该指标用于统计测试对象出云方向单位时间内网络消耗带宽的平均值 入网流量 该指标用于统计测试对象入云方向的网络流量 出网流量 该指标用于统计测试对象出云方向的网络流量 入网带宽使用率 该指标用于统计测试对象入云方向单位时间内消耗的峰值带宽和总带宽的百分比(当最大突发流量小于2秒,可能存在使用率偏小的情况) 出网带宽使用率 该指标用于统计测试对象出云方向单位时间内消耗的峰值带宽和总带宽的百分比(当最大突发流量小于2秒,可能存在使用率偏小的情况) 入方向丢包数 该指标用于统计测试对象入云方向被丢弃数据包的个数 出方向丢包数 该指标用于统计测试对象出云方向被丢弃数据包的个数 入方向丢包率 该指标用于统计测试对象入云方向被丢弃数据包的百分比 出方向丢包率 该指标用于统计测试对象出云方向被丢弃数据包的百分比 注意 出/入方向丢包监控、出/入方向带宽使用率指标,目前对部分资源池开放,请以控制台实际可见为准。
        来自:
        帮助文档
        共享带宽 SBW
        用户指南
        运维与监控
        监控指标
      • 解除数据加速(1)
        本节介绍如何解除数据集加速。 当不再需要使用加速数据时,可以通过解除加速来释放存储资源。 解除加速后,将同步删除数据源配置资源(Dataset)、加速引擎资源(Runtime)、预热资源(DataLoad),本地缓存数据将自动清理。 前提条件 已完成AI套件安装,弹性数据集组件运行正常 确保存储插件cstorcsi运行正常 数据集已开启数据加速 确认已没有业务资源在使用加速数据集 约束与限制 解除加速将清理缓存数据,业务无法再使用加速功能,请谨慎操作 解除加速前请确认已没有业务资源在使用加速数据集,否则无法执行解除 操作步骤 1、解除加速 登录云容器引擎管理控制台; 在集群列表页点击进入指定集群; 进入主菜单 智算套件 > AI应用管理 > 数据集 > 私有数据集,选择数据集; 进入数据集详情页 > 版本: 数据集版本列表中,对于已加速数据集,开放“解除加速”入口。点击“解除加速”,将开启清理操作。 解除加速完成,数据集加速状态将置为“未加速”。 2、解除加速失败 Cannot decelerate, pods [XXX] are using PVC fluiddsXXX 该错误由于检查当前仍有应用在使用加速数据集导致。可根据提示pod确认是否要解除加速,如仍需解除,需首先释放占用资源,再重试解除即可。
        来自:
      • 创建节点
        参数 参数说明 计费模式 支持如下两种计费方式。 包年包月 包年包月需要选择购买时长。 按需计费 可用区 节点云主机所在的可用区,集群下节点创建在不同可用区下可以提高可靠性。 创建后不可修改。建议您选择“随机分配”,可根据选择的节点规格随机分配一个可以使用的可用区。 可用区是在同一区域下,电力、网络隔离的物理区域,可用区之间内网互通,不同可用区之间物理隔离。 如果您需要提高工作负载的高可靠性,建议您将云主机创建在不同的可用区。 节点类型 CCE集群支持弹性云主机虚拟机和物理机。 操作系统 选择操作系统类型,不同类型节点支持的操作系统有所不同。 公共镜像:请选择节点对应的操作系统。 节点名称 节点云主机使用的名称,批量创建时将作为云主机名称的前缀。系统会默认生成名称,支持修改。节点名称以小写字母开头,支持小写字母、数字和中划线(),不能以中划线()结尾。 登录方式 密码 用户名默认为“root”,请输入登录节点的密码,并确认密码。登录节点时需要使用该密码,请妥善管理密码,系统无法获取您设置的密码内容。 密钥对 选择用于登录本节点的密钥对,支持选择共享密钥。密钥对用于远程登录节点时的身份认证。若没有密钥对,可单击选项框右侧的“创建密钥对”来新建。
        来自:
        帮助文档
        云容器引擎
        用户指南
        节点管理
        创建节点
      • 修改admin密码
        本章节主要介绍修改admin密码。 该任务指导用户定期修改集群用户“admin”的密码,以提升系统运维安全性。 修改该密码会导致已经下载的用户凭证不可用,请修改该密码后重新下载认证凭据并替换旧凭据。 在集群节点修改admin密码 更新主管理节点客户端,具体请参看更新客户端(3.x之前版本)。 1. 登录主管理节点。 2. (可选)若想要使用omm用户修改密码,请执行以下命令切换用户。 sudo su omm 3. 执行以下命令切换到客户端目录,例如“/opt/client”。 cd /opt/client 4. 执行以下命令配置环境变量。 source bigdataenv 5. 执行以下命令,修改“admin”密码。此操作在整个集群中生效。 kpasswd admin 先输入旧密码,再输入两次新密码。 集群中,默认的密码复杂度要求: 密码字符长度至少8位。 至少需要包含大写字母、小写字母、数字、空格、特殊字符'~!@ $%^&()+[{}];:'", /?中的3种类型字符。 不能与用户名或倒序的用户名相同。 在MRS Manager页面修改admin密码 开启Kerberos认证的集群和开启弹性公网IP功能未开启Kerberos认证的集群支持通过MRS Manager界面修改admin密码。 用admin帐户登录MRS Manager页面。 1. 单击页面右上角用户名,选择“修改密码”。 2. 在修改密码页面,输入“旧密码”、“新密码”、“确认新密码”。 说明 默认的密码复杂度要求: 密码字符长度为8~32位。 至少需要包含大写字母、小写字母、数字、空格、特殊字符'~!@
        来自:
        帮助文档
        翼MapReduce
        用户指南
        MRS Manager操作指导(适用于2.x及之前)
        安全管理
        修改admin密码
      • 变更评估
        本章介绍分片变更前如何进行评估。 说明 分片变更前,可根据以下几点对分片变更做一个初步的评估,根据评估结果选择适当的新分片数, DRDS实例规格和DN实例规格, 以及DN节点个数。 数据量:可用show db status命令来获得目前现网的数据量。 DRDS规格:当前DRDS实例的CPU个数、内存大小、DRDS节点数。 DN规格:当前DN节点的vCPU个数和内存大小以及DN节点数。 业务情况:目前业务规模以及对日后增长趋势的预估。 客户案例 某客户当前有DRDS实例共4个节点,规格均为8U16GB,关联了6个数据节点(DN实例),数据量约12TB,1000亿条数据,7.3w张物理分表,业务量较大。 由于分片数变化就一定会引起数据重分布,需要迁移逻辑库的全部数据,而且每一条都需要经过重新路由,计算速度上会明显慢于分片数不变的变更。综合考虑客户业务,建议客户先将DRDS实例规格升为32U64GB(DRDS支持弹性扩缩容, 可以在变更结束后还原为之前的规格),再增加数据节点至12个并升级DRDS引擎内核版本到最新版本。由于分片数没有发生变化,仅需要将一半的物理分片从原DN移动到新的DN节点上,且不涉及路由重计算。除非是单个物理表存放的数据量达到上限, 一般建议使用分片数不变, 增加数据节点的平移变更方式。
        来自:
        帮助文档
        分布式关系型数据库
        用户指南
        分片变更
        变更评估
      • 大模型学习机服务启停最佳实践
        本文将为您介绍如何使大模型学习机服务启停 前提条件 学习机内通过docker容器的方式部署了textgenerationwebui与stablediffusionwebui两套框架的运行环境. 可以通过以下命令进行查看: docker ps a 网页服务的进程在容器内启动, 框架代码与模型放置在本机的/root目录下, 通过挂载的方式传入到容器中。 您无需进入容器执行操作, 只需要直接操作/root/textgenerationwebui和/root/stablediffusionwebui下的文件即可将改动同步到容器内部。 停止服务 直接停止 Docker 容器,即可停止对应的服务, 可选择执行以下命令: docker stop llama docker stop stablediffusion 重启服务 通过执行预置的重启脚本启动容器与服务, 可选择执行以下命令: sh /root/restartllamawebui.sh sh /root/restartsdwebui.sh 也可以只重启容器, 不启动服务, 随后手动进入容器启动服务。 此方式可以用来查看框架的具体执行日志, 以便于追查问题等。 sh /root/dockerrunllama.sh sh /root/dockerrunsd.sh 随后手动进入容器, 启动服务, 以llama为例: docker exec it llama bash cd /root/textgenerationwebui sh run.sh 此时会在命令行界面打印日志. 如果关闭命令行界面或者通过ctrl + c终止命令, 则会关闭服务。
        来自:
        帮助文档
        弹性云主机 ECS
        最佳实践
        大模型学习机最佳实践
        大模型学习机服务启停最佳实践
      • 1
      • ...
      • 123
      • 124
      • 125
      • 126
      • 127
      • ...
      • 520
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      多活容灾服务

      GPU云主机

      镜像服务 IMS

      弹性高性能计算 E-HPC

      AI Store

      一站式智算服务平台

      智算一体机

      人脸比对

      通用型OCR

      推荐文档

      购买License

      加入会议

      消费消息

      服务器迁移相关术语解释

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号