活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 聚力AI赋能 天翼云大模型专项 大模型特惠专区·Token Plan 轻享包低至9.9元起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 企业出海解决方案 NEW 助力您的业务扬帆出海,通达全球!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
Token服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V4-Flash
  • GLM-5.1
  • Qwen3.5-122B-A10B
  • DeepSeek-V3.2(旗舰版)
  • GLM-5(正式版)
智算一体机
  • 智算一体机
智能体引擎
  • 智能体引擎
智算安全专区
  • 大模型安全评测
  • 大模型安全护栏
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2026智能云生态大会
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      消息队列Kafka版_相关内容
      • 扩容集群(1)
        配置项 说明 节点来源 选择扩容节点的来源。可选项如下: 1. 新增节点:从控制台新购资源。 2. 已有节点:从已开通的资源里纳管至集群。 计费说明 选择扩容节点的付费类型。可选项如下: 1. 包年包月:按月计费,以自然月为计费单位。 2. 按量付费:一种后付费模式,即先使用再付费。 队列 1.选择扩容节点加入的队列。 2.可创建新的队列,并将节点扩容在新队列中。 计算节点规格 选择扩容节点的规格。 镜像 选择计算节点的镜像。 注:该镜像为弹性高性能计算平台定制镜像,请优先保持集群同一镜像。 计算节点磁盘 选择扩容节点规格所对应的磁盘。 子网 选择子网,建议同一个队列保持子网一致。 计算节点数量 选择需要扩容的计算节点数量。
        来自:
      • Capacity Scheduler模式下
        本章节主要介绍翼MapReduce的Capacity Scheduler模式下清除租户非关联队列操作。 操作场景 在Yarn Capacity Scheduler模式下,删除租户的时候,只是把租户队列的容量设置为0,并且把状态设为“STOPPED”,但是队列在Yarn的服务里面仍然残留。由于Yarn的机制,无法动态删除队列,管理员可以执行命令手动清除残留的队列。 对系统的影响 脚本运行过程中会重启controller服务,同步Yarn的配置,并重启主备ResourceManager实例。 重启controller服务时,无法登录和操作FusionInsight Manager。 重启主备ResourceManager实例后,Yarn组件以及依赖Yarn的组件会出现短暂的服务不可用告警。 前提条件 已删除某个租户,但该租户对应的队列依然存在。 操作步骤 1. 确定该租户对应的队列依然存在。 在FusionInsight Manager界面,选择“集群 > 待操作集群的名称 > 服务 > Yarn”。通过“ResourceManager(主)”链接进入ResourceManager WebUI界面。 单击左侧“Scheduler”界面,可以查看租户对应的队列依然存在,且状态为“STOPPED”,“Configured Capacity”值为0。 2. 以omm用户登录主管理节点。 3. 执行以下目录,执行“cleanQueuesAndRestartRM.sh”脚本。 cd ${BIGDATAHOME}/omserver/om/sbin ./cleanQueuesAndRestartRM.sh c 集群ID 说明 “集群ID”为需执行操作集群ID号,可在FusionInsight Manager的“集群 > 待操作集群的名称 > 集群属性”中查看。 在脚本运行过程中,需输入yes及管理员密码。 Running the script will restart Controller and restart ResourceManager. Are you sure you want to continue connecting (yes/no)?yes Please input admin password: Begin to backup queues ... ... 4. 脚本运行成功后,在FusionInsight Manager界面,选择“集群 > 待操作集群名称 > 服务 > Yarn”。通过“ResourceManager(主)”链接进入ResourceManager WebUI界面。 5. 单击左侧“Scheduler”界面,确认被删除租户的队列已经清除。
        来自:
      • 设置自定义告警规则
        本页介绍了天翼云关系数据库MySQL版告警规则的设置方法。 注意 仅II类型资源池支持该功能,具体支持情况以控制台页面展示为准。更多资源池信息,请参见功能概览。 操作场景 管理控制台支持设置告警规则,用户可自定义监控目标与通知策略,及时了解MySQL数据库服务运行状况,从而起到预警作用。 说明 针对部分告警(比如存储空间或者备份空间满)默认推送给对应的租户,如果租户下面有多个用户,则所有用户都会收到对应的告警信息。 如果某个用户不希望收到告警,则需要使用该用户的账号登录天翼云官网进入数据库管理平台 > 消息中心 > 消息订阅,在告警信息设置中取消该用户的邮件、短信、企业微信和钉钉等。 新建指标告警策略 1.在天翼云官网首页的顶部菜单栏,选择产品 > 数据库 > 关系型数据库 > 关系数据库MySQL版 ,进入关系数据库MySQL产品页面。然后单击管理控制台 ,进入概览页面。 2.在左侧导航栏,选择管理中心 > 告警中心 > 告警设置。 3.单击新建告警策略,设置告警规则,您也可以对已创建的策略进行编辑修改。 参数名 参数解释 策略名称 告警策略的名称,一个告警策略可以包含多个告警规则。 资源池 告警策略对应的资源池。 备注 告警策略的备注信息。 告警对象 可选择天翼云数据库组件,并选择对应的告警实例。 以MySQL为例,可在单击实例MySQL后,单击资源池旁的选择实例。 模板类型 支持手动创建告警规则,用户也可使用默认模板的告警规则。 阈值告警 支持选择实例内存使用率、磁盘使用率、CPU使用率、连接数和活跃连接数比例、全部会话、活跃会话、备份空间使用量、实例TPS、QPS等告警指标,备份空间使用率等,具体以实际页面展示为准。 状态告警 支持选择实例状态,即实例状态异常时将发出告警。 沉默周期 指告警发生后如果未恢复正常,间隔多久重复发送一次告警通知。 告警级别 支持选择紧急、告警、普通三种告警级别。 通知方式 支持选择邮箱、短信、企业微信、钉钉等多种方式,支持同时选择多种告警方式进行告警。填写后将以选定的通知方式进行告警通知。 告警联系人 目前可选择主账号和该主账号下的子账号,不可选择其他用户。选择后会将告警信息推送至用户绑定的邮箱和短信。 4.填写对应参数后,单击确认。
        来自:
        帮助文档
        关系数据库MySQL版
        用户指南
        监控与告警
        设置自定义告警规则
      • RabbitMqProducer监控
        指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,RabbitMqProducer调用的异常信息统计。) exceptionType 异常类型 异常类型 ENUM LAST 异常(exception,RabbitMqProducer调用的异常信息统计。) causeType 异常类 发生异常的类 ENUM LAST 异常(exception,RabbitMqProducer调用的异常信息统计。) count 次数 该异常的发生次数 INT SUM 异常(exception,RabbitMqProducer调用的异常信息统计。) message 异常消息 该异常产生的异常消息 STRING LAST 异常(exception,RabbitMqProducer调用的异常信息统计。) stackTrace 异常堆栈 该异常产生的堆栈信息 CLOB LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) connection connection producer连接信息 ENUM LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) exchange exchange exchange名 ENUM LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) concurrentMax 最大并发 推送消息最大并发 INT MAX exchange监控(exchangePublish,以exchange为维度统计消息推送详情) errorCount 错误次数 推送消息的错误次数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) invokeCount invokeCount Publish调用次数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) publishedMsgCount publishedMsgCount 推送消息数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) publishedBytes 推送字节数 推送字节数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) maxSingleMsgBytes 单次推送最大字节数 单次推送最大字节数 INT MAX exchange监控(exchangePublish,以exchange为维度统计消息推送详情) lastError 错误信息 推送消息发生错误产生的错误信息 STRING LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) maxTime 最大响应时间 推送消息的最大响应时间 INT MAX exchange监控(exchangePublish,以exchange为维度统计消息推送详情) runningCount 正在执行数 采集时间点正在执行的推送消息数量 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) totalTime 总响应时间 推送消息的总响应时间 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range1 010ms 响应时间在010ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range2 10100ms 响应时间在10100ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range3 100200ms 响应时间在100200ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range5 110s 响应时间在110s范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range6 10s以上 响应时间在10s以上请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) connection connection producer连接信息 ENUM LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) connectionCount 当前连接数 当前连接数 INT LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) channelCount 当前Channel数 当前Channel数 INT LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) connectionCreated 创建连接数 创建连接数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) connectionClosed 销毁连接数 销毁连接数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) channelCreated 创建Channel数 创建Channel数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) channelClosed 销毁Channel数 销毁Channel数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) concurrentMax 最大并发 推送消息最大并发 INT MAX connection监控(connectionPublish,以connection为维度统计消息推送详情。) errorCount 错误次数 推送消息的错误次数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) invokeCount invokeCount Publish调用次数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) publishedMsgCount publishedMsgCount 推送消息数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) publishedBytes 推送字节数 推送字节数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) maxSingleMsgBytes 单次推送最大字节数 单次推送最大字节数 INT MAX connection监控(connectionPublish,以connection为维度统计消息推送详情。) lastError 错误信息 推送消息发生错误产生的错误信息 STRING LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) maxTime 最大响应时间 推送消息的最大响应时间 INT MAX connection监控(connectionPublish,以connection为维度统计消息推送详情。) runningCount 正在执行数 采集时间点正在执行的推送消息数量 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) totalTime 总响应时间 推送消息的总响应时间 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range3 100200ms 响应时间在100200ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range5 110s 响应时间在110s范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) concurrentMax 最大并发 推送消息最大并发 INT MAX total监控(total,以客户端为维度统计消息推送详情。) errorCount 错误次数 推送消息的错误次数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST total监控(total,以客户端为维度统计消息推送详情。) invokeCount invokeCount Publish调用次数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) publishedMsgCount publishedMsgCount 推送消息数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) publishedBytes 推送字节数 推送字节数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) maxSingleMsgBytes 单次推送最大字节数 单次推送最大字节数 INT MAX total监控(total,以客户端为维度统计消息推送详情。) lastError 错误信息 推送消息发生错误产生的错误信息 STRING LAST total监控(total,以客户端为维度统计消息推送详情。) maxTime 最大响应时间 推送消息的最大响应时间 INT MAX total监控(total,以客户端为维度统计消息推送详情。) runningCount 正在执行数 采集时间点正在执行的推送消息数量 INT SUM total监控(total,以客户端为维度统计消息推送详情。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST total监控(total,以客户端为维度统计消息推送详情。) totalTime 总响应时间 推送消息的总响应时间 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range3 100200ms 响应时间在100200ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range5 110s 响应时间在110s范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        消息队列
        RabbitMqProducer监控
      • 购买实例
        本节介绍了分布式消息服务RabbitMQ产品实例如何购买。 实例介绍 RabbitMQ实例订购支持用户自定义规格和自定义特性,采用物理隔离的方式部署。租户独占RabbitMQ实例,可根据业务需要可定制相应规格的RabbitMQ实例。在新的资源池节点上,还支持选择主机类型和存储规格等丰富用户选项。 操作步骤 1. 登录管理控制台。 2. 进入RabbitMQ管理控制台。 3. 在管理控制台右上角单击“地域名称”,选择区域。此处请选择与您的应用服务相同的区域。 4. 点击“购买实例”跳转到购买页面,根据页面订购说明进行产品开通。 实例规格选择说明 节点可选择3节点、5节点、7节点、9节点,实例规格可选择4C8G、8C16G、16C32G。 存储类型可选择普通IO(SATA)、高IO(SAS)、超高IO(SSD)。 (1)填写实例名称,长度在 4 到 64个字符,必须以字母开头,不区分大小写,可以包含字母、数字、中划线或下划线,不能包含其他特殊字符。 (2)选择引擎类型,默认选择云原生引擎,海量消息堆积能力,支持更多连接和队列数,稳定性高。也可选择rabbitmq引擎,完全支持开源RabbitMQ生态,功能完备。 (3)选择计费模式:包年包月/按需计费,两种模式说明参见计费模式。 (4)购买时长按照计费模式选择变化: 计费模式为包年包月,可选择购买时长16个月、13年。该模式提供自动续期功能,勾选后可以自动续期购买时长:16个月、13年。 计费模式为按需计费,则该选项隐藏无需选择。 (5)部署方式有单可用区和多可用区两个选项,目前仅支持单可用区和3可用区部署,单可用区部署请选中任意一个AZ;多可用区部署请选中3个AZ,系统会自动将Broker节点平均分配至各可用区。 (6)设置节点数,可选择3/5/7/9。RabbitMQ 的节点数是指 RabbitMQ 集群中的节点数量。在 RabbitMQ 集群中,可以有多个节点组成一个集群,每个节点都是一个独立的 RabbitMQ 服务器实例。 (7)下拉选择主机类型,可选择通用型和计算增强型。通用型云主机共享宿主机的CPU资源,主要提供基本水平的vCPU性能、平衡的计算、内存和网络资源,具有较高性价比,支持通用的业务运行。计算增强型云主机独享宿主机的CPU资源,实例间无CPU争抢,并且没有进行资源超配,同时搭载全新网络加速引擎,实现接近物理服务器的强劲稳定性能。 (8)选择实例规格,分布式消息服务RabbitMQ提供通用型和计算增强型各3类规格,各规格详细说明参见弹性云主机规格。 (9)选择存储空间,包括磁盘类型和空间。 磁盘类型提供高IO/超高IO三类。普通IO适用于大容量、读写速率中等、事务性处理较少的应用场景。高IO:适用于主流的高性能、高可靠应用场景。超高IO:适用于超高IOPS、超大带宽需求的读写密集型应用场景。了解更多磁盘类型说明参见云硬盘规格。 磁盘空间以100G起步,可以以100倍数增加磁盘空间。 (10)选择已有虚拟私有云,若无虚拟私有云,点击创建跳转到虚拟私有云页面新增,了解更多内容参见虚拟私有云。 (11)选择已有子网,若无子网,点击创建跳转到子网页面新增。 (12)选择已有安全组,若无安全组,点击创建跳转到安全组页面新增。
        来自:
        帮助文档
        分布式消息服务RabbitMQ
        快速入门
        购买实例
      • 组件依赖关系表
        组件名称 集群部署的依赖组件 Doris / Elasticsearch / HBase HDFS、ZooKeeper、Kerberos、OpenLDAP HDFS ZooKeeper、Kerberos、OpenLDAP Hive HDFS、YARN、ZooKeeper、Kerberos、OpenLDAP Kafka ZooKeeper、Kerberos、OpenLDAP Kerberos OpenLDAP Kibana Elasticsearch Kyuubi Spark、Hive、HDFS、YARN、ZooKeeper、OpenLDAP、Kerberos OpenLDAP / Ranger HDFS、OpenLDAP、Kerberos、ZooKeeper Spark HDFS、YARN、Hive、ZooKeeper、OpenLDAP、Kerberos Trino Kerberos、OpenLDAP YARN ZooKeeper、Kerberos、HDFS、OpenLDAP ZooKeeper Kerberos、OpenLDAP Flink HDFS、YARN、Kerberos、OpenLDAP、ZooKeeper Hudi Hive/Spark/Flink Iceberg Hive/Spark/Flink Knox Kerberos、OpenLDAP Logstash / JeekeFS Kerberos、OpenLDAP Tez HDFS、YARN、Hive、ZooKeeper、OpenLDAP、Kerberos Flume / KafkaUI Kafka、OpenLDAP、Kerberos、ZooKeeper SeaTunnel Flink、HDFS、YARN、OpenLDAP、Kerberos、ZooKeeper Pushgateway / TezUI OpenLDAP、Kerberos、Hive、ZooKeeper、Tez、HDFS、YARN Amoro Kerberos、OpenLDAP、ZooKeeper、HDFS、YARN Hue Kerberos、OpenLDAP DolphinScheduler HDFS、OpenLDAP、Kerberos、ZooKeeper Sqoop HDFS、YARN Lance / Paimon Hive/Spark/Flink
        来自:
        帮助文档
        翼MapReduce
        快速入门
        组件依赖关系表
      • 创建集群
        接口功能介绍 创建集群(包周期,即包年/包月)。 接口约束 参数校验必须通过。 注意事项:  1.云搜索和数据分析类型集群不支持task节点组  2.云搜索类型集群的core类型节点组机器数量为115,且可以没有core节点组  3.非云搜索类型的集群,都需要存在master和core1节点组,且core1节点组机器数量为315  4.自定义类型集群需参考组件依赖关系 components组件信息如下:  datalake数据湖   必选组件:OpenLDAP(2.4.50)、Kerberos(1.18.2)、ZooKeeper(3.7.1)、HDFS(3.3.3)、YARN(3.3.3)、Hive(3.1.2)、Tez(0.10.1)、TezUI(0.10.1)、Spark(3.4.1)、Hudi(0.14.0)、Iceberg(1.4.3)   可选组件:HBase(2.4.12)、Trino(440)、Kyuubi(1.8.2)、Doris(2.1.6)、Ranger(2.2.0)、Kafka(2.8.1)、KafkaUI(1.0.0)、Knox(1.6.1)、Flink(1.16.2)、JeekeFS(1.1.1)、Flume(1.11.0)、SeaTunnel(2.3.7)、Pushgateway(1.6.2)  dataanalysis数据分析   必选组件:Doris(2.1.6)  dataservice数据服务   必选组件:OpenLDAP(2.4.50)、Kerberos(1.18.2)、ZooKeeper(3.7.1)、HDFS(3.3.3)、YARN(3.3.3)、HBase(2.4.12)   可选组件:Ranger(2.2.0)、Knox(1.6.1)、JeekeFS(1.1.1)  cloudsearch云搜索   必选组件:Elasticsearch(7.10.2)、Kibana(7.10.2)   可选组件:Logstash(7.10.2)  realtimedataprocessing实时数据流   必选组件:HDFS(3.3.3)、YARN(3.3.3)、Flink(1.16.2)、ZooKeeper(3.7.1)、Kerberos(1.18.2)、OpenLDAP(2.4.50)、Hudi(0.14.0)、Iceberg(1.4.3)、SeaTunnel(2.3.7)   可选组件:Kafka(2.8.1)、KafkaUI(1.0.0)、Knox(1.6.1)、JeekeFS(1.1.1)、Pushgateway(1.6.2)  customize自定义   可选组件:OpenLDAP(2.4.50)、Kerberos(1.18.2)、ZooKeeper(3.7.1)、HDFS(3.3.3)、YARN(3.3.3)、Hive(3.1.2)、Spark(3.4.1)、Hudi(0.14.0)、Iceberg(1.4.3)、HBase(2.4.12)、Trino(440)、Kyuubi(1.8.2)、Doris(2.1.6)、Ranger(2.2.0)、Kafka(2.8.1)、KafkaUI(1.0.0)、Knox(1.6.1)、Flink(1.16.2)、JeekeFS(1.1.1)、Flume(1.11.0)、Tez(0.10.1)、TezUI(0.10.1)、SeaTunnel(2.3.7)、Pushgateway(1.6.2) 自定义集群组件依赖关系如下:  Flink    依赖(全部)HDFS、Hudi、Iceberg、Kerberos、OpenLDAP、SeaTunnel、YARN、ZooKeeper  HBase   依赖(全部)HDFS、Kerberos、OpenLDAP、ZooKeeper  HDFS    依赖(全部)Kerberos、OpenLDAP、ZooKeeper  Hive    依赖(全部)HDFS、Hudi、Iceberg、Kerberos、OpenLDAP、Tez、YARN、ZooKeeper  Hudi    依赖(任意)Flink、Hive、Spark  Iceberg   依赖(任意)Flink、Hive、Spark  JeekeFS   依赖(全部)Kerberos  Kafka    依赖(全部)Kerberos、ZooKeeper  KafkaUI   依赖(全部)Kafka、Kerberos、OpenLDAP  Kerberos  依赖(全部)OpenLDAP  Knox    依赖(全部)Kerberos、OpenLDAP  Kyuubi   依赖(全部)HDFS、Hive、Kerberos、OpenLDAP、Spark、YARN、ZooKeeper  Ranger   依赖(全部)HDFS、Kerberos、OpenLDAP、ZooKeeper  Spark    依赖(全部)HDFS、Hive、Hudi、Iceberg、Kerberos、OpenLDAP、YARN、ZooKeeper  TezUI    依赖(全部)Tez、YARN  Trino    依赖(全部)Kerberos、OpenLDAP  YARN    依赖(全部)HDFS、Kerberos、OpenLDAP、ZooKeeper  ZooKeeper 依赖(全部)Kerberos、OpenLDAP
        来自:
        帮助文档
        翼MapReduce
        API参考
        API
        2023-11-02
        创建集群
      • 购买
        本章节主要介绍数据湖探索(DLI)的购买流程。 1.注册天翼云官网账号,登录后进入官网首页; 2.在官网首页,单击左上角“产品”,【大数据>数据湖探索】; 3.在【数据湖探索】界面,单击【立即开通】; 4.在数据湖探索队列购买页面选择CPU架构、队列规格并填写相关配置信息,勾选服务协议,单击【立即购买】; 5.按页面提示,单击【提交】即完成队列创建。队列创建完成后,您可在产品控制台“队列管理”页面看到您创建的队列。
        来自:
        帮助文档
        数据湖探索
        计费说明
        购买
      • 开发SQL脚本
        属性 说明 数据连接 选择数据连接。 数据库 选择数据库。 资源队列 选择执行DLI作业的资源队列。当脚本为DLI SQL时,配置该参数。如需新建资源队列,请参考以下方法: 单击 ,进入DLI的“队列管理”页面新建资源队列。 前往DLI管理控制台进行新建。 说明 DLI提供默认资源队列“default”,该资源队列不支持insert、load、cat命令。 如需以“key/value”的形式设置提交SQL作业的属性,请单击 。最多可设置10个属性,属性说明如下: dli.sql.autoBroadcastJoinThreshold(自动使用BroadcastJoin的数据量阈值) dli.sql.shuffle.partitions(指定Shuffle过程中Partition的个数) dli.sql.cbo.enabled(是否打开CBO优化策略) dli.sql.cbo.joinReorder.enabled(开启CBO优化时,是否允许重新调整join的顺序) dli.sql.multiLevelDir.enabled(OBS表的指定目录或OBS表分区表的分区目录下有子目录时,是否查询子目录的内容;默认不查询) dli.sql.dynamicPartitionOverwrite.enabled(在动态分区模式时,只会重写查询中的数据涉及的分区,未涉及的分区不删除)
        来自:
        帮助文档
        数据治理中心 DataArts Studio
        用户指南
        数据开发
        脚本开发
        开发脚本
        开发SQL脚本
      • 使用云主机打造 Moltbot 飞书私人助理
        步骤3:在云服务器上为Moltbot服务配置飞书插件 Moltbot 默认不内置飞书 Channel,需要额外安装插件。这里使用开源插件:++ %E4%B8%AD%E6%96%87++。安装流程如下: 1. 在云服务器内运行插件安装命令: plaintext clawdbot plugins install @m1hengclawd/feishu 2. 安装完成后,将飞书机器人的配置参数写入Moltbot的配置文件。 plaintext clawdbot config set channels.feishu.appId "[飞书的APP ID]" clawdbot config set channels.feishu.appSecret "[飞书的APP Secret]" clawdbot config set channels.feishu.enabled true 以上参数所在位置: 3. 配置完成后,重新启动Moltbot的Gateway服务。 plaintext clawdbot gateway restart 注意 若云主机使用的是【Moltbotv2026.1.243CtyunOS25.07】镜像,则重启Gateway服务时,需替换为以下命令执行: plaintext nohup clawdbot gateway & 4. 添加事件订阅 注意 事件订阅必须在Moltbot添加飞书配置并启动后,才可以创建,否则无法创建成功。 选择订阅方式为长连接 添加事件,具体添加项见下表: 事件 说明 im.message.receivev1 接收消息(必需) im.message.messagereadv1 消息已读回执 im.chat.member.bot.addedv1 机器人进群 im.chat.member.bot.deletedv1 机器人被移出群 配置完成后,进行发版 5. 飞书机器人已创建成功,现在可以在飞书中和机器人对话,校验Moltbot功能是否正常。
        来自:
      • 计费模式
        本节主要介绍分布式缓存服务Redis版的计费模式 目前天翼云分布式缓存服务Redis版提供包周期(包年/包月)、按需2种计费模式供您灵活选择,使用越久越便宜。 包周期(包年/包月):天翼云提供包月和包年的购买模式。这种购买方式相对于按需付费则能够提供更大的折扣,对于长期使用者,推荐该方式。包周期计费按照订单的购买周期来进行结算。 按需计费:这种购买方式比较灵活,可以即开即停,支持秒级计费。实例从“开通”开启计费到“删除”结束计费,按实际购买时长(精确到秒)计费。 下表列出两种模式的区别: 计费模式 包年/包月 按需计费 付费方式 预付费按照订单的购买周期结算。 后付费按照云服务器实际使用时长计费。 计费周期 按订单的购买周期计费。 按小时结算。 实例升级 支持扩容,工单施工完生效,但是施工过程中服务不可用;不支持缩容。 支持扩容,工单施工完生效,但是施工过程中服务不可用;不支持缩容。 更改计费模式 支持变更为按需资源。 支持变更为包周期资源。 变更规格 支持变更实例规格。 支持变更实例规格。 适用场景 适用于可预估资源使用周期的场景,价格比按需计费模式更优惠。对于长期使用者,推荐该方式。 适用于消息资源需求波动的场景,可以随时开通,随时删除。 包周期与按需计费方式之间可以进行转换,具体操作请参考包周期与按需互转。
        来自:
        帮助文档
        分布式缓存服务Redis版
        计费说明
        计费模式
      • 管理消息与新建系统公告
        此小节介绍云堡垒机管理消息与新建系统公告。 消息中心是系统内各类消息接收提示管理中心。系统公告是对系统用户广播系统内重大变更的消息提醒。 管理消息列表 消息中心小窗可呈现最新三条未读消息。任务执行完成后,则可在任务中心查看全部任务。 消息类型共有5种,分别包括系统消息、业务消息、任务消息、命令告警、工单消息。 消息级别共有3种,分别包括“高”、“中”、“低”,消息级别越高代表消息重要程度越高。 本小节主要介绍如何在消息中心查看、删除、标记消息。 查看消息提醒 1. 登录云堡垒机系统。 2. 单击右上角,展开消息中心小窗口, 可查看最新三条未读消息。 3. 单击“查看更多”,进入消息中心列表页面。 4. 查询消息,在搜索框中输入关键字,根据消息标题内容快速查询消息。 5. 查看消息列表。消息按发生时间顺序倒序排列,可查看全部已读、未读的消息 。 6. 查看消息详情。单击目标消息名称,进入消息详情页面。 删除消息提醒 1. 登录云堡垒机系统。 2. 单击右上角,展开消息中心小窗口,可查看最新三条未读消息。 3. 单击“查看更多”,进入消息中心列表页面。 4. 勾选一条或多条消息,单击左下角“删除”,弹出删除消息确认窗口。 5. 单击“确定”,即可立即删除选中消息。消息删除后不可找回,请谨慎操作。
        来自:
        帮助文档
        运维安全中心(云堡垒机)
        用户指南
        系统桌面
        管理消息与新建系统公告
      • 开源组件端口列表
        配置参数 默认端口 端口说明 kafkamanagerport 9099 KafkaManager的WEB UI端口。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        访问MRS集群上托管的开源组件Web页面
        开源组件端口列表
      • ACL策略管理(1)
        ACL 策略指为用户自定义的一组权限规则,允许/拒绝用户通过 IP 或网段 生产/消费 Topic 资源。当前提供有2种匹配方式: 1)预设策略:新建策略时不关联到Topic,新建或编辑Topic时可关联到该ACL策略。 2)前缀模糊匹配策略:前缀模糊匹配策略提供了一种高效的批量授权方式,特别适用于对具有相同前缀的多个Topic进行统一授权管理。当生产环境中存在遵循统一命名规范的Topic时(例如:项目相关Topic都以"project"开头,包括project1、projectb等),可以通过前缀模糊匹配策略快速完成授权配置。一次配置即可覆盖所有匹配前缀的Topic,包括后续新增的Topic。 创建ACL策略 (1)登录管理控制台,进入Kafka管理控制台。 (2)在实例列表页操作列,目标实例行单击“管理”>“用户管理”>“创建用户”。 (3)创建用户,输入用户密码后点击确认,完成用户的创建。如果已经创建了则可以跳过此步骤。 (4)单击”ACL策略管理”>“创建策略”进入配置 ACL 策略页面。 (5)选择其中一种匹配方式(预设策略或前缀模糊匹配)。 (6)如选择前缀模糊匹配策略,则输入Topic前缀字符串,将匹配所有以输入内容为前缀的Topic。 "匹配Topic"里展示的是当前已经匹配到的Topic,后面新建的Topic也能自动匹配上。 (7)输入规则名称,单击“添加规则”绑定策略对应的规则。 规则参数说明: 参数 说明 权限 ACL 策略的操作权限分为两类:允许和拒绝。 若只设置允许规则,则除允许的规则外的其他IP或网段都无法连接实例。 若只设置拒绝规则,则除拒绝的规则外的其他IP或网段需要设置了允许规则后才可以连接实例。 若同时设置允许规则和拒绝规则,则只有允许规则中的IP或网段可以连接实例,其他IP或网段都无法连接实例。 用户 选择需要设置权限的用户。 IP或网段 填写需要设置权限的 IP 或网段,用 ; 隔开,若 IP 为空,则默认为全部 IP 添加权限。 操作 选择策略生效的动作,即向 Topic 生产或消费消息。 自动应用后续所有新增topic 开启后,后续页面上创建的Topic会自动关联此规则,多个策略只允许一条策略开启。 (8)单击“确定”,完成 ACL 策略创建。
        来自:
      • SQL作业管理
        参数名称 描述 数据格式 导出查询结果数据的文件格式。支持json和csv格式。 队列 选择运行的队列。SQL作业只能在队列类型为“SQL队列”下执行。具体队列创建可以参考6.3 创建队列。 压缩格式 导出查询结果数据的压缩方式,选择如下压缩方式。 l none l bzip2 l deflate l gzip 存储路径 输入或选择OBS的路径。 说明 l 选择OBS桶后,请在文本框中定义文件夹名称,若该文件夹不存在,则会在OBS中创建。 l 文件夹名称不能包含下列特殊字符: / : ? " < > ,并且不能以“.”开头和结尾。 导出方式 导出查询结果数据的保存方式。 l 随导出创建指定路径:指定的导出目录必须不存在,如果指定目录已经存在,系统将返回错误信息,无法执行导出操作。 l 覆盖指定路径:在指定目录下新建文件,会删除已有文件。 结果条数 导出查询结果数据的数量。不填写数值或数值为“0”时,导出全部结果。 表头 设置导出查询结果数据是否含表头。
        来自:
        帮助文档
        数据湖探索
        用户指南
        作业管理
        SQL作业管理
      • 删除资源池
        本章节主要介绍删除资源池。 操作场景 该任务指导用户通过MRS Manager,删除已有资源池。 前提条件 集群中任何一个队列不能使用待删除资源池为默认资源池,删除资源池前需要先取消默认资源池,请参见配置队列。 集群中任何一个队列不能在待删除资源池中配置过资源分布策略,删除资源池前需要先清除策略,请参见清除队列配置。 操作步骤 在MRS Manager,单击“租户管理”。 1. 单击“资源池”页签。 2. 在资源池列表指定资源池所在行的“操作”列,单击“删除”。 在弹出窗口中单击“确定”。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        MRS Manager操作指导(适用于2.x及之前)
        租户管理
        删除资源池
      • vLLM GPU单机PD分离
        本节介绍如何创建 vLLM GPU单机PD分离任务。 前置条件 1. 确认智算套件已经安装并且全部运行中 2. 进入智算套件,AI应用管理,队列管理,确保队列存在并且有足够的资源(GPU,CPU,内存,rdma/rdmashareddevicea) [参考创建队列的文档] 操作步骤 创建任务 进入智算套件,AI应用列表,在线推理菜单,创建AI应用 基本信息 应用类型:vLLM 开启PD分离选择:静态PD分离 推理类型选择:单机 配置信息 推理框架,框架版本,推理模型,模型版本根据实际情况选择。 简单示例: 推理框架: nvidiavllm 框架版本:v0.11.2 推理模型:deepseekr1distillqwen1.5b 模型版本:v1 资源:CPU,内存,共享内存可以不填 选择 GPU:4,rdma/rdmashareddevicea:1 队列:选择存在且资源足够的的队列 Prefill
        来自:
        帮助文档
        智算套件
        用户指南
        推理应用
        创建推理应用
        vLLM GPU单机PD分离
      • 环境准备
        安全组 安全组可重复使用,您也可以根据实际情况使用不同的安全组,请根据实际需要进行配置。 创建安全组的操作指导,请参考虚拟私有云创建安全组。 若需要为安全组添加规则,请参考虚拟私有云安全组添加安全组规则。 弹性云主机 用户若需要自己客户应用接入RocketMQ发送、消费消息,需先购买弹性云主机并确保和RocketMQ实例在同一VPC下。创建操作说明请参见创建弹性云主机。 其他工具 下载安装工具Eclipse3.6.0以上版本或者IntelliJ ,JDK 1.8.111以上版本。 生产消费验证涉及的SDK如下: rocketmq引擎版本:推荐使用的社区版Java SDK版本为4.9.3,请访问Apache RocketMQ官网下载。 ctgmq引擎版本(已调整白名单特性):点击ctgmqSDK直接下载。
        来自:
        帮助文档
        分布式消息服务RocketMQ
        快速入门
        环境准备
      • 扩容集群
        配置项 说明 队列 1.选择扩容节点加入的队列。 2.可创建新的队列,并将节点扩容在新队列中。 节点来源 选择扩容节点的来源。可选项如下: 新增节点:从控制台新购资源。 已有节点:从已开通的资源里纳管至集群。 计费说明 选择扩容节点的付费类型。可选项如下: 包年包月:按月计费,以自然月为计费单位。 按量付费:一种后付费模式,即先使用再付费。 计算节点规格 选择扩容节点的规格。 镜像 选择计算节点的镜像。 注:该镜像为弹性高性能计算平台定制镜像,请优先保持集群同一镜像。 计算节点硬盘 选择扩容节点规格所对应的硬盘。 子网 选择子网,建议同一个队列保持子网一致。 计算节点数量 选择需要扩容的计算节点数量。
        来自:
        帮助文档
        弹性高性能计算 E-HPC
        高性能计算平台
        管理集群
        扩容集群
      • 创建vLLM GPU单机推理任务(1)
        本节介绍如何创建vLLM GPU 单机推理任务。 前置条件 1. 确认智算套件已经安装并且全部运行中 2. 进入智算套件,AI应用管理,队列管理,确保队列存在并且有足够的资源(GPU,CPU,内存) [参考创建队列的文档] 操作步骤 1. 进入智算套件,AI应用列表,在线推理菜单,创建AI应用 2. 创建应用 应用类型:vLLM 推理类型选择 单机 推理框架,框架版本,推理模型,模型版本根据实际情况选择。 简单的示例: 推理框架: nvidiavllm 框架版本:v0.11.2 推理模型:deepseekr1distillqwen1.5b 模型版本:v1 资源:CPU,内存,共享内存可以不填 选择 GPU:2 队列:选择存在且资源足够的的队列 点击确认完成创建。
        来自:
      • 消息模板
        编辑消息模板 1. 在消息模板列表中,单击消息模板名称行后的“修改”,根据[表1]进行修改,其中“模板名称”不可修改。 说明 内置消息模板不支持删除。 2. 编辑完成后,单击“确认”。 复制消息模板 1. 在消息模板列表中,单击消息模板名称行后的“复制”,须修改消息模板的模板名称。 2. 完成后,单击“确认”。 删除消息模板 删除消息模板 1. 在消息模板列表中,单击消息模板名称行后的“删除”。 说明 内置消息模板不支持删除。 2. 在弹出的对话框中,单击“确认”删除该消息模板。 批量删除消息模板 1. 在消息模板列表中,勾选待删除的消息模板,单击列表左上方“批量删除”。 2. 在弹出的删除消息模板页面,单击“确定”,删除所勾选的消息模板。
        来自:
        帮助文档
        云日志服务
        用户指南
        日志告警
        告警通知
        消息模板
      • ALM-18020 Yarn任务执行超时
        检查队列资源是否不足 5.在原生页面找到该任务,查看该任务的“Queue”中的队列名。单击原生页面左侧“Scheduler”,在“Applications Queues”页框中查找对应的队列名,并下拉展开队列的详细信息,如图所示: 6.查看队列详情中“Used Resources”是否近似等于“Max Resources”,即任务提交的队列中资源已经使用完毕,若队列资源不足,请在FusionInsight Manager的“租户资源 > 动态资源计划 > 资源分布策略”中调大队列的“最大资源”。重新运行任务后,查看是否不再上报告警。 是,处理完毕。 否,执行步骤7。 检查任务是否发生数据倾斜 7.在Yarn的原生页面,选择“任务 ID (如application15653379197230002) > Tracking URL:ApplicationMaster > job15653379197230002”,进入如下页面: 8.选择左侧“Job > Map tasks”或者“Job > Reduce tasks”,查看每个Map或者每个Reduce任务的执行时间是否相差很大,如果相差很大,说明任务数据发生了倾斜,需要对任务数据进行均衡。 9.按照如上原因进行处理后,重新执行任务,观察本告警是否还出现。 是,执行步骤10。 否,处理完毕。 收集故障信息 10.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 11.在“服务”中勾选待操作集群的“Yarn”。 12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 13.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-18020 Yarn任务执行超时
      • 通过消息幂等实现去重
        本节介绍如何处理消息去重。 方案概述 在RocketMQ的业务处理过程中,如果消息重发了多次,消费者端对该重复消息消费多次与消费一次的结果是相同的,多次消费并没有对业务产生负面影响,那么这个消息处理过程是幂等的。消息幂等保证了无论消息被重复投递多少次,最终的处理结果都是一致的,避免了因消息重复而对业务产生影响。 例如在支付场景下,用户购买商品后进行支付,由于网络不稳定导致用户收到多次扣款请求,导致重复扣款。但实际上扣款业务只应进行一次,商家也只应产生一条订单流水。这时候使用消息幂等就可以避免这个问题。 在实际应用中,导致消息重复的原因有网络闪断、客户端故障等,且可能发生在消息生产阶段,也可能发生在消息消费阶段。因此,可以将消息重复的场景分为以下两类: 生产者发送消息时发生消息重复: 生产者发送消息时,消息成功发送至服务端。如果此时发生网络闪断,导致生产者未收到服务端的响应,此时生产者会认为消息发送失败,因此尝试重新发送消息至服务端。当消息重新发送成功后,在服务端中就会存在两条内容相同的消息,最终消费者会消费到两条内容一样的重复消息。 消费者消费消息时发生消息重复: 消费者消费消息时,服务端将消息投递至消费者并完成业务处理。如果此时发生网络闪断,导致服务端未收到消费者的响应,此时服务端会认为消息投递失败。为了保证消息至少被消费一次,服务端会尝试投递之前已被处理过的消息,最终消费者会消费到两条内容一样的重复消息。
        来自:
        帮助文档
        分布式消息服务RocketMQ
        最佳实践
        通过消息幂等实现去重
      • 退服和入服务角色实例
        本章节主要介绍翼MapReduce服务退服和入服务角色实例。 操作场景 某个Core或Task节点出现问题时,可能导致整个集群状态显示为“异常”。MRS集群支持将数据存储在不同Core节点,用户可以在MRS Manager指定角色实例退服,使退服的角色实例不再提供服务。在排除故障后,可以将已退服的角色实例入服。 支持退服、入服的角色实例包括: HDFS的DataNode角色实例 Yarn的NodeManager角色实例 HBase的RegionServer角色实例 Kafka的Broker角色实例 限制: 当DataNode数量少于或等于HDFS的副本数时,不能执行退服操作。例如HDFS副本数为3时,则系统中少于4个DataNode,将无法执行退服,Manager在执行退服操作时会等待30分钟后报错并退出执行。 Kafka Broker数量少于或等于副本数时,不能执行退服。例如Kafka副本数为2时,则系统中少于3个节点,将无法执行退服,Manager执行退服操作时会失败并退出执行。 已经退服的角色实例,必须执行入服操作启动该实例,才能重新使用。 操作步骤 在MRS Manager,单击“服务管理”。 1.单击服务列表中相应服务。 2.单击“实例”页签。 3.勾选指定角色实例名称前的复选框。 4.选择“更多 > 退服”或“入服”执行相应的操作。 说明 实例退服操作未完成时在其他浏览器窗口重启集群中相应服务,可能导致MRS Manager提示停止退服,实例的“操作状态”显示为“已启动”。实际上后台已将该实例退服,请重新执行退服操作同步状态。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        MRS Manager操作指导(适用于2.x及之前)
        对象管理
        退服和入服务角色实例
      • 监控指标说明
        生产者指标 指标名称 指标说明 单位 生产TPS 统计Topic的消息生产速率,计算方式:1分钟内的最大值 条/秒 生产消息量峰值 统计消息生产速率的最大值 条/秒 累计生产消息量 统计所选时间段内所选topic累计生产的消息总量 条 消费者指标 指标名称 指标说明 单位 处理中消息量 计算选定的Topic和消费组当前消费者客户端正在消费但是还没有返回消费成功响应到服务端的消息数。 条 已就绪消息量 计算选定的Topic和消费组当前在服务端已经就绪可以被消费消费的消息总量,这部分消息消费者客户端还没有开始消费。 条 堆积消息量 计算选定Topic和消费组当前消息堆积总量,包括处理中消息和已就绪消息。 条 已就绪消息排队时间 计算选定的Topic和消费组最早一条就绪消息的就绪时间和当前时间差,数值面板展示取选定时间段内统计的最大值展示,曲线面板展示选定时间范围的序列值,当该订阅组没有在线时,该值不显示。该指标可以观测还未被处理的消息的延迟时间大小,适用于对消息延时时间比较敏感的业务场景。 毫秒,但随着数值增大会自适应变换单位 消息消费速率 计算选定Topic和消费组消费消息的速率。 条/秒 消费者速率峰值 计算所选定Topic和消费组的消息消费速率的最大值。 条/秒 消费堆积量 包含上面的堆积消息量,处理中消息量,已就绪消息量,以曲线的形式展示。 条 消息消费处理耗时 计算所选Topic和消费组消费时,从消息开始被消费到消费完成的处理耗时。 毫秒 消息生产速率 top20 Topics 展示消息生产速率最高的前20个Topic生产速率曲线。 条/秒 消息消费速率 top20 Groups 展示消息消费速率最高的前20个消费组消费速率曲线。 条/秒 已就绪消息量 top20 Groups 计算已就绪消息量最大的前20个消费组。 条 已就绪消息排队时间 top20 Groups 计算已就绪消息量最大的前20个Group。 条 堆积消息量(包含已就绪消息以及处理中消息)top20 Group 统计堆积的消息量最多的前20个Group。 条 处理中消息量 top20 Groups 计算处理中的消息量最多的前20个Group。 条 消费处理耗时 top20 Groups 计算消费处理耗时最长的前20个Group。 毫秒
        来自:
        帮助文档
        分布式消息服务RocketMQ
        用户指南
        监控与告警
        监控指标说明
      • 租户简介
        资源池 YARN任务队列支持一种调度策略,称为标签调度(Label Based Scheduling)。通过此策略,YARN任务队列可以关联带有特定节点标签(Node Label)的NodeManager,使YARN任务在指定的节点运行,实现任务的调度与使用特定硬件资源的需求。例如,需要使用大量内存的YARN任务,可以通过标签关联具有大量内存的节点上运行,避免性能不足影响业务。 在MRS集群中,租户从逻辑上对YARN集群的节点进行分区,使多个NodeManager形成一个资源池。YARN任务队列通过配置队列容量策略,与指定的资源池进行关联,可以更有效地使用资源池中的资源,且互不影响。 MRS Manager中最多支持50个资源池。系统默认包含一个“Default”资源池。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        MRS Manager操作指导(适用于2.x及之前)
        租户管理
        租户简介
      • 删除资源池
        本章节主要介绍翼MapReduce的删除资源池操作。 操作场景 根据业务需要,资源池不再使用时,管理员可以通过FusionInsight Manager进行删除资源池。 前提条件 集群中任何一个队列不能使用待删除资源池为默认资源池,删除资源池前需要先取消默认资源池,请参见配置队列。 集群中任何一个队列不能在待删除资源池中配置过资源分布策略,删除资源池前需要先清除策略,请参见清除队列容量配置。 操作步骤 1. 登录FusionInsight Manager。 2. 选择“租户资源 > 资源池”。 3. 在资源池列表指定资源池所在行的“操作”列,单击“删除”。 4. 在弹出窗口中单击“确定”。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        租户资源
        使用Superior调度器的租户业务
        管理资源
        删除资源池
      • 站内消息
        本文主要介绍了站内消息的设置方法和消息类型。 用户可以接收、查看、管理天翼云发送的各类消息通知。 操作步骤 1、登录消息中心。 2、在站内消息菜单,可以进行以下操作: 查看全部、未读、已读消息。 按消息类别/消息类型,筛选查看某类消息。 将未读消息标记为已读。 删除消息。 消息类型 消息类型 消息介绍 产品信息 产品的创建、开通及资源到期提醒等产品相关信息通知 账户资金 充值、订单支付、提现等资金相关信息通知 活动消息 各类线上活动通知 服务消息 新产品上线或商业化通知 重要通知 网站重要公告、通知、声明等信息通知 其他 非以上消息类型通知
        来自:
        帮助文档
        账号中心
        消息中心
        站内消息
      • 创建vLLM NPU单机PD分离任务(1)
        本节介绍如何 创建vLLM NPU单机PD分离任务。 前置条件 1. 确认智算套件已经安装并且全部运行中 2. 进入智算套件,AI应用管理,队列管理,确保队列存在并且有足够的资源(NPU,CPU,内存) [参考创建队列的文档] 操作步骤 创建任务 进入智算套件,AI应用列表,在线推理菜单,创建AI应用 基本信息 应用类型:vLLM 开启PD分离选择 静态PD分离 推理类型选择 单机 配置信息 推理框架,框架版本,推理模型,模型版本根据实际情况选择。 简单的示例: 推理框架: ascendvllm 框架版本:v0.11.0rc2 推理模型:deepseekr1distillqwen1.5b 模型版本:v1 队列:选择存在且资源足够的的队列 Prefill CPU,内存,共享内存不填,NPU填:4 Decode DecodeMaster 的资源菜单:CPU,内存,共享内存不填,NPU填:4 点击确认完成创建。
        来自:
      • ALM-19018 HBase合并队列超出阈值
        本章节主要介绍ALM19018 HBase合并队列超出阈值的告警。 告警解释 系统每300秒周期性检测HBase服务的compaction队列长度,当检测到HBase服务的compaction队列长度超过告警的阈值(默认100)时产生该告警。当compaction队列长度小于告警的阈值时,告警恢复。 说明 说明 若集群启用了多实例功能且安装了多个HBase服务,请根据“定位信息”的“服务名”值来确定具体产生告警的HBase服务。例如“定位信息”中显示服务名HBase1,处理步骤中的操作对象也应由HBase调整为HBase1。 告警属性 告警ID 告警级别 是否自动清除 19018 次要 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 产生该告警表示HBase服务的compaction队列长度已经超过规定的阈值,如果不及时处理,可能会导致集群性能下降,影响数据读写。 可能原因 HBase RegionServer数太少。 HBase 单个RegionServer上Region数过多。 HBase RegionServer堆大小较小。 资源不足。 相关参数配置不合理。 处理步骤 检查相关配置是否合理 1.在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,查看是否存在告警ID为“19011”的告警。 是,单击对应告警右侧的“查看帮助”并按照帮助文档进行处理,执行步骤3。 否,执行步骤2。 2.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > HBase > 配置 > 全部配置,搜索“hbase.hstore.compaction.min”,“hbase.hstore.compaction.max”,“hbase.hstore.compactionThreshold”,“hbase.regionserver.thread.compaction.small”和“hbase.regionserver.thread.compaction.throttle”,适当调大其值。 3.观察界面告警是否清除。 是,处理完毕。 否,执行步骤4。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-19018 HBase合并队列超出阈值
      • 消费端挂载NFS是否会影响消费速度?
        本节介绍消费端挂载NFS是否会影响消费速度 消费端在消费消息的主线程里同步将拉取的消息存储在NFS,导致消费端处理消息的速度变慢,阻塞消息处理。 可能原因 NFS本身速度就不太理想。 NFS是网络共享存储,虽然有多机器共享访问的能力优势,但多台机器访问是争抢的,消费者个数增多,性能反而下降。 解决方案 建议将消费端拉取消息和存储消息分别放在两个独立且不同的线程里操作。拉取消息的线程只管消费消息,把消息转给缓存处理线程后就继续消费消息,这样可以保证消费速度的稳定。 也可以考虑采用云盘,给每台消费端处理机挂载自己的云盘,各自独立存储,这样消费端不会再因为争抢NFS而降低性能。如果需要把最终的处理结果集中到同一个NFS上保存,仍然可以通过一个异步的工具或者线程,把云盘上的结果再转发到NFS上,而不要让同步存储NFS阻塞消息处理。总之,对于资源访问造成的处理低效,总是可以用异步处理的方式解决。
        来自:
        帮助文档
        分布式消息服务Kafka
        常见问题
        操作类
        消费端挂载NFS是否会影响消费速度?
      • 新建表/文件迁移作业
        源端类型 说明 参数配置 OBS 支持以CSV、JSON或二进制格式抽取数据,其中二进制方式不解析文件内容,性能快,适合文件迁移。 参见 MRS HDFs FusionInsight HDFS Apache HDFS 支持以CSV、Parquet或二进制格式抽取HDFS数据,支持多种压缩格式。 参见 MRS HBase FusionInsight HBase Apache HBase CloudTable 支持从MRS、FusionInsight HD、开源Apache Hadoop的HBase,或CloudTable服务导出数据,用户需要知道HBase表的所有列族和字段名。 参见 MRS Hive FusionInsight Hive Apache Hive 支持从Hive导出数据,使用JDBC接口抽取数据。 Hive作为数据源,CDM自动使用Hive数据分片文件进行数据分区。 参见 DLI 支持从DLI导出数据。 参见 FTP SFTP 支持以CSV、JSON或二进制格式抽取FTP/SFTP的数据。 参见 HTTP 用于读取一个公网HTTP/HTTPS URL的文件,包括第三方对象存储的公共读取场景和网盘场景。 当前只支持从HTTP URL导出数据,不支持导入。 参见 数据仓库DWS 云数据库MySQL 云数据库SQL Server 云数据库PostgreSQL 支持从云端的数据库服务导出数据。 从这些数据源导出数据时,CDM使用JDBC接口抽取数据,源端作业参数相同,详细请 参见 FusionInsight LibrA 支持从FusionInsight LibrA导出数据。 从这些数据源导出数据时,CDM使用JDBC接口抽取数据,源端作业参数相同,详细请 参见 MySQL PostgreSQL Oracle Microsoft SQL Server SAP HANA MYCAT 分库 这些非云服务的数据库,既可以是用户在本地数据中心自建的数据库,也可以是用户在ECS上部署的,还可以是第三方云上的数据库服务。 从这些数据源导出数据时,CDM使用JDBC接口抽取数据,源端作业参数相同,详细请 参见 MongoDB 文档数据库服务(DDS) 支持从MongoDB或DDS导出数据。 参见 Redis 支持从开源Redis导出数据。 参见 Apache Kafka DMS Kafka MRS Kafka 仅支持导出数据到云搜索服务。 参见 。 云搜索服务 Elasticsearch 支持从云搜索服务或Elasticsearch导出数据。 参见
        来自:
        帮助文档
        数据治理中心 DataArts Studio
        用户指南
        数据集成
        管理作业
        新建表/文件迁移作业
      • 1
      • ...
      • 23
      • 24
      • 25
      • 26
      • 27
      • ...
      • 262
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      聚力AI赋能 天翼云大模型专项

      大模型特惠专区·Token Plan 轻享包低至9.9元起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      企业出海解决方案

      助力您的业务扬帆出海,通达全球!

      天翼云信创专区

      “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      训推服务

      公共算力服务

      Token服务

      应用托管

      科研助手

      一站式智算服务平台

      智算一体机

      推荐文档

      客户端下载安装

      玩转天翼云⑦:Linux扩展Swap分区的三种方法

      提现规则

      域名相关常见问题

      产品优势

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 息壤智算平台
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号