消息队列Kafka版_消息队列Kafka版文档介绍内容-天翼云

扩容集群(1)
配置项说明节点来源选择扩容节点的来源。可选项如下： 1. 新增节点：从控制台新购资源。 2. 已有节点：从已开通的资源里纳管至集群。计费说明选择扩容节点的付费类型。可选项如下： 1. 包年包月：按月计费，以自然月为计费单位。 2. 按量付费：一种后付费模式，即先使用再付费。队列 1.选择扩容节点加入的队列。 2.可创建新的队列，并将节点扩容在新队列中。计算节点规格选择扩容节点的规格。镜像选择计算节点的镜像。注：该镜像为弹性高性能计算平台定制镜像，请优先保持集群同一镜像。计算节点磁盘选择扩容节点规格所对应的磁盘。子网选择子网，建议同一个队列保持子网一致。计算节点数量选择需要扩容的计算节点数量。

来自：
Capacity Scheduler模式下
本章节主要介绍翼MapReduce的Capacity Scheduler模式下清除租户非关联队列操作。操作场景在Yarn Capacity Scheduler模式下，删除租户的时候，只是把租户队列的容量设置为0，并且把状态设为“STOPPED”，但是队列在Yarn的服务里面仍然残留。由于Yarn的机制，无法动态删除队列，管理员可以执行命令手动清除残留的队列。对系统的影响脚本运行过程中会重启controller服务，同步Yarn的配置，并重启主备ResourceManager实例。重启controller服务时，无法登录和操作FusionInsight Manager。重启主备ResourceManager实例后，Yarn组件以及依赖Yarn的组件会出现短暂的服务不可用告警。前提条件已删除某个租户，但该租户对应的队列依然存在。操作步骤 1. 确定该租户对应的队列依然存在。在FusionInsight Manager界面，选择“集群 > 待操作集群的名称 > 服务 > Yarn”。通过“ResourceManager(主)”链接进入ResourceManager WebUI界面。单击左侧“Scheduler”界面，可以查看租户对应的队列依然存在，且状态为“STOPPED”，“Configured Capacity”值为0。 2. 以omm用户登录主管理节点。 3. 执行以下目录，执行“cleanQueuesAndRestartRM.sh”脚本。 cd ${BIGDATAHOME}/omserver/om/sbin ./cleanQueuesAndRestartRM.sh c 集群ID 说明 “集群ID”为需执行操作集群ID号，可在FusionInsight Manager的“集群 > 待操作集群的名称 > 集群属性”中查看。在脚本运行过程中，需输入yes及管理员密码。 Running the script will restart Controller and restart ResourceManager. Are you sure you want to continue connecting (yes/no)?yes Please input admin password: Begin to backup queues ... ... 4. 脚本运行成功后，在FusionInsight Manager界面，选择“集群 > 待操作集群名称 > 服务 > Yarn”。通过“ResourceManager(主)”链接进入ResourceManager WebUI界面。 5. 单击左侧“Scheduler”界面，确认被删除租户的队列已经清除。

来自：
设置自定义告警规则
本页介绍了天翼云关系数据库MySQL版告警规则的设置方法。注意仅II类型资源池支持该功能，具体支持情况以控制台页面展示为准。更多资源池信息，请参见功能概览。操作场景管理控制台支持设置告警规则，用户可自定义监控目标与通知策略，及时了解MySQL数据库服务运行状况，从而起到预警作用。说明针对部分告警（比如存储空间或者备份空间满）默认推送给对应的租户，如果租户下面有多个用户，则所有用户都会收到对应的告警信息。如果某个用户不希望收到告警，则需要使用该用户的账号登录天翼云官网进入数据库管理平台 > 消息中心 > 消息订阅，在告警信息设置中取消该用户的邮件、短信、企业微信和钉钉等。新建指标告警策略 1.在天翼云官网首页的顶部菜单栏，选择产品 > 数据库 > 关系型数据库 > 关系数据库MySQL版，进入关系数据库MySQL产品页面。然后单击管理控制台，进入概览页面。 2.在左侧导航栏，选择管理中心 > 告警中心 > 告警设置。 3.单击新建告警策略，设置告警规则，您也可以对已创建的策略进行编辑修改。参数名参数解释策略名称告警策略的名称，一个告警策略可以包含多个告警规则。资源池告警策略对应的资源池。备注告警策略的备注信息。告警对象可选择天翼云数据库组件，并选择对应的告警实例。以MySQL为例，可在单击实例MySQL后，单击资源池旁的选择实例。模板类型支持手动创建告警规则，用户也可使用默认模板的告警规则。阈值告警支持选择实例内存使用率、磁盘使用率、CPU使用率、连接数和活跃连接数比例、全部会话、活跃会话、备份空间使用量、实例TPS、QPS等告警指标，备份空间使用率等，具体以实际页面展示为准。状态告警支持选择实例状态，即实例状态异常时将发出告警。沉默周期指告警发生后如果未恢复正常，间隔多久重复发送一次告警通知。告警级别支持选择紧急、告警、普通三种告警级别。通知方式支持选择邮箱、短信、企业微信、钉钉等多种方式，支持同时选择多种告警方式进行告警。填写后将以选定的通知方式进行告警通知。告警联系人目前可选择主账号和该主账号下的子账号，不可选择其他用户。选择后会将告警信息推送至用户绑定的邮箱和短信。 4.填写对应参数后，单击确认。

来自：
帮助文档
关系数据库MySQL版
用户指南
监控与告警
设置自定义告警规则
RabbitMqProducer监控
指标类别指标指标名称指标说明单位数据类型默认聚合方式异常（exception，RabbitMqProducer调用的异常信息统计。） exceptionType 异常类型异常类型 ENUM LAST 异常（exception，RabbitMqProducer调用的异常信息统计。） causeType 异常类发生异常的类 ENUM LAST 异常（exception，RabbitMqProducer调用的异常信息统计。） count 次数该异常的发生次数 INT SUM 异常（exception，RabbitMqProducer调用的异常信息统计。） message 异常消息该异常产生的异常消息 STRING LAST 异常（exception，RabbitMqProducer调用的异常信息统计。） stackTrace 异常堆栈该异常产生的堆栈信息 CLOB LAST exchange监控（exchangePublish，以exchange为维度统计消息推送详情） connection connection producer连接信息 ENUM LAST exchange监控（exchangePublish，以exchange为维度统计消息推送详情） exchange exchange exchange名 ENUM LAST exchange监控（exchangePublish，以exchange为维度统计消息推送详情） concurrentMax 最大并发推送消息最大并发 INT MAX exchange监控（exchangePublish，以exchange为维度统计消息推送详情） errorCount 错误次数推送消息的错误次数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST exchange监控（exchangePublish，以exchange为维度统计消息推送详情） invokeCount invokeCount Publish调用次数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） publishedMsgCount publishedMsgCount 推送消息数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） publishedBytes 推送字节数推送字节数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） maxSingleMsgBytes 单次推送最大字节数单次推送最大字节数 INT MAX exchange监控（exchangePublish，以exchange为维度统计消息推送详情） lastError 错误信息推送消息发生错误产生的错误信息 STRING LAST exchange监控（exchangePublish，以exchange为维度统计消息推送详情） maxTime 最大响应时间推送消息的最大响应时间 INT MAX exchange监控（exchangePublish，以exchange为维度统计消息推送详情） runningCount 正在执行数采集时间点正在执行的推送消息数量 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST exchange监控（exchangePublish，以exchange为维度统计消息推送详情） totalTime 总响应时间推送消息的总响应时间 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） range1 010ms 响应时间在010ms范围请求数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） range2 10100ms 响应时间在10100ms范围请求数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） range3 100200ms 响应时间在100200ms范围请求数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） range5 110s 响应时间在110s范围请求数 INT SUM exchange监控（exchangePublish，以exchange为维度统计消息推送详情） range6 10s以上响应时间在10s以上请求数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） connection connection producer连接信息 ENUM LAST connection监控（connectionPublish，以connection为维度统计消息推送详情。） connectionCount 当前连接数当前连接数 INT LAST connection监控（connectionPublish，以connection为维度统计消息推送详情。） channelCount 当前Channel数当前Channel数 INT LAST connection监控（connectionPublish，以connection为维度统计消息推送详情。） connectionCreated 创建连接数创建连接数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） connectionClosed 销毁连接数销毁连接数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） channelCreated 创建Channel数创建Channel数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） channelClosed 销毁Channel数销毁Channel数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） concurrentMax 最大并发推送消息最大并发 INT MAX connection监控（connectionPublish，以connection为维度统计消息推送详情。） errorCount 错误次数推送消息的错误次数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST connection监控（connectionPublish，以connection为维度统计消息推送详情。） invokeCount invokeCount Publish调用次数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） publishedMsgCount publishedMsgCount 推送消息数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） publishedBytes 推送字节数推送字节数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） maxSingleMsgBytes 单次推送最大字节数单次推送最大字节数 INT MAX connection监控（connectionPublish，以connection为维度统计消息推送详情。） lastError 错误信息推送消息发生错误产生的错误信息 STRING LAST connection监控（connectionPublish，以connection为维度统计消息推送详情。） maxTime 最大响应时间推送消息的最大响应时间 INT MAX connection监控（connectionPublish，以connection为维度统计消息推送详情。） runningCount 正在执行数采集时间点正在执行的推送消息数量 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST connection监控（connectionPublish，以connection为维度统计消息推送详情。） totalTime 总响应时间推送消息的总响应时间 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） range1 010ms 响应时间在010ms范围请求数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） range2 10100ms 响应时间在10100ms范围请求数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） range3 100200ms 响应时间在100200ms范围请求数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） range5 110s 响应时间在110s范围请求数 INT SUM connection监控（connectionPublish，以connection为维度统计消息推送详情。） range6 10s以上响应时间在10s以上请求数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） concurrentMax 最大并发推送消息最大并发 INT MAX total监控（total，以客户端为维度统计消息推送详情。） errorCount 错误次数推送消息的错误次数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST total监控（total，以客户端为维度统计消息推送详情。） invokeCount invokeCount Publish调用次数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） publishedMsgCount publishedMsgCount 推送消息数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） publishedBytes 推送字节数推送字节数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） maxSingleMsgBytes 单次推送最大字节数单次推送最大字节数 INT MAX total监控（total，以客户端为维度统计消息推送详情。） lastError 错误信息推送消息发生错误产生的错误信息 STRING LAST total监控（total，以客户端为维度统计消息推送详情。） maxTime 最大响应时间推送消息的最大响应时间 INT MAX total监控（total，以客户端为维度统计消息推送详情。） runningCount 正在执行数采集时间点正在执行的推送消息数量 INT SUM total监控（total，以客户端为维度统计消息推送详情。） slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST total监控（total，以客户端为维度统计消息推送详情。） totalTime 总响应时间推送消息的总响应时间 INT SUM total监控（total，以客户端为维度统计消息推送详情。） range1 010ms 响应时间在010ms范围请求数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） range2 10100ms 响应时间在10100ms范围请求数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） range3 100200ms 响应时间在100200ms范围请求数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） range5 110s 响应时间在110s范围请求数 INT SUM total监控（total，以客户端为维度统计消息推送详情。） range6 10s以上响应时间在10s以上请求数 INT SUM

来自：
帮助文档
应用性能管理
产品介绍
指标总览
消息队列
RabbitMqProducer监控
购买实例
本节介绍了分布式消息服务RabbitMQ产品实例如何购买。实例介绍 RabbitMQ实例订购支持用户自定义规格和自定义特性，采用物理隔离的方式部署。租户独占RabbitMQ实例，可根据业务需要可定制相应规格的RabbitMQ实例。在新的资源池节点上，还支持选择主机类型和存储规格等丰富用户选项。操作步骤 1. 登录管理控制台。 2. 进入RabbitMQ管理控制台。 3. 在管理控制台右上角单击“地域名称”，选择区域。此处请选择与您的应用服务相同的区域。 4. 点击“购买实例”跳转到购买页面，根据页面订购说明进行产品开通。实例规格选择说明节点可选择3节点、5节点、7节点、9节点，实例规格可选择4C8G、8C16G、16C32G。存储类型可选择普通IO（SATA）、高IO（SAS）、超高IO（SSD）。（1）填写实例名称，长度在 4 到 64个字符，必须以字母开头，不区分大小写，可以包含字母、数字、中划线或下划线，不能包含其他特殊字符。（2）选择引擎类型，默认选择云原生引擎，海量消息堆积能力，支持更多连接和队列数，稳定性高。也可选择rabbitmq引擎，完全支持开源RabbitMQ生态，功能完备。（3）选择计费模式：包年包月/按需计费，两种模式说明参见计费模式。（4）购买时长按照计费模式选择变化：计费模式为包年包月，可选择购买时长16个月、13年。该模式提供自动续期功能，勾选后可以自动续期购买时长：16个月、13年。计费模式为按需计费，则该选项隐藏无需选择。（5）部署方式有单可用区和多可用区两个选项，目前仅支持单可用区和3可用区部署,单可用区部署请选中任意一个AZ；多可用区部署请选中3个AZ，系统会自动将Broker节点平均分配至各可用区。（6）设置节点数，可选择3/5/7/9。RabbitMQ 的节点数是指 RabbitMQ 集群中的节点数量。在 RabbitMQ 集群中，可以有多个节点组成一个集群，每个节点都是一个独立的 RabbitMQ 服务器实例。（7）下拉选择主机类型，可选择通用型和计算增强型。通用型云主机共享宿主机的CPU资源，主要提供基本水平的vCPU性能、平衡的计算、内存和网络资源，具有较高性价比，支持通用的业务运行。计算增强型云主机独享宿主机的CPU资源，实例间无CPU争抢，并且没有进行资源超配，同时搭载全新网络加速引擎，实现接近物理服务器的强劲稳定性能。（8）选择实例规格，分布式消息服务RabbitMQ提供通用型和计算增强型各3类规格，各规格详细说明参见弹性云主机规格。（9）选择存储空间，包括磁盘类型和空间。磁盘类型提供高IO/超高IO三类。普通IO适用于大容量、读写速率中等、事务性处理较少的应用场景。高IO：适用于主流的高性能、高可靠应用场景。超高IO：适用于超高IOPS、超大带宽需求的读写密集型应用场景。了解更多磁盘类型说明参见云硬盘规格。磁盘空间以100G起步，可以以100倍数增加磁盘空间。（10）选择已有虚拟私有云，若无虚拟私有云，点击创建跳转到虚拟私有云页面新增，了解更多内容参见虚拟私有云。（11）选择已有子网，若无子网，点击创建跳转到子网页面新增。（12）选择已有安全组，若无安全组，点击创建跳转到安全组页面新增。

来自：
帮助文档
分布式消息服务RabbitMQ
快速入门
购买实例
组件依赖关系表
组件名称集群部署的依赖组件 Doris / Elasticsearch / HBase HDFS、ZooKeeper、Kerberos、OpenLDAP HDFS ZooKeeper、Kerberos、OpenLDAP Hive HDFS、YARN、ZooKeeper、Kerberos、OpenLDAP Kafka ZooKeeper、Kerberos、OpenLDAP Kerberos OpenLDAP Kibana Elasticsearch Kyuubi Spark、Hive、HDFS、YARN、ZooKeeper、OpenLDAP、Kerberos OpenLDAP / Ranger HDFS、OpenLDAP、Kerberos、ZooKeeper Spark HDFS、YARN、Hive、ZooKeeper、OpenLDAP、Kerberos Trino Kerberos、OpenLDAP YARN ZooKeeper、Kerberos、HDFS、OpenLDAP ZooKeeper Kerberos、OpenLDAP Flink HDFS、YARN、Kerberos、OpenLDAP、ZooKeeper Hudi Hive/Spark/Flink Iceberg Hive/Spark/Flink Knox Kerberos、OpenLDAP Logstash / JeekeFS Kerberos、OpenLDAP Tez HDFS、YARN、Hive、ZooKeeper、OpenLDAP、Kerberos Flume / KafkaUI Kafka、OpenLDAP、Kerberos、ZooKeeper SeaTunnel Flink、HDFS、YARN、OpenLDAP、Kerberos、ZooKeeper Pushgateway / TezUI OpenLDAP、Kerberos、Hive、ZooKeeper、Tez、HDFS、YARN Amoro Kerberos、OpenLDAP、ZooKeeper、HDFS、YARN Hue Kerberos、OpenLDAP DolphinScheduler HDFS、OpenLDAP、Kerberos、ZooKeeper Sqoop HDFS、YARN Lance / Paimon Hive/Spark/Flink

来自：
帮助文档
翼MapReduce
快速入门
组件依赖关系表
创建集群
接口功能介绍创建集群（包周期，即包年/包月）。接口约束参数校验必须通过。注意事项： 1.云搜索和数据分析类型集群不支持task节点组 2.云搜索类型集群的core类型节点组机器数量为115，且可以没有core节点组 3.非云搜索类型的集群，都需要存在master和core1节点组，且core1节点组机器数量为315 4.自定义类型集群需参考组件依赖关系 components组件信息如下： datalake数据湖必选组件：OpenLDAP(2.4.50)、Kerberos(1.18.2)、ZooKeeper(3.7.1)、HDFS(3.3.3)、YARN(3.3.3)、Hive(3.1.2)、Tez(0.10.1)、TezUI(0.10.1)、Spark(3.4.1)、Hudi(0.14.0)、Iceberg(1.4.3) 可选组件：HBase(2.4.12)、Trino(440)、Kyuubi(1.8.2)、Doris(2.1.6)、Ranger(2.2.0)、Kafka(2.8.1)、KafkaUI(1.0.0)、Knox(1.6.1)、Flink(1.16.2)、JeekeFS(1.1.1)、Flume(1.11.0)、SeaTunnel(2.3.7)、Pushgateway(1.6.2) dataanalysis数据分析必选组件：Doris(2.1.6) dataservice数据服务必选组件：OpenLDAP(2.4.50)、Kerberos(1.18.2)、ZooKeeper(3.7.1)、HDFS(3.3.3)、YARN(3.3.3)、HBase(2.4.12) 可选组件：Ranger(2.2.0)、Knox(1.6.1)、JeekeFS(1.1.1) cloudsearch云搜索必选组件：Elasticsearch(7.10.2)、Kibana(7.10.2) 可选组件：Logstash(7.10.2) realtimedataprocessing实时数据流必选组件：HDFS(3.3.3)、YARN(3.3.3)、Flink(1.16.2)、ZooKeeper(3.7.1)、Kerberos(1.18.2)、OpenLDAP(2.4.50)、Hudi(0.14.0)、Iceberg(1.4.3)、SeaTunnel(2.3.7) 可选组件：Kafka(2.8.1)、KafkaUI(1.0.0)、Knox(1.6.1)、JeekeFS(1.1.1)、Pushgateway(1.6.2) customize自定义可选组件：OpenLDAP(2.4.50)、Kerberos(1.18.2)、ZooKeeper(3.7.1)、HDFS(3.3.3)、YARN(3.3.3)、Hive(3.1.2)、Spark(3.4.1)、Hudi(0.14.0)、Iceberg(1.4.3)、HBase(2.4.12)、Trino(440)、Kyuubi(1.8.2)、Doris(2.1.6)、Ranger(2.2.0)、Kafka(2.8.1)、KafkaUI(1.0.0)、Knox(1.6.1)、Flink(1.16.2)、JeekeFS(1.1.1)、Flume(1.11.0)、Tez(0.10.1)、TezUI(0.10.1)、SeaTunnel(2.3.7)、Pushgateway(1.6.2) 自定义集群组件依赖关系如下： Flink 依赖（全部）HDFS、Hudi、Iceberg、Kerberos、OpenLDAP、SeaTunnel、YARN、ZooKeeper HBase 依赖（全部）HDFS、Kerberos、OpenLDAP、ZooKeeper HDFS 依赖（全部）Kerberos、OpenLDAP、ZooKeeper Hive 依赖（全部）HDFS、Hudi、Iceberg、Kerberos、OpenLDAP、Tez、YARN、ZooKeeper Hudi 依赖（任意）Flink、Hive、Spark Iceberg 依赖（任意）Flink、Hive、Spark JeekeFS 依赖（全部）Kerberos Kafka 依赖（全部）Kerberos、ZooKeeper KafkaUI 依赖（全部）Kafka、Kerberos、OpenLDAP Kerberos 依赖（全部）OpenLDAP Knox 依赖（全部）Kerberos、OpenLDAP Kyuubi 依赖（全部）HDFS、Hive、Kerberos、OpenLDAP、Spark、YARN、ZooKeeper Ranger 依赖（全部）HDFS、Kerberos、OpenLDAP、ZooKeeper Spark 依赖（全部）HDFS、Hive、Hudi、Iceberg、Kerberos、OpenLDAP、YARN、ZooKeeper TezUI 依赖（全部）Tez、YARN Trino 依赖（全部）Kerberos、OpenLDAP YARN 依赖（全部）HDFS、Kerberos、OpenLDAP、ZooKeeper ZooKeeper 依赖（全部）Kerberos、OpenLDAP

来自：
帮助文档
翼MapReduce
API参考
API
2023-11-02
创建集群
购买
本章节主要介绍数据湖探索（DLI）的购买流程。 1.注册天翼云官网账号，登录后进入官网首页； 2.在官网首页，单击左上角“产品”，【大数据>数据湖探索】； 3.在【数据湖探索】界面，单击【立即开通】； 4.在数据湖探索队列购买页面选择CPU架构、队列规格并填写相关配置信息，勾选服务协议，单击【立即购买】； 5.按页面提示，单击【提交】即完成队列创建。队列创建完成后，您可在产品控制台“队列管理”页面看到您创建的队列。

来自：
帮助文档
数据湖探索
计费说明
购买
开发SQL脚本
属性说明数据连接选择数据连接。数据库选择数据库。资源队列选择执行DLI作业的资源队列。当脚本为DLI SQL时，配置该参数。如需新建资源队列，请参考以下方法：单击，进入DLI的“队列管理”页面新建资源队列。前往DLI管理控制台进行新建。说明 DLI提供默认资源队列“default”，该资源队列不支持insert、load、cat命令。如需以“key/value”的形式设置提交SQL作业的属性，请单击。最多可设置10个属性，属性说明如下： dli.sql.autoBroadcastJoinThreshold（自动使用BroadcastJoin的数据量阈值） dli.sql.shuffle.partitions（指定Shuffle过程中Partition的个数） dli.sql.cbo.enabled（是否打开CBO优化策略） dli.sql.cbo.joinReorder.enabled（开启CBO优化时，是否允许重新调整join的顺序） dli.sql.multiLevelDir.enabled（OBS表的指定目录或OBS表分区表的分区目录下有子目录时，是否查询子目录的内容；默认不查询） dli.sql.dynamicPartitionOverwrite.enabled（在动态分区模式时，只会重写查询中的数据涉及的分区，未涉及的分区不删除）

来自：
帮助文档
数据治理中心 DataArts Studio
用户指南
数据开发
脚本开发
开发脚本
开发SQL脚本
使用云主机打造 Moltbot 飞书私人助理
步骤3：在云服务器上为Moltbot服务配置飞书插件 Moltbot 默认不内置飞书 Channel，需要额外安装插件。这里使用开源插件：++ %E4%B8%AD%E6%96%87++。安装流程如下： 1. 在云服务器内运行插件安装命令： plaintext clawdbot plugins install @m1hengclawd/feishu 2. 安装完成后，将飞书机器人的配置参数写入Moltbot的配置文件。 plaintext clawdbot config set channels.feishu.appId "[飞书的APP ID]" clawdbot config set channels.feishu.appSecret "[飞书的APP Secret]" clawdbot config set channels.feishu.enabled true 以上参数所在位置： 3. 配置完成后，重新启动Moltbot的Gateway服务。 plaintext clawdbot gateway restart 注意若云主机使用的是【Moltbotv2026.1.243CtyunOS25.07】镜像，则重启Gateway服务时，需替换为以下命令执行： plaintext nohup clawdbot gateway & 4. 添加事件订阅注意事件订阅必须在Moltbot添加飞书配置并启动后，才可以创建，否则无法创建成功。选择订阅方式为长连接添加事件，具体添加项见下表：事件说明 im.message.receivev1 接收消息（必需） im.message.messagereadv1 消息已读回执 im.chat.member.bot.addedv1 机器人进群 im.chat.member.bot.deletedv1 机器人被移出群配置完成后，进行发版 5. 飞书机器人已创建成功，现在可以在飞书中和机器人对话，校验Moltbot功能是否正常。

来自：
计费模式
本节主要介绍分布式缓存服务Redis版的计费模式目前天翼云分布式缓存服务Redis版提供包周期（包年/包月）、按需2种计费模式供您灵活选择，使用越久越便宜。包周期（包年/包月）：天翼云提供包月和包年的购买模式。这种购买方式相对于按需付费则能够提供更大的折扣，对于长期使用者，推荐该方式。包周期计费按照订单的购买周期来进行结算。按需计费：这种购买方式比较灵活，可以即开即停，支持秒级计费。实例从“开通”开启计费到“删除”结束计费，按实际购买时长（精确到秒）计费。下表列出两种模式的区别：计费模式包年/包月按需计费付费方式预付费按照订单的购买周期结算。后付费按照云服务器实际使用时长计费。计费周期按订单的购买周期计费。按小时结算。实例升级支持扩容，工单施工完生效，但是施工过程中服务不可用；不支持缩容。支持扩容，工单施工完生效，但是施工过程中服务不可用；不支持缩容。更改计费模式支持变更为按需资源。支持变更为包周期资源。变更规格支持变更实例规格。支持变更实例规格。适用场景适用于可预估资源使用周期的场景，价格比按需计费模式更优惠。对于长期使用者，推荐该方式。适用于消息资源需求波动的场景，可以随时开通，随时删除。包周期与按需计费方式之间可以进行转换，具体操作请参考包周期与按需互转。

来自：
帮助文档
分布式缓存服务Redis版
计费说明
计费模式
管理消息与新建系统公告
此小节介绍云堡垒机管理消息与新建系统公告。消息中心是系统内各类消息接收提示管理中心。系统公告是对系统用户广播系统内重大变更的消息提醒。管理消息列表消息中心小窗可呈现最新三条未读消息。任务执行完成后，则可在任务中心查看全部任务。消息类型共有5种，分别包括系统消息、业务消息、任务消息、命令告警、工单消息。消息级别共有3种，分别包括“高”、“中”、“低”，消息级别越高代表消息重要程度越高。本小节主要介绍如何在消息中心查看、删除、标记消息。查看消息提醒 1. 登录云堡垒机系统。 2. 单击右上角，展开消息中心小窗口，可查看最新三条未读消息。 3. 单击“查看更多”，进入消息中心列表页面。 4. 查询消息，在搜索框中输入关键字，根据消息标题内容快速查询消息。 5. 查看消息列表。消息按发生时间顺序倒序排列，可查看全部已读、未读的消息。 6. 查看消息详情。单击目标消息名称，进入消息详情页面。删除消息提醒 1. 登录云堡垒机系统。 2. 单击右上角，展开消息中心小窗口，可查看最新三条未读消息。 3. 单击“查看更多”，进入消息中心列表页面。 4. 勾选一条或多条消息，单击左下角“删除”，弹出删除消息确认窗口。 5. 单击“确定”，即可立即删除选中消息。消息删除后不可找回，请谨慎操作。

来自：
帮助文档
运维安全中心（云堡垒机）
用户指南
系统桌面
管理消息与新建系统公告
开源组件端口列表
配置参数默认端口端口说明 kafkamanagerport 9099 KafkaManager的WEB UI端口。

来自：
帮助文档
翼MapReduce
用户指南
访问MRS集群上托管的开源组件Web页面
开源组件端口列表
ACL策略管理(1)
ACL 策略指为用户自定义的一组权限规则，允许/拒绝用户通过 IP 或网段生产/消费 Topic 资源。当前提供有2种匹配方式： 1）预设策略：新建策略时不关联到Topic，新建或编辑Topic时可关联到该ACL策略。 2）前缀模糊匹配策略：前缀模糊匹配策略提供了一种高效的批量授权方式，特别适用于对具有相同前缀的多个Topic进行统一授权管理。当生产环境中存在遵循统一命名规范的Topic时（例如：项目相关Topic都以"project"开头，包括project1、projectb等），可以通过前缀模糊匹配策略快速完成授权配置。一次配置即可覆盖所有匹配前缀的Topic，包括后续新增的Topic。创建ACL策略（1）登录管理控制台，进入Kafka管理控制台。（2）在实例列表页操作列，目标实例行单击“管理”>“用户管理”>“创建用户”。（3）创建用户，输入用户密码后点击确认，完成用户的创建。如果已经创建了则可以跳过此步骤。（4）单击”ACL策略管理”>“创建策略”进入配置 ACL 策略页面。（5）选择其中一种匹配方式（预设策略或前缀模糊匹配）。（6）如选择前缀模糊匹配策略，则输入Topic前缀字符串，将匹配所有以输入内容为前缀的Topic。 "匹配Topic"里展示的是当前已经匹配到的Topic，后面新建的Topic也能自动匹配上。（7）输入规则名称，单击“添加规则”绑定策略对应的规则。规则参数说明：参数说明权限 ACL 策略的操作权限分为两类：允许和拒绝。若只设置允许规则，则除允许的规则外的其他IP或网段都无法连接实例。若只设置拒绝规则，则除拒绝的规则外的其他IP或网段需要设置了允许规则后才可以连接实例。若同时设置允许规则和拒绝规则，则只有允许规则中的IP或网段可以连接实例，其他IP或网段都无法连接实例。用户选择需要设置权限的用户。 IP或网段填写需要设置权限的 IP 或网段，用 ; 隔开，若 IP 为空，则默认为全部 IP 添加权限。操作选择策略生效的动作，即向 Topic 生产或消费消息。自动应用后续所有新增topic 开启后，后续页面上创建的Topic会自动关联此规则，多个策略只允许一条策略开启。（8）单击“确定”，完成 ACL 策略创建。

来自：
SQL作业管理
参数名称描述数据格式导出查询结果数据的文件格式。支持json和csv格式。队列选择运行的队列。SQL作业只能在队列类型为“SQL队列”下执行。具体队列创建可以参考6.3 创建队列。压缩格式导出查询结果数据的压缩方式，选择如下压缩方式。 l none l bzip2 l deflate l gzip 存储路径输入或选择OBS的路径。说明 l 选择OBS桶后，请在文本框中定义文件夹名称，若该文件夹不存在，则会在OBS中创建。 l 文件夹名称不能包含下列特殊字符： / : ? " < > ，并且不能以“.”开头和结尾。导出方式导出查询结果数据的保存方式。 l 随导出创建指定路径：指定的导出目录必须不存在，如果指定目录已经存在，系统将返回错误信息，无法执行导出操作。 l 覆盖指定路径：在指定目录下新建文件，会删除已有文件。结果条数导出查询结果数据的数量。不填写数值或数值为“0”时，导出全部结果。表头设置导出查询结果数据是否含表头。

来自：
帮助文档
数据湖探索
用户指南
作业管理
SQL作业管理
删除资源池
本章节主要介绍删除资源池。操作场景该任务指导用户通过MRS Manager，删除已有资源池。前提条件集群中任何一个队列不能使用待删除资源池为默认资源池，删除资源池前需要先取消默认资源池，请参见配置队列。集群中任何一个队列不能在待删除资源池中配置过资源分布策略，删除资源池前需要先清除策略，请参见清除队列配置。操作步骤在MRS Manager，单击“租户管理”。 1. 单击“资源池”页签。 2. 在资源池列表指定资源池所在行的“操作”列，单击“删除”。在弹出窗口中单击“确定”。

来自：
帮助文档
翼MapReduce
用户指南
MRS Manager操作指导（适用于2.x及之前）
租户管理
删除资源池
vLLM GPU单机PD分离
本节介绍如何创建 vLLM GPU单机PD分离任务。前置条件 1. 确认智算套件已经安装并且全部运行中 2. 进入智算套件，AI应用管理，队列管理，确保队列存在并且有足够的资源(GPU,CPU,内存，rdma/rdmashareddevicea) [参考创建队列的文档] 操作步骤创建任务进入智算套件，AI应用列表，在线推理菜单，创建AI应用基本信息应用类型：vLLM 开启PD分离选择：静态PD分离推理类型选择：单机配置信息推理框架，框架版本，推理模型，模型版本根据实际情况选择。简单示例：推理框架： nvidiavllm 框架版本：v0.11.2 推理模型：deepseekr1distillqwen1.5b 模型版本：v1 资源：CPU，内存，共享内存可以不填选择 GPU：4，rdma/rdmashareddevicea：1 队列：选择存在且资源足够的的队列 Prefill

来自：
帮助文档
智算套件
用户指南
推理应用
创建推理应用
vLLM GPU单机PD分离
环境准备
安全组安全组可重复使用，您也可以根据实际情况使用不同的安全组，请根据实际需要进行配置。创建安全组的操作指导，请参考虚拟私有云创建安全组。若需要为安全组添加规则，请参考虚拟私有云安全组添加安全组规则。弹性云主机用户若需要自己客户应用接入RocketMQ发送、消费消息，需先购买弹性云主机并确保和RocketMQ实例在同一VPC下。创建操作说明请参见创建弹性云主机。其他工具下载安装工具Eclipse3.6.0以上版本或者IntelliJ ，JDK 1.8.111以上版本。生产消费验证涉及的SDK如下： rocketmq引擎版本：推荐使用的社区版Java SDK版本为4.9.3，请访问Apache RocketMQ官网下载。 ctgmq引擎版本（已调整白名单特性）：点击ctgmqSDK直接下载。

来自：
帮助文档
分布式消息服务RocketMQ
快速入门
环境准备
扩容集群
配置项说明队列 1.选择扩容节点加入的队列。 2.可创建新的队列，并将节点扩容在新队列中。节点来源选择扩容节点的来源。可选项如下：新增节点：从控制台新购资源。已有节点：从已开通的资源里纳管至集群。计费说明选择扩容节点的付费类型。可选项如下：包年包月：按月计费，以自然月为计费单位。按量付费：一种后付费模式，即先使用再付费。计算节点规格选择扩容节点的规格。镜像选择计算节点的镜像。注：该镜像为弹性高性能计算平台定制镜像，请优先保持集群同一镜像。计算节点硬盘选择扩容节点规格所对应的硬盘。子网选择子网，建议同一个队列保持子网一致。计算节点数量选择需要扩容的计算节点数量。

来自：
帮助文档
弹性高性能计算 E-HPC
高性能计算平台
管理集群
扩容集群
创建vLLM GPU单机推理任务(1)
本节介绍如何创建vLLM GPU 单机推理任务。前置条件 1. 确认智算套件已经安装并且全部运行中 2. 进入智算套件，AI应用管理，队列管理，确保队列存在并且有足够的资源(GPU,CPU,内存) [参考创建队列的文档] 操作步骤 1. 进入智算套件，AI应用列表，在线推理菜单，创建AI应用 2. 创建应用应用类型：vLLM 推理类型选择单机推理框架，框架版本，推理模型，模型版本根据实际情况选择。简单的示例：推理框架： nvidiavllm 框架版本：v0.11.2 推理模型：deepseekr1distillqwen1.5b 模型版本：v1 资源：CPU，内存，共享内存可以不填选择 GPU：2 队列：选择存在且资源足够的的队列点击确认完成创建。

来自：
消息模板
编辑消息模板 1. 在消息模板列表中，单击消息模板名称行后的“修改”，根据[表1]进行修改，其中“模板名称”不可修改。说明内置消息模板不支持删除。 2. 编辑完成后，单击“确认”。复制消息模板 1. 在消息模板列表中，单击消息模板名称行后的“复制”，须修改消息模板的模板名称。 2. 完成后，单击“确认”。删除消息模板删除消息模板 1. 在消息模板列表中，单击消息模板名称行后的“删除”。说明内置消息模板不支持删除。 2. 在弹出的对话框中，单击“确认”删除该消息模板。批量删除消息模板 1. 在消息模板列表中，勾选待删除的消息模板，单击列表左上方“批量删除”。 2. 在弹出的删除消息模板页面，单击“确定”，删除所勾选的消息模板。

来自：
帮助文档
云日志服务
用户指南
日志告警
告警通知
消息模板
ALM-18020 Yarn任务执行超时
检查队列资源是否不足 5.在原生页面找到该任务，查看该任务的“Queue”中的队列名。单击原生页面左侧“Scheduler”,在“Applications Queues”页框中查找对应的队列名，并下拉展开队列的详细信息，如图所示： 6.查看队列详情中“Used Resources”是否近似等于“Max Resources”，即任务提交的队列中资源已经使用完毕，若队列资源不足，请在FusionInsight Manager的“租户资源 > 动态资源计划 > 资源分布策略”中调大队列的“最大资源”。重新运行任务后，查看是否不再上报告警。是，处理完毕。否，执行步骤7。检查任务是否发生数据倾斜 7.在Yarn的原生页面，选择“任务 ID （如application15653379197230002） > Tracking URL:ApplicationMaster > job15653379197230002”，进入如下页面： 8.选择左侧“Job > Map tasks”或者“Job > Reduce tasks”，查看每个Map或者每个Reduce任务的执行时间是否相差很大，如果相差很大，说明任务数据发生了倾斜，需要对任务数据进行均衡。 9.按照如上原因进行处理后，重新执行任务，观察本告警是否还出现。是，执行步骤10。否，处理完毕。收集故障信息 10.在FusionInsight Manager界面，选择“运维 > 日志 > 下载”。 11.在“服务”中勾选待操作集群的“Yarn”。 12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟，单击“下载”。 13.请联系运维人员，并发送已收集的故障日志信息。告警清除此告警修复后，系统会自动清除此告警，无需手工清除。参考信息无。

来自：
帮助文档
翼MapReduce
用户指南
FusionInsight Manager操作指导（适用于3.x）
告警参考（适用于MRS 3.x版本）
ALM-18020 Yarn任务执行超时
通过消息幂等实现去重
本节介绍如何处理消息去重。方案概述在RocketMQ的业务处理过程中，如果消息重发了多次，消费者端对该重复消息消费多次与消费一次的结果是相同的，多次消费并没有对业务产生负面影响，那么这个消息处理过程是幂等的。消息幂等保证了无论消息被重复投递多少次，最终的处理结果都是一致的，避免了因消息重复而对业务产生影响。例如在支付场景下，用户购买商品后进行支付，由于网络不稳定导致用户收到多次扣款请求，导致重复扣款。但实际上扣款业务只应进行一次，商家也只应产生一条订单流水。这时候使用消息幂等就可以避免这个问题。在实际应用中，导致消息重复的原因有网络闪断、客户端故障等，且可能发生在消息生产阶段，也可能发生在消息消费阶段。因此，可以将消息重复的场景分为以下两类：生产者发送消息时发生消息重复：生产者发送消息时，消息成功发送至服务端。如果此时发生网络闪断，导致生产者未收到服务端的响应，此时生产者会认为消息发送失败，因此尝试重新发送消息至服务端。当消息重新发送成功后，在服务端中就会存在两条内容相同的消息，最终消费者会消费到两条内容一样的重复消息。消费者消费消息时发生消息重复：消费者消费消息时，服务端将消息投递至消费者并完成业务处理。如果此时发生网络闪断，导致服务端未收到消费者的响应，此时服务端会认为消息投递失败。为了保证消息至少被消费一次，服务端会尝试投递之前已被处理过的消息，最终消费者会消费到两条内容一样的重复消息。

来自：
帮助文档
分布式消息服务RocketMQ
最佳实践
通过消息幂等实现去重
退服和入服务角色实例
本章节主要介绍翼MapReduce服务退服和入服务角色实例。操作场景某个Core或Task节点出现问题时，可能导致整个集群状态显示为“异常”。MRS集群支持将数据存储在不同Core节点，用户可以在MRS Manager指定角色实例退服，使退服的角色实例不再提供服务。在排除故障后，可以将已退服的角色实例入服。支持退服、入服的角色实例包括： HDFS的DataNode角色实例 Yarn的NodeManager角色实例 HBase的RegionServer角色实例 Kafka的Broker角色实例限制：当DataNode数量少于或等于HDFS的副本数时，不能执行退服操作。例如HDFS副本数为3时，则系统中少于4个DataNode，将无法执行退服，Manager在执行退服操作时会等待30分钟后报错并退出执行。 Kafka Broker数量少于或等于副本数时，不能执行退服。例如Kafka副本数为2时，则系统中少于3个节点，将无法执行退服，Manager执行退服操作时会失败并退出执行。已经退服的角色实例，必须执行入服操作启动该实例，才能重新使用。操作步骤在MRS Manager，单击“服务管理”。 1.单击服务列表中相应服务。 2.单击“实例”页签。 3.勾选指定角色实例名称前的复选框。 4.选择“更多 > 退服”或“入服”执行相应的操作。说明实例退服操作未完成时在其他浏览器窗口重启集群中相应服务，可能导致MRS Manager提示停止退服，实例的“操作状态”显示为“已启动”。实际上后台已将该实例退服，请重新执行退服操作同步状态。

来自：
帮助文档
翼MapReduce
用户指南
MRS Manager操作指导（适用于2.x及之前）
对象管理
退服和入服务角色实例
监控指标说明
生产者指标指标名称指标说明单位生产TPS 统计Topic的消息生产速率，计算方式：1分钟内的最大值条/秒生产消息量峰值统计消息生产速率的最大值条/秒累计生产消息量统计所选时间段内所选topic累计生产的消息总量条消费者指标指标名称指标说明单位处理中消息量计算选定的Topic和消费组当前消费者客户端正在消费但是还没有返回消费成功响应到服务端的消息数。条已就绪消息量计算选定的Topic和消费组当前在服务端已经就绪可以被消费消费的消息总量，这部分消息消费者客户端还没有开始消费。条堆积消息量计算选定Topic和消费组当前消息堆积总量，包括处理中消息和已就绪消息。条已就绪消息排队时间计算选定的Topic和消费组最早一条就绪消息的就绪时间和当前时间差，数值面板展示取选定时间段内统计的最大值展示，曲线面板展示选定时间范围的序列值，当该订阅组没有在线时，该值不显示。该指标可以观测还未被处理的消息的延迟时间大小，适用于对消息延时时间比较敏感的业务场景。毫秒，但随着数值增大会自适应变换单位消息消费速率计算选定Topic和消费组消费消息的速率。条/秒消费者速率峰值计算所选定Topic和消费组的消息消费速率的最大值。条/秒消费堆积量包含上面的堆积消息量，处理中消息量，已就绪消息量，以曲线的形式展示。条消息消费处理耗时计算所选Topic和消费组消费时，从消息开始被消费到消费完成的处理耗时。毫秒消息生产速率 top20 Topics 展示消息生产速率最高的前20个Topic生产速率曲线。条/秒消息消费速率 top20 Groups 展示消息消费速率最高的前20个消费组消费速率曲线。条/秒已就绪消息量 top20 Groups 计算已就绪消息量最大的前20个消费组。条已就绪消息排队时间 top20 Groups 计算已就绪消息量最大的前20个Group。条堆积消息量（包含已就绪消息以及处理中消息）top20 Group 统计堆积的消息量最多的前20个Group。条处理中消息量 top20 Groups 计算处理中的消息量最多的前20个Group。条消费处理耗时 top20 Groups 计算消费处理耗时最长的前20个Group。毫秒

来自：
帮助文档
分布式消息服务RocketMQ
用户指南
监控与告警
监控指标说明
租户简介
资源池 YARN任务队列支持一种调度策略，称为标签调度（Label Based Scheduling）。通过此策略，YARN任务队列可以关联带有特定节点标签（Node Label）的NodeManager，使YARN任务在指定的节点运行，实现任务的调度与使用特定硬件资源的需求。例如，需要使用大量内存的YARN任务，可以通过标签关联具有大量内存的节点上运行，避免性能不足影响业务。在MRS集群中，租户从逻辑上对YARN集群的节点进行分区，使多个NodeManager形成一个资源池。YARN任务队列通过配置队列容量策略，与指定的资源池进行关联，可以更有效地使用资源池中的资源，且互不影响。 MRS Manager中最多支持50个资源池。系统默认包含一个“Default”资源池。

来自：
帮助文档
翼MapReduce
用户指南
MRS Manager操作指导（适用于2.x及之前）
租户管理
租户简介
删除资源池
本章节主要介绍翼MapReduce的删除资源池操作。操作场景根据业务需要，资源池不再使用时，管理员可以通过FusionInsight Manager进行删除资源池。前提条件集群中任何一个队列不能使用待删除资源池为默认资源池，删除资源池前需要先取消默认资源池，请参见配置队列。集群中任何一个队列不能在待删除资源池中配置过资源分布策略，删除资源池前需要先清除策略，请参见清除队列容量配置。操作步骤 1. 登录FusionInsight Manager。 2. 选择“租户资源 > 资源池”。 3. 在资源池列表指定资源池所在行的“操作”列，单击“删除”。 4. 在弹出窗口中单击“确定”。

来自：
帮助文档
翼MapReduce
用户指南
FusionInsight Manager操作指导（适用于3.x）
租户资源
使用Superior调度器的租户业务
管理资源
删除资源池
站内消息
本文主要介绍了站内消息的设置方法和消息类型。用户可以接收、查看、管理天翼云发送的各类消息通知。操作步骤 1、登录消息中心。 2、在站内消息菜单，可以进行以下操作：查看全部、未读、已读消息。按消息类别/消息类型，筛选查看某类消息。将未读消息标记为已读。删除消息。消息类型消息类型消息介绍产品信息产品的创建、开通及资源到期提醒等产品相关信息通知账户资金充值、订单支付、提现等资金相关信息通知活动消息各类线上活动通知服务消息新产品上线或商业化通知重要通知网站重要公告、通知、声明等信息通知其他非以上消息类型通知

来自：
帮助文档
账号中心
消息中心
站内消息
创建vLLM NPU单机PD分离任务(1)
本节介绍如何创建vLLM NPU单机PD分离任务。前置条件 1. 确认智算套件已经安装并且全部运行中 2. 进入智算套件，AI应用管理，队列管理，确保队列存在并且有足够的资源(NPU,CPU,内存) [参考创建队列的文档] 操作步骤创建任务进入智算套件，AI应用列表，在线推理菜单，创建AI应用基本信息应用类型：vLLM 开启PD分离选择静态PD分离推理类型选择单机配置信息推理框架，框架版本，推理模型，模型版本根据实际情况选择。简单的示例：推理框架： ascendvllm 框架版本：v0.11.0rc2 推理模型：deepseekr1distillqwen1.5b 模型版本：v1 队列：选择存在且资源足够的的队列 Prefill CPU，内存，共享内存不填，NPU填：4 Decode DecodeMaster 的资源菜单：CPU，内存，共享内存不填，NPU填：4 点击确认完成创建。

来自：
ALM-19018 HBase合并队列超出阈值
本章节主要介绍ALM19018 HBase合并队列超出阈值的告警。告警解释系统每300秒周期性检测HBase服务的compaction队列长度，当检测到HBase服务的compaction队列长度超过告警的阈值（默认100）时产生该告警。当compaction队列长度小于告警的阈值时，告警恢复。说明说明若集群启用了多实例功能且安装了多个HBase服务，请根据“定位信息”的“服务名”值来确定具体产生告警的HBase服务。例如“定位信息”中显示服务名HBase1，处理步骤中的操作对象也应由HBase调整为HBase1。告警属性告警ID 告警级别是否自动清除 19018 次要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响产生该告警表示HBase服务的compaction队列长度已经超过规定的阈值，如果不及时处理，可能会导致集群性能下降，影响数据读写。可能原因 HBase RegionServer数太少。 HBase 单个RegionServer上Region数过多。 HBase RegionServer堆大小较小。资源不足。相关参数配置不合理。处理步骤检查相关配置是否合理 1.在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，查看是否存在告警ID为“19011”的告警。是，单击对应告警右侧的“查看帮助”并按照帮助文档进行处理，执行步骤3。否，执行步骤2。 2.在FusionInsight Manager首页，选择“集群 > 待操作集群的名称 > HBase > 配置 > 全部配置，搜索“hbase.hstore.compaction.min”，“hbase.hstore.compaction.max”，“hbase.hstore.compactionThreshold”，“hbase.regionserver.thread.compaction.small”和“hbase.regionserver.thread.compaction.throttle”，适当调大其值。 3.观察界面告警是否清除。是，处理完毕。否，执行步骤4。

来自：
帮助文档
翼MapReduce
用户指南
FusionInsight Manager操作指导（适用于3.x）
告警参考（适用于MRS 3.x版本）
ALM-19018 HBase合并队列超出阈值
消费端挂载NFS是否会影响消费速度？
本节介绍消费端挂载NFS是否会影响消费速度消费端在消费消息的主线程里同步将拉取的消息存储在NFS，导致消费端处理消息的速度变慢，阻塞消息处理。可能原因 NFS本身速度就不太理想。 NFS是网络共享存储，虽然有多机器共享访问的能力优势，但多台机器访问是争抢的，消费者个数增多，性能反而下降。解决方案建议将消费端拉取消息和存储消息分别放在两个独立且不同的线程里操作。拉取消息的线程只管消费消息，把消息转给缓存处理线程后就继续消费消息，这样可以保证消费速度的稳定。也可以考虑采用云盘，给每台消费端处理机挂载自己的云盘，各自独立存储，这样消费端不会再因为争抢NFS而降低性能。如果需要把最终的处理结果集中到同一个NFS上保存，仍然可以通过一个异步的工具或者线程，把云盘上的结果再转发到NFS上，而不要让同步存储NFS阻塞消息处理。总之，对于资源访问造成的处理低效，总是可以用异步处理的方式解决。

来自：
帮助文档
分布式消息服务Kafka
常见问题
操作类
消费端挂载NFS是否会影响消费速度？
新建表/文件迁移作业
源端类型说明参数配置 OBS 支持以CSV、JSON或二进制格式抽取数据，其中二进制方式不解析文件内容，性能快，适合文件迁移。参见 MRS HDFs FusionInsight HDFS Apache HDFS 支持以CSV、Parquet或二进制格式抽取HDFS数据，支持多种压缩格式。参见 MRS HBase FusionInsight HBase Apache HBase CloudTable 支持从MRS、FusionInsight HD、开源Apache Hadoop的HBase，或CloudTable服务导出数据，用户需要知道HBase表的所有列族和字段名。参见 MRS Hive FusionInsight Hive Apache Hive 支持从Hive导出数据，使用JDBC接口抽取数据。 Hive作为数据源，CDM自动使用Hive数据分片文件进行数据分区。参见 DLI 支持从DLI导出数据。参见 FTP SFTP 支持以CSV、JSON或二进制格式抽取FTP/SFTP的数据。参见 HTTP 用于读取一个公网HTTP/HTTPS URL的文件，包括第三方对象存储的公共读取场景和网盘场景。当前只支持从HTTP URL导出数据，不支持导入。参见数据仓库DWS 云数据库MySQL 云数据库SQL Server 云数据库PostgreSQL 支持从云端的数据库服务导出数据。从这些数据源导出数据时，CDM使用JDBC接口抽取数据，源端作业参数相同，详细请参见 FusionInsight LibrA 支持从FusionInsight LibrA导出数据。从这些数据源导出数据时，CDM使用JDBC接口抽取数据，源端作业参数相同，详细请参见 MySQL PostgreSQL Oracle Microsoft SQL Server SAP HANA MYCAT 分库这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。从这些数据源导出数据时，CDM使用JDBC接口抽取数据，源端作业参数相同，详细请参见 MongoDB 文档数据库服务（DDS）支持从MongoDB或DDS导出数据。参见 Redis 支持从开源Redis导出数据。参见 Apache Kafka DMS Kafka MRS Kafka 仅支持导出数据到云搜索服务。参见。云搜索服务 Elasticsearch 支持从云搜索服务或Elasticsearch导出数据。参见

来自：
帮助文档
数据治理中心 DataArts Studio
用户指南
数据集成
管理作业
新建表/文件迁移作业

天翼云最新活动

安全隔离版OpenClaw

OpenClaw云服务器专属“龙虾“套餐低至1.5折起

聚力AI赋能天翼云大模型专项

大模型特惠专区·Token Plan 轻享包低至9.9元起

青云志云端助力计划

一站式科研助手，海外资源安全访问平台，助力青年翼展宏图，平步青云

企业出海解决方案

助力您的业务扬帆出海，通达全球！

天翼云信创专区

“一云多芯、一云多态”,国产化软件全面适配，国产操作系统及硬件芯片支持丰富

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

天翼云最新活动

产品推荐

弹性伸缩服务 AS

弹性高性能计算 E-HPC

训推服务

公共算力服务

Token服务

应用托管

科研助手

一站式智算服务平台

智算一体机

推荐文档

客户端下载安装

玩转天翼云⑦：Linux扩展Swap分区的三种方法

提现规则

域名相关常见问题

产品优势