活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      翼MapReduce

      翼MapReduce

        • 产品动态
        • 产品简介
        • 产品定义
        • 产品优势
        • 功能特性
        • 多租户
        • 安全增强
        • 组件Web UI便捷访问
        • 可靠性增强
        • 作业管理
        • 自定义引导操作
        • 企业项目管理
        • 元数据
        • 集群管理
        • 应用场景
        • 术语解释
        • 与其他产品的关系
        • 权限管理
        • 约束与限制
        • 计费说明
        • 资源节点
        • 产品规格
        • 产品价格
        • 计费模式
        • 购买
        • 变更
        • 续订
        • 退订
        • 快速入门
        • 如何使用翼MapReduce
        • 创建集群
        • 上传示例数据和程序
        • 添加作业
        • 从零开始使用Kerberos认证集群
        • 删除集群
        • 用户指南
        • 准备用户
        • 创建MRS操作用户
        • 创建MRS自定义策略
        • IAM用户同步MRS说明
        • 配置集群
        • 创建方式简介
        • 快速创建集群
        • 快速创建Hadoop分析集群
        • 快速创建HBase查询集群
        • 快速创建Kafka流式集群
        • 快速创建ClickHouse集群
        • 快速创建实时分析集群
        • 创建自定义集群
        • 创建自定义拓扑集群
        • 添加集群标签
        • 授权安全通信
        • 配置弹性伸缩规则
        • 管理数据连接
        • 配置数据连接
        • 配置Ranger数据连接
        • 配置Hive数据连接
        • 通过引导操作安装第三方软件
        • 查看失败的集群操作任务
        • 查看历史集群信息
        • 管理集群
        • 登录集群
        • MRS集群节点简介
        • 登录集群节点
        • 如何确认Manager的主备管理节点
        • 集群概览
        • 集群列表简介
        • 查看集群状态
        • 查看集群基本信息
        • 查看集群补丁信息
        • 查看和定制集群监控指标
        • 管理组件和主机监控
        • 集群运维
        • 导入导出数据
        • 切换集群子网
        • 配置消息通知
        • 健康检查
        • 远程运维
        • 查看MRS服务操作日志
        • 删除集群
        • 节点管理
        • 扩容集群
        • 缩容集群
        • 管理主机(节点)操作
        • 隔离主机
        • 取消隔离主机
        • 作业管理
        • MRS作业简介
        • 运行MapReduce作业
        • 运行SparkSubmit作业
        • 运行HiveSql作业
        • 运行SparkSql作业
        • 运行Flink作业
        • 运行Kafka作业
        • 查看作业配置信息和日志
        • 停止作业
        • 删除作业
        • 使用OBS加密数据运行作业
        • 配置作业消息通知
        • 组件管理
        • 对象管理简介
        • 查看配置
        • 管理服务操作
        • 配置服务参数
        • 配置服务自定义参数
        • 同步服务配置
        • 管理角色实例操作
        • 配置角色实例参数
        • 同步角色实例配置
        • 退服和入服角色实例
        • 启动及停止集群
        • 同步集群配置
        • 导出集群的配置数据
        • 支持滚动重启
        • 告警管理
        • 查看告警列表
        • 查看事件列表
        • 查看与手动清除告警
        • 补丁管理
        • 补丁操作指导
        • 滚动补丁
        • 修复隔离主机补丁
        • 租户管理
        • 使用前须知
        • 租户简介
        • 添加租户
        • 添加子租户
        • 删除租户
        • 管理租户目录
        • 恢复租户数据
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列配置
        • 引导操作
        • 引导操作简介
        • 准备引导操作脚本
        • 查看执行记录
        • 添加引导操作
        • 修改引导操作
        • 删除引导操作
        • 使用MRS客户端
        • 安装客户端
        • 安装客户端(3.x及之后版本)
        • 安装客户端(3.x之前版本)
        • 更新客户端
        • 更新客户端(3.x及之后版本)
        • 更新客户端(3.x之前版本)
        • 各组件客户端使用实践
        • 使用ClickHouse客户端
        • 使用Flink客户端
        • 使用Flume客户端
        • 使用HBase客户端
        • 使用HDFS客户端
        • 使用Hive客户端
        • 使用Impala客户端
        • 使用Kafka客户端
        • 使用Kudu客户端
        • 使用Oozie客户端
        • 使用Storm客户端
        • 使用Yarn客户端
        • 配置存算分离
        • 存算分离简介
        • 配置存算分离集群(委托方式)
        • 配置存算分离集群(AKSK方式)
        • 使用存算分离集群
        • Flink对接OBS文件系统
        • Flume对接OBS文件系统
        • HDFS客户端对接OBS文件系统
        • Hive对接OBS文件系统
        • MapReduce对接OBS文件系统
        • Spark2x对接OBS文件系统
        • Sqoop对接外部存储系统
        • Hudi对接OBS文件系统
        • 访问MRS集群上托管的开源组件Web页面
        • 开源组件Web站点
        • 开源组件端口列表
        • 通过专线访问
        • 通过弹性公网IP访问
        • 通过Windows弹性云主机访问
        • 创建连接MRS集群的SSH隧道并配置浏览器
        • 访问集群Manager
        • 访问FusionInsight Manager(MRS 3.x及之后版本)
        • 访问MRS Manager(MRS 2.x及之前版本)
        • FusionInsight Manager操作指导(适用于3.x)
        • 从这里开始
        • FusionInsight Manager入门指导
        • 查询FusionInsight Manager版本号
        • 登录管理系统
        • 登录管理节点
        • 主页
        • 主页概述
        • 管理监控指标数据报表
        • 主机管理
        • 主机管理页面
        • 查看主机列表
        • 查看主机概览
        • 查看主机进程及资源
        • 主机维护操作
        • 启动、停止主机上的所有实例
        • 执行主机健康检查
        • 分配机架
        • 隔离主机
        • 导出主机信息
        • 资源概况
        • 分布
        • 趋势
        • 集群
        • 主机
        • 运维
        • 告警
        • 告警与事件概述
        • 配置阈值
        • 配置告警屏蔽状态
        • 日志
        • 在线检索日志
        • 下载日志
        • 健康检查
        • 查看健康检查任务
        • 管理健康检查报告
        • 修改健康检查配置
        • 备份恢复设置
        • 创建备份任务
        • 创建恢复任务
        • 其他任务管理说明
        • 审计
        • 审计管理页面概述
        • 配置审计日志转储
        • 租户资源
        • 多租户介绍
        • 简介
        • 技术原理
        • 多租户管理页面概述
        • 相关模型
        • 资源概述
        • 动态资源
        • 存储资源
        • 多租户使用
        • 使用说明
        • 流程概述
        • 使用Superior调度器的租户业务
        • 创建租户
        • 添加租户
        • 添加子租户
        • 添加用户并绑定租户的角色
        • 管理租户
        • 管理租户目录
        • 恢复租户数据
        • 删除租户
        • 管理资源
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列容量配置
        • 管理全局用户策略
        • 使用Capacity调度器的租户业务
        • 创建租户
        • 添加租户
        • 添加子租户
        • 添加用户并绑定租户的角色
        • 管理租户
        • 管理租户目录
        • 恢复租户数据
        • 删除租户
        • Capacity Scheduler模式下清除租户非关联队列
        • 管理资源
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列容量配置
        • 切换调度器
        • 系统设置
        • 权限设置
        • 用户管理
        • 创建用户
        • 修改用户信息
        • 导出用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改用户密码
        • 初始化用户密码
        • 导出认证凭据文件
        • 用户组管理
        • 角色管理
        • 安全策略
        • 配置密码策略
        • 配置私有属性
        • 对接设置
        • 配置SNMP北向参数
        • 配置Syslog北向参数
        • 配置监控指标数据转储
        • 导入证书
        • OMS管理
        • OMS维护页面概述
        • 修改OMS服务配置参数
        • 部件管理
        • 查看部件包
        • 集群管理
        • 配置客户端
        • 安装客户端
        • 使用客户端
        • 更新已安装客户端的配置
        • 管理集群
        • 集群管理概述
        • 滚动重启集群
        • 管理配置过期
        • 下载客户端
        • 修改集群属性
        • 管理集群配置
        • 静态服务池
        • 静态服务资源
        • 配置集群静态资源
        • 查看集群静态资源
        • 客户端管理
        • 管理客户端
        • 批量升级客户端
        • 批量刷新hosts文件
        • 管理服务
        • 服务管理概述
        • 其他服务管理操作
        • 服务详情概述
        • 执行角色实例主备倒换
        • 资源监控
        • 采集堆栈信息
        • 切换Ranger鉴权
        • 服务配置
        • 修改服务配置参数
        • 修改服务自定义配置参数
        • 集群互信管理
        • 集群互信概述
        • 修改Manager系统域名
        • 配置跨Manager集群互信
        • 配置跨集群互信后的用户权限
        • 配置定时备份告警与审计信息
        • 管理实例
        • 实例管理概述
        • 入服与退服实例
        • 管理实例配置
        • 查看实例配置文件
        • 实例组
        • 管理实例组
        • 查看实例组信息
        • 配置实例组参数
        • 修改FusionInsight Manager添加的路由表
        • 切换维护模式
        • 例行维护
        • 日志管理
        • 关于日志
        • Manager日志清单
        • 配置日志级别与文件大小
        • 配置审计日志本地备份数
        • 查看角色实例日志
        • 备份恢复管理
        • 备份恢复简介
        • 备份数据
        • 备份OMS数据
        • 备份DBService数据
        • 备份HBase元数据
        • 备份HBase业务数据
        • 备份NameNode数据
        • 备份HDFS业务数据
        • 备份Hive业务数据
        • 备份Kafka元数据
        • 恢复数据
        • 恢复OMS数据
        • 恢复DBService数据
        • 恢复HBase元数据
        • 恢复HBase业务数据
        • 恢复NameNode数据
        • 恢复HDFS业务数据
        • 恢复Hive业务数据
        • 恢复Kafka元数据
        • 启用集群间拷贝功能
        • 管理本地快速恢复任务
        • 修改备份任务
        • 查看备份恢复任务
        • 安全管理
        • 安全概述
        • 权限模型
        • 权限机制
        • 认证策略
        • 鉴权策略
        • 用户帐号一览表
        • 默认权限信息一览
        • FusionInsight Manager安全功能
        • 帐户管理
        • 帐户安全设置
        • 解锁LDAP用户和管理帐户
        • 解锁系统内部用户
        • 修改集群组件鉴权配置开关
        • 使用普通模式集群用户在非集群节点登录
        • 修改系统用户密码
        • 修改admin密码
        • 修改操作系统用户密码
        • 修改系统内部用户密码
        • 修改Kerberos管理员密码
        • 修改OMS Kerberos管理员密码
        • 修改LDAP管理员和LDAP用户密码(含OMS LDAP)
        • 修改LDAP管理帐户密码
        • 修改组件运行用户密码
        • 修改默认数据库用户密码
        • 修改OMS数据库管理员密码
        • 修改OMS数据库访问用户密码
        • 修改组件数据库用户密码
        • 修改DBService数据库omm用户密码
        • 证书管理
        • 更换CA证书
        • 更换HA证书
        • 安全加固
        • 加固策略
        • 配置受信任IP访问LDAP
        • 加密HFile和WAL内容
        • 安全配置
        • 配置HBase允许修改操作的IP地址白名单
        • 更新集群密钥
        • 加固LDAP
        • 配置Kafka数据传输加密
        • 配置HDFS数据传输加密
        • 配置Controller与Agent间通信加密
        • 更新omm用户ssh密钥
        • 安全维护
        • 帐户维护建议
        • 密码维护建议
        • 日志维护建议
        • 安全声明
        • 告警参考(适用于MRS 3.x版本)
        • ALM-12001 审计日志转储失败
        • ALM-12004 OLdap资源异常
        • ALM-12005 OKerberos资源异常
        • ALM-12006 节点故障
        • ALM-12007 进程故障
        • ALM-12010 Manager主备节点间心跳中断
        • ALM-12011 Manager主备节点同步数据异常
        • ALM-12014 设备分区丢失
        • ALM-12015 设备分区文件系统只读
        • ALM-12016 CPU使用率超过阈值
        • ALM-12017 磁盘容量不足
        • ALM-12018 内存使用率超过阈值
        • ALM-12027 主机PID使用率超过阈值
        • ALM-12028 主机D状态进程数超过阈值
        • ALM-12033 慢盘故障
        • ALM-12034 周期备份任务失败
        • ALM-12035 恢复任务失败后数据状态未知
        • ALM-12038 监控指标转储失败
        • ALM-12039 OMS数据库主备不同步
        • ALM-12040 系统熵值不足
        • ALM-12041 关键文件权限异常
        • ALM-12042 关键文件配置异常
        • ALM-12045 网络读包丢包率超过阈值
        • ALM-12046 网络写包丢包率超过阈值
        • ALM-12047 网络读包错误率超过阈值
        • ALM-12048 网络写包错误率超过阈值
        • ALM-12049 网络读吞吐率超过阈值
        • ALM-12050 网络写吞吐率超过阈值
        • ALM-12051 磁盘Inode使用率超过阈值
        • ALM-12052 TCP临时端口使用率超过阈值
        • ALM-12053 主机文件句柄使用率超过阈值
        • ALM-12054 证书文件失效
        • ALM-12055 证书文件即将过期
        • ALM-12057 元数据未配置周期备份到第三方服务器的任务
        • ALM-12061 进程使用率超过阈值
        • ALM-12062 OMS参数配置同集群规模不匹配
        • ALM-12063 磁盘不可用
        • ALM-12064 主机随机端口范围配置与集群使用端口冲突
        • ALM-12066 节点间互信失效
        • ALM-12067 tomcat资源异常
        • ALM-12068 acs资源异常
        • ALM-12069 aos资源异常
        • ALM-12070 controller资源异常
        • ALM-12071 httpd资源异常
        • ALM-12072 floatip资源异常
        • ALM-12073 cep资源异常
        • ALM-12074 fms资源异常
        • ALM-12075 pms资源异常
        • ALM-12076 gaussDB资源异常
        • ALM-12077 omm用户过期
        • ALM-12078 omm密码过期
        • ALM-12079 omm用户即将过期
        • ALM-12080 omm密码即将过期
        • ALM-12081 ommdba用户过期
        • ALM-12082 ommdba用户即将过期
        • ALM-12083 ommdba密码即将过期
        • ALM-12084 ommdba密码过期
        • ALM-12085 服务审计日志转储失败
        • ALM-12087 系统处于升级观察期
        • ALM-12089 节点间网络互通异常
        • ALM-12101 AZ不健康
        • ALM-12102 AZ高可用组件未按容灾需求部署
        • ALM-12110 获取ECS临时ak/sk失败
        • ALM-13000 ZooKeeper服务不可用
        • ALM-13001 ZooKeeper可用连接数不足
        • ALM-13002 ZooKeeper直接内存使用率超过阈值
        • ALM-13003 ZooKeeper进程垃圾回收(GC)时间超过阈值
        • ALM-13004 ZooKeeper堆内存使用率超过阈值
        • ALM-13005 ZooKeeper中组件顶层目录的配额设置失败
        • ALM-13006 Znode数量或容量超过阈值
        • ALM-13007 ZooKeeper客户端可用连接数不足
        • ALM-13008 ZooKeeper Znode数量使用率超出阈值
        • ALM-13009 ZooKeeper Znode容量使用率超出阈值
        • ALM-13010 配置quota的目录Znode使用率超出阈值
        • ALM-14000 HDFS服务不可用
        • ALM-14001 HDFS磁盘空间使用率超过阈值
        • ALM-14002 DataNode磁盘空间使用率超过阈值
        • ALM-14003 丢失的HDFS块数量超过阈值
        • ALM-14006 HDFS文件数超过阈值
        • ALM-14007 NameNode堆内存使用率超过阈值
        • ALM-14008 DataNode堆内存使用率超过阈值
        • ALM-14009 Dead DataNode数量超过阈值
        • ALM-14010 NameService服务异常
        • ALM-14011 DataNode数据目录配置不合理
        • ALM-14012 Journalnode数据不同步
        • ALM-14013 NameNode FsImage文件更新失败
        • ALM-14014 NameNode进程垃圾回收(GC)时间超过阈值
        • ALM-14015 DataNode进程垃圾回收(GC)时间超过阈值
        • ALM-14016 DataNode直接内存使用率超过阈值
        • ALM-14017 NameNode直接内存使用率超过阈值
        • ALM-14018 NameNode非堆内存使用率超过阈值
        • ALM-14019 DataNode非堆内存使用率超过阈值
        • ALM-14020 HDFS目录条目数量超过阈值
        • ALM-14021 NameNode RPC处理平均时间超过阈值
        • ALM-14022 NameNode RPC队列平均时间超过阈值
        • ALM-14023 总副本预留磁盘空间所占比率超过阈值
        • ALM-14024 租户空间使用率超过阈值
        • ALM-14025 租户文件对象使用率超过阈值
        • ALM-14026 DataNode块数超过阈值
        • ALM-14027 DataNode磁盘故障
        • ALM-14028 待补齐的块数超过阈值
        • ALM-14029 单副本的块数超过阈值
        • ALM-16000 连接到HiveServer的session数占最大允许数的百分比超过阈值
        • ALM-16001 Hive数据仓库空间使用率超过阈值
        • ALM-16002 Hive SQL执行成功率低于阈值
        • ALM-16003 Background线程使用率超过阈值
        • ALM-16004 Hive服务不可用
        • ALM-16005 Hive服务进程堆内存使用超出阈值
        • ALM-16006 Hive服务进程直接内存使用超出阈值
        • ALM-16007 Hive GC 时间超出阈值
        • ALM-16008 Hive服务进程非堆内存使用超出阈值
        • ALM-16009 Map数超过阈值
        • ALM-16045 Hive数据仓库被删除
        • ALM-16046 Hive数据仓库权限被修改
        • ALM-16047 HiveServer已从Zookeeper注销
        • ALM-16048 Tez或者Spark库路径不存在
        • ALM-17003 Oozie服务不可用
        • ALM-17004 Oozie堆内存使用率超过阈值
        • ALM-17005 Oozie非堆内存使用率超过阈值
        • ALM-17006 Oozie直接内存使用率超过阈值
        • ALM-17007 Oozie进程垃圾回收(GC)时间超过阈值
        • ALM-18000 Yarn服务不可用
        • ALM-18002 NodeManager心跳丢失
        • ALM-18003 NodeManager不健康
        • ALM-18008 ResourceManager堆内存使用率超过阈值
        • ALM-18009 JobHistoryServer堆内存使用率超过阈值
        • ALM-18010 ResourceManager进程垃圾回收(GC)时间超过阈值
        • ALM-18011 NodeManager进程垃圾回收(GC)时间超过阈值
        • ALM-18012 JobHistoryServer进程垃圾回收(GC)时间超过阈值
        • ALM-18013 ResourceManager直接内存使用率超过阈值
        • ALM-18014 NodeManager直接内存使用率超过阈值
        • ALM-18015 JobHistoryServer直接内存使用率超过阈值
        • ALM-18016 ResourceManager非堆内存使用率超过阈值
        • ALM-18017 NodeManager非堆内存使用率超过阈值
        • ALM-18018 NodeManager堆内存使用率超过阈值
        • ALM-18019 JobHistoryServer非堆内存使用率超过阈值
        • ALM-18020 Yarn任务执行超时
        • ALM-18021 Mapreduce服务不可用
        • ALM-18022 Yarn队列资源不足
        • ALM-18023 Yarn任务挂起数超过阈值
        • ALM-18024 Yarn任务挂起内存量超阈值
        • ALM-18025 Yarn被终止的任务数超过阈值
        • ALM-18026 Yarn上运行失败的任务数超过阈值
        • ALM-19000 HBase服务不可用
        • ALM-19006 HBase容灾同步失败
        • ALM-19007 HBase GC时间超出阈值
        • ALM-19008 HBase服务进程堆内存使用率超出阈值
        • ALM-19009 HBase服务进程直接内存使用率超出阈值
        • ALM-19011 RegionServer的Region数量超出阈值
        • ALM-19012 HBase系统表目录或文件丢失
        • ALM-19013 region处在RIT状态的时长超过阈值
        • ALM-19014 在ZooKeeper上的容量配额使用率严重超过阈值
        • ALM-19015 在ZooKeeper上的数量配额使用率超过阈值
        • ALM-19016 在ZooKeeper上的数量配额使用率严重超过阈值
        • ALM-19017 在ZooKeeper上的容量配额使用率超过阈值
        • ALM-19018 HBase合并队列超出阈值
        • ALM-19019 HBase容灾等待同步的HFile文件数量超过阈值
        • ALM-19020 HBase容灾等待同步的wal文件数量超过阈值
        • ALM-20002 Hue服务不可用
        • ALM-24000 Flume服务不可用
        • ALM-24001 Flume Agent异常
        • ALM-24003 Flume Client连接中断
        • ALM-24004 Flume读取数据异常
        • ALM-24005 Flume传输数据异常
        • ALM-24006 Flume Server堆内存使用率超过阈值
        • ALM-24007 Flume Server直接内存使用率超过阈值
        • ALM-24008 Flume Server非堆内存使用率超过阈值
        • ALM-24009 Flume Server垃圾回收(GC)时间超过阈值
        • ALM-24010 Flume证书文件非法或已损坏
        • ALM-24011 Flume证书文件即将过期
        • ALM-24012 Flume证书文件已过期
        • ALM-24013 Flume MonitorServer证书文件非法或已损坏
        • ALM-24014 Flume MonitorServer证书文件即将过期
        • ALM-24015 Flume MonitorServer证书文件已过期
        • ALM-25000 LdapServer服务不可用
        • ALM-25004 LdapServer数据同步异常
        • ALM-25005 Nscd服务异常
        • ALM-25006 Sssd服务异常
        • ALM-25500 KrbServer服务不可用
        • ALM-26051 Storm服务不可用
        • ALM-26052 Storm服务可用Supervisor数量小于阈值
        • ALM-26053 Storm Slot使用率超过阈值
        • ALM-26054 Nimbus堆内存使用率超过阈值
        • ALM-27001 DBService服务不可用
        • ALM-27003 DBService主备节点间心跳中断
        • ALM-27004 DBService主备数据不同步
        • ALM-27005 数据库连接数使用率超过阈值
        • ALM-27006 数据目录磁盘空间使用率超过阈值
        • ALM-28001 Spark服务不可用(2.x及以前版本)
        • ALM-27007 数据库进入只读模式
        • ALM-29000 Impala服务不可用
        • ALM-29004 Impalad进程内存占用率超过阈值
        • ALM-29005 Impalad JDBC连接数超过阈值
        • ALM-29006 Impalad ODBC连接数超过阈值
        • ALM-29100 Kudu服务不可用
        • ALM-29104 Tserver进程内存占用率超过阈值
        • ALM-29106 Tserver进程CPU占用率过高
        • ALM-29107 Tserver进程内存使用百分比超过阈值
        • ALM-38000 Kafka服务不可用
        • ALM-38001 Kafka磁盘容量不足
        • ALM-38002 Kafka堆内存使用率超过阈值
        • ALM-38004 Kafka直接内存使用率超过阈值
        • ALM-38005 Broker进程垃圾回收(GC)时间超过阈值
        • ALM-38006 Kafka未完全同步的Partition百分比超过阈值
        • ALM-38007 Kafka默认用户状态异常
        • ALM-38008 Kafka数据目录状态异常
        • ALM-38009 Broker磁盘IO繁忙
        • ALM-38010 存在单副本的Topic
        • ALM-43001 Spark2x服务不可用
        • ALM-43006 JobHistory2x进程堆内存使用超出阈值
        • ALM-43007 JobHistory2x进程非堆内存使用超出阈值
        • ALM-43008 JobHistory2x进程直接内存使用超出阈值
        • ALM-43009 JobHistory2x进程GC时间超出阈值
        • ALM-43010 JDBCServer2x进程堆内存使用超出阈值
        • ALM-43011 JDBCServer2x进程非堆内存使用超出阈值
        • ALM-43012 JDBCServer2x进程直接内存使用超出阈值
        • ALM-43013 JDBCServer2x进程GC时间超出阈值
        • ALM-43017 JDBCServer2x进程Full GC次数超出阈值
        • ALM-43018 JobHistory2x进程Full GC次数超出阈值
        • ALM-43019 IndexServer2x进程堆内存使用超出阈值
        • ALM-43020 IndexServer2x进程非堆内存使用超出阈值
        • ALM-43021 IndexServer2x进程直接内存使用超出阈值
        • ALM-43022 IndexServer2x进程GC时间超出阈值
        • ALM-43023 IndexServer2x进程Full GC次数超出阈值
        • ALM-44004 Presto Coordinator资源组排队任务超过阈值
        • ALM-44005 Presto Coordinator进程垃圾收集时间超出阈值
        • ALM-44006 Presto Worker进程垃圾收集时间超出阈值
        • ALM-45175 OBS元数据接口调用平均时间超过阈值
        • ALM-45176 OBS元数据接口调用成功率低于阈值
        • ALM-45177 OBS数据读操作接口调用成功率低于阈值
        • ALM-45178 OBS数据写操作接口调用成功率低于阈值
        • ALM-45275 Ranger服务不可用
        • ALM-45276 RangerAdmin状态异常
        • ALM-45277 RangerAdmin堆内存使用率超过阈值
        • ALM-45278 RangerAdmin直接内存使用率超过阈值
        • ALM-45279 RangerAdmin非堆内存使用率超过阈值
        • ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值
        • ALM-45281 UserSync堆内存使用率超过阈值
        • ALM-45282 UserSync直接内存使用率超过阈值
        • ALM-45283 UserSync非堆内存使用率超过阈值
        • ALM-45284 UserSync垃圾回收(GC)时间超过阈值
        • ALM-45285 TagSync堆内存使用率超过阈值
        • ALM-45286 TagSync直接内存使用率超过阈值
        • ALM-45287 TagSync非堆内存使用率超过阈值
        • ALM-45288 TagSync垃圾回收(GC)时间超过阈值
        • ALM-45425 ClickHouse服务不可用
        • ALM-45426 ClickHouse服务在ZooKeeper的数量配额使用率超过阈值
        • ALM-45427 ClickHouse服务在ZooKeeper的容量配额使用率超过阈值
        • ALM-45736 Guardian服务不可用
        • MRS Manager操作指导(适用于2.x及之前)
        • MRS Manager简介
        • 查看集群运行任务
        • 监控管理
        • 系统概览
        • 管理服务和主机监控
        • 管理资源分布
        • 配置监控指标转储
        • 告警管理
        • 查看与手动清除告警
        • 配置监控与告警阈值
        • 配置Syslog北向参数
        • 配置SNMP北向参数
        • 对象管理
        • 对象管理简介
        • 查看配置
        • 管理服务操作
        • 配置服务参数
        • 配置服务自定义参数
        • 同步服务配置
        • 管理角色实例操作
        • 配置角色实例参数
        • 同步角色实例配置
        • 退服和入服务角色实例
        • 管理主机操作
        • 隔离主机
        • 取消隔离主机
        • 启动及停止集群
        • 同步集群配置
        • 导出集群的配置数据
        • 日志管理
        • 关于日志
        • Manager日志清单
        • 查看及导出审计日志
        • 导出服务日志
        • 配置审计日志导出参数
        • 健康检查管理
        • 执行健康检查
        • 查看并导出检查报告
        • 配置健康检查报告保存数
        • 管理健康检查报告
        • DBService健康检查指标项说明
        • Flume 健康检查指标项说明
        • HBase健康检查指标项说明
        • Host健康检查指标项说明
        • HDFS健康检查指标项说明
        • Hive健康检查指标项说明
        • Kafka健康检查指标项说明
        • KrbServer健康检查指标项说明
        • LdapServer健康检查指标项说明
        • Loader健康检查指标项说明
        • MapReduce健康检查指标项说明
        • OMS健康检查指标项说明
        • Spark健康检查指标项说明
        • Storm健康检查指标项说明
        • Yarn健康检查指标项说明
        • ZooKeeper健康检查指标项说明
        • 静态服务池管理
        • 查看静态服务池状态
        • 配置静态服务池
        • 租户管理
        • 租户简介
        • 添加租户
        • 添加子租户
        • 删除租户
        • 管理租户目录
        • 恢复租户数据
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列配置
        • 备份与恢复
        • 备份与恢复简介
        • 备份元数据
        • 恢复元数据
        • 修改备份任务
        • 查看备份恢复任务
        • 安全管理
        • 未开启Kerberos认证集群中的默认用户清单
        • 开启Kerberos认证集群中的默认用户清单
        • 修改操作系统用户密码
        • 修改admin密码
        • 修改Kerberos管理员密码
        • 修改LDAP管理员和LDAP用户密码
        • 修改组件运行用户密码
        • 修改OMS数据库管理员密码
        • 修改OMS数据库数据访问用户密码
        • 修改组件数据库用户密码
        • 更换HA证书
        • 更新集群密钥
        • 权限管理
        • 创建角色
        • 创建用户组
        • 创建用户
        • 修改用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改操作用户密码
        • 初始化系统用户密码
        • 下载用户认证文件
        • 修改密码策略
        • MRS多用户权限管理
        • MRS集群中的用户与权限
        • 开启Kerberos认证集群中的默认用户清单
        • 创建角色
        • 创建用户组
        • 创建用户
        • 修改用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改操作用户密码
        • 初始化系统用户密码
        • 下载用户认证文件
        • 修改密码策略
        • 配置跨集群互信
        • 配置并使用互信集群的用户
        • 配置MRS多用户访问OBS细粒度权限
        • 补丁操作指导
        • 安装与卸载补丁
        • 支持滚动补丁
        • 修复隔离主机补丁
        • 支持滚动重启
        • 安全性说明
        • 集群(未启用Kerberos认证)安全配置建议
        • 安全认证原理和认证机制
        • 高危操作一览表
        • 附录
        • MRS 3.x版本操作注意事项
        • 最佳实践
        • 数据分析
        • 使用Hive加载HDFS数据并分析图书评分情况
        • 通过Flink作业处理OBS数据
        • 常见问题
        • 计费类
        • 购买类
        • 操作类
        • 集群创建类
        • 帐号密码类
        • 帐号权限类
        • 客户端使用类
        • Web页面访问类
        • 监控告警类
        • 性能优化类
        • 作业开发类
        • 集群升级/补丁
        • 集群访问类
        • 大数据业务开发
        • API使用类
        • 集群管理类
        • Kerberos使用
        • 元数据管理
        • 文档下载
        • 翼MapReduce服务用户操作指南
        • 翼MapReduce服务组件操作指南
        • 翼MapReduce服务故障排除
        • 相关协议
        • 天翼云翼MapReduce服务协议
          无相关产品

          本页目录

          帮助中心翼MapReduce用户指南配置集群配置弹性伸缩规则
          配置弹性伸缩规则
          更新时间 2023-12-11 00:03:21
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2023-12-11 00:03:21
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本章节主要介绍如何配置弹性伸缩规则。

          背景信息

          在大数据应用,尤其是实时分析处理数据的场景中,常常需要根据数据量的变化动态调整集群节点数量以增减资源。MRS的弹性伸缩规则功能支持根据集群负载对集群的Task节点进行弹性伸缩。如果数据量是按照周期进行有规律的变化,用户可以按照固定时间段来自动调整Task节点数量范围,从而在数据量变化前提前完成集群的扩缩容。

          • 弹性伸缩规则:根据集群实时负载指标对Task节点数量进行调整,数据量变化后触发扩缩容,有一定的延后性。
          • 资源计划:按时间段设置Task节点数量范围,若数据量变化存在周期性规律,则可通过资源计划在数据量变化前提前完成集群的扩缩容,避免出现增加或减少资源的延后。

          弹性伸缩规则与资源计划均可触发弹性伸缩,两者必须至少配置其中一种,也可以叠加使用。资源计划与基于负载的弹性伸缩规则叠加使用可以使得集群节点的弹性更好,足以应对偶尔超出预期的数据峰值出现。

          当某些业务场景要求在集群扩缩容之后,根据节点数量的变化对资源分配或业务逻辑进行更改时,手动扩缩容的场景客户可以登录集群节点进行操作。对于弹性伸缩场景,MRS支持通过自定义弹性伸缩自动化脚本来解决。自动化脚本可以在弹性伸缩前后执行相应操作,自动适应业务负载的变化,免去了人工操作。同时,自动化脚本给用户实现个性需求提供了途径,完全自定义的脚本与多个可选的执行时机基本可以满足用户的各项需求,使弹性伸缩更具灵活性。

          • 弹性伸缩规则:

          −用户对于一个集群,可以同时设置扩容、缩容最多各5条弹性伸缩规则。

          −系统根据用户的配置顺序从前到后依次判断规则,先扩容,后缩容。请尽量把重要的策略放在前面,以防一次扩容或缩容无法达到预期效果而进行反复触发。

          −比对因子包括大于、大于等于、小于、小于等于。

          −集群连续5n(n默认值为1)分钟持续满足配置的指标阈值后才能触发扩容或者缩容。

          −每次扩容或者缩容后,存在一个冷却时间,冷却时间默认为20分钟,最小值为0。

          −单次扩容或者缩容的节点数,最小1个节点,最大100个节点。

          • 资源计划(按时间段设置Task节点数量范围):

          −用户可以按时间段设置集群Task节点的最大数量和最小数量,当集群Task节点数不满足当前时间资源计划节点范围要求时,系统触发扩容或缩容。

          −用户最多可以为一个集群设置5条资源计划。

          −资源计划周期以天为单位,起始时间与结束时间可以设置为00:00-23:59之间的任意时间点。起始时间早于结束时间至少30分钟。不同资源计划配置的时间段不可交叉。

          −资源计划触发扩容或缩容后,存在10分钟的冷却时间,冷却时间内不会再次触发弹性伸缩。

          −当启用资源计划时,在除配置资源计划配置时间段的其他时间内,集群Task节点数量会被限定在用户配置的默认节点数量范围内。

          −当不启用资源计划时,集群不会将Task节点数量限制在默认节点数量范围内。

          • 自动化脚本:

          −用户可以设置自定义脚本,当弹性伸缩触发时,在集群节点上自动运行。

          −用户最多可以为一个集群设置10个自动化脚本。

          −可以指定自动化脚本某种或多种类型的节点上执行。

          −脚本执行时机可以是扩容前、扩容后、缩容前或缩容后。

          −使用自动化脚本前,请先将脚本上传到集群虚拟机或与集群同region的OBS文件系统中。集群虚拟机上的脚本只能在已有节点上执行,若脚本需要在新扩容的节点上执行,请将脚本上传到OBS。

          进入弹性伸缩配置界面

          弹性伸缩功能可以创建集群时,在高级配置参数中进行配置,也可以集群创建成功后通过管理控制台对集群内的Task节点组配置相关规则。

          创建集群时配置弹性伸缩

          1.登录MRS管理控制台。

          2.在创建包含有Task类型节点组件的集群时,参考创建自定义集群配置集群软件配置和硬件配置信息后,在“高级配置”页签的弹性伸缩栏,打开对应Task节点类型后的开关按钮,即可进行弹性伸缩规则及资源计划的配置或修改。

          您可以参考以下场景进行配置:

          • 场景1:单独配置弹性伸缩规则
          • 场景2:单独使用资源计划
          • 场景3:弹性伸缩规则与资源计划叠加使用

          为已有集群配置弹性伸缩

          1.登录MRS管理控制台。

          2.选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称。进入集群详情页面。

          3.在“节点管理”页签Task类型节点组的“操作”列单击“弹性伸缩”,即可进入“弹性伸缩”页面。

          说明
          • 弹性伸缩仅用于Task节点组,当集群内没有Task节点时,先单击“配置Task节点”增加Task节点后再继续配置。

          • 对于MRS 3.x及之后版本,“配置Task节点”仅适用于分析集群、流试集群和混合集群。MRS 3.x及之后版本的自定义集群请参考 节点管理章节 [扩容集群](https://www.ctyun.cn/document/10000070/10121635)中的添加Task节点添加task类型的节点。

          4.打开弹性伸缩开关按钮,即可进行弹性伸缩规则及资源计划的配置或修改。

          您可以参考以下场景进行配置:

          • 场景1:单独配置弹性伸缩规则
          • 场景2:单独使用资源计划
          • 场景3:弹性伸缩规则与资源计划叠加使用

          场景1:单独配置弹性伸缩规则

          例如业务场景如下:

          需要根据Yarn资源使用情况动态调整节点数,在Yarn可用内存低于20%时扩容5个节点,可用内存高于70%时缩容5个节点。Task节点组最高不超过10个节点,最低不少于1个节点。

          1.进入弹性伸缩配置界面后,配置弹性伸缩规则。

          • 配置节点默认范围

          输入Task实例弹性伸缩的数量范围,此约束应用于所有扩容缩容规则,取值范围为0~500。

          例如本业务场景中,配置为1~10。

          • 配置弹性伸缩规则

          需要配置扩容或者缩容规则,否则弹性伸缩将不会启用。

          a. 规则类型选择“扩容”或者“缩容”。

          b. 单击“添加规则”,进入规则编辑页面。

          c. 配置“规则名称”、“如果”、“持续”、“添加”、“冷却时间”。

          d. 单击“确定”。

          您可以在弹性伸缩页面,扩容或者缩容区域查看、编辑或删除配置的规则。您可以继续添加并配置多条规则。

          2.(可选)配置自动化脚本。

          在“高级配置”项选择“现在配置 > 添加”或者单击“添加自动化脚本”按钮,进入“自动化脚本”配置页面。

          MRS 3.x版本集群不支持该操作。

          a.配置“名称”、“脚本路径”、“执行节点类型”、“参数”、“执行时机”、“失败操作”。参数详情请参考下表 自动化脚本配置说明。

          b.单击“确定”保存自动化脚本配置。

          3.单击“确定”,完成弹性伸缩规则设置。

          说明
          如果是为已有集群配置弹性伸缩的场景,需勾选“我同意授权MRS服务根据以上策略自动进行节点扩容/缩容操作”。

          场景2:单独使用资源计划

          当数据量以天为周期有规律的变化,并且希望在数据量变化前提前完成集群的扩缩容,可以使用MRS的资源计划配置在规定时间内按计划调整Task节点数量。

          例如:

          某项实时处理业务数据量在每天7:00-13:00出现高峰,其他时间保持平稳低水平。假设我们使用MRS流式集群来处理该业务数据,在7:00-13:00时,为应对数据量高峰需要5个Task节点的资源,其他时间只需要2个Task节点。

          1.进入弹性伸缩配置界面后,配置资源计划。

          a.节点数量范围的“默认范围”设置为“2-2”,表示除资源计划规定时间范围外,其他时间Task节点数量固定为2个。

          b.单击默认范围下方的“配置指定时间段的节点数量范围”或者“添加资源计划”。

          c.配置“时间范围”和“节点数量范围”。

          例如此处“时间范围”设置为“07:00-13:00”,“节点数量范围”设置为“5-5”,表示在该时间范围内,Task节点数量固定为5个。

          参数详情请参考下表 资源计划配置项说明,可以单击“配置指定时间段的节点数量范围”配置多条资源计划。

          说明
          • 如果没有配置指定时间段的节点数量范围,则节点数量范围以“默认范围”为准。

          • 如果配置了指定时间段的节点数量范围,则在这个时间范围内,以配置的“节点数量范围”为准。不在配置的时间范围时,则以“默认范围”为准。

          2.(可选)配置自动化脚本。

          在“高级配置”项选择“现在配置 > 添加”或者单击“添加自动化脚本”按钮,进入“自动化脚本”配置页面。

          MRS 3.x版本集群不支持该操作。

          a.配置“名称”、“脚本路径”、“执行节点类型”、“参数”、“执行时机”、“失败操作”。参数详情请参考下方表:自动化脚本配置说明。

          b.单击“确定”保存自动化脚本配置。

          3.单击“确定”,完成弹性伸缩规则设置。

          说明
          如果是为已有集群配置弹性伸缩的场景,需勾选“我同意授权MRS服务根据以上策略自动进行节点扩容/缩容操作”。

          场景3:弹性伸缩规则与资源计划叠加使用

          假如数据量并非非常平稳,有可能出现超出预期的波动,因此并不能保证固定Task节点范围一定可以满足业务场景,我们需要在资源计划的基础上根据实时负载对Task节点数量进行调整。

          例如业务场景如下:

          某项实时处理业务数据量在每天7:00-13:00出现规律性变化,但是数据量变化并非非常平稳。假设在7:00-13:00期间,需要Task节点的数量范围是5-8个,其他时间需要Task节点数量外围为2-4个。因此可以在资源计划的基础上,设置基于负载的弹性伸缩规则,以实现当数据量超出预期后,Task节点数量可以在资源计划规定的范围内根据负载情况进行浮动,但不会超出该规定范围。资源计划触发时,会以变化最小的方式使节点数量满足计划规定范围,即如果需要扩容则扩容到计划节点数量范围的下限,如果需要缩容则缩容到计划节点数量范围的上限。

          1.进入弹性伸缩配置界面后,配置弹性伸缩规则。

          • 节点数量范围的默认范围:

          输入Task实例弹性伸缩的数量范围,此约束应用于所有扩容缩容规则。

          例如本场景中,配置为2~4个。

          • 伸缩规则:

          需要配置扩容或者缩容,否则弹性伸缩将不会启用。

          a. 规则类型选择“扩容”或者“缩容”。

          b. 单击“添加规则”,进入“添加规则”页面。

          c. 配置“规则名称”、“如果”、“持续”、“添加”、“冷却时间”。

          d. 单击“确定”。

          您可以在弹性伸缩页面,扩容或者缩容区域查看配置的规则。

          2.配置资源计划。

          a.单击节点默认范围下方的“配置指定时间段的节点数量范围”或者“添加资源计划”。

          b.配置“时间范围”和“节点数量范围”。

          例如此处“时间范围”设置为“07:00-13:00”,“节点数量范围”设置为“5~8”。

          参数详情请参考下表 资源计划配置项说明,可以单击“配置指定时间段的节点数量范围”或者“添加资源计划”按钮配置多条资源计划。

          说明
          • 如果没有配置指定时间段的节点数量范围,则节点数量范围以“默认范围”为准。

          • 如果配置了指定时间段的节点数量范围,则在这个时间范围内,以配置的“节点数量范围”为准。不在配置的时间范围时,则以“默认范围”为准。

          3.(可选)配置自动化脚本。

          在“高级配置”项选择“现在配置 > 添加”或者单击“添加自动化脚本”按钮,进入“自动化脚本”配置页面。

          MRS 3.x版本集群不支持该操作。

          a.配置“名称”、“脚本路径”、“执行节点类型”、“参数”、“执行时机”、“失败操作”。参数详情请参考下方表格 自动化脚本配置说明。

          b.单击“确定”保存自动化脚本配置。

          4.单击“确定”,完成弹性伸缩规则设置。

          说明
          如果是为已有集群配置弹性伸缩的场景,需勾选“我同意授权MRS服务根据以上策略自动进行节点扩容/缩容操作”。

          相关信息

          在添加规则时,可以参考下表配置相应的指标。

          弹性伸缩指标列表

          集群类型指标名称数值类型说明

          流式集群

          StormSlotAvailable

          整型

          Storm组件的可用slot数。

          取值范围为[0~2147483646]。

          StormSlotAvailablePercentage

          百分比

          Storm组件可用slot百分比。是可用slot数与总slot数的比值。

          取值范围为[0~100]。

          StormSlotUsed

          整型

          Storm组件的已用slot数。

          取值范围为[0~2147483646]。

          StormSlotUsedPercentage

          百分比

          Storm组件已用slot百分比。是已用slot数与总slot数的比值。

          取值范围为[0~100]。

          StormSupervisorMemAverageUsage

          整形

          Storm组件Supervisor的内存平均使用量。

          取值范围为[0~2147483646]。

          StormSupervisorMemAverageUsagePercentage

          百分比

          Storm组件Supervisor进程使用的内存占系统总内存的平均百分比。

          取值范围[0 ~   100]。

          StormSupervisorCPUAverageUsagePercentage

          百分比

          Storm组件Supervisor进程使用的CPU占系统总CPU的平均百分比。

          取值范围[0 ~   6000]。

          分析集群

          YARNAppPending

          整型

          YARN组件挂起的任务数。

          取值范围为[0~2147483646]。

          YARNAppPendingRatio

          比率

          YARN组件挂起的任务数比例。是YARN挂起的任务数与YARN运行中的任务数比值。

          取值范围为[0~2147483646]。

          YARNAppRunning

          整型

          YARN组件运行中的任务数。

          取值范围为[0~2147483646]。

          YARNContainerAllocated

          整型

          YARN组件中已分配的container个数。

          取值范围为[0~2147483646]。

          YARNContainerPending

          整型

          YARN组件挂起的container个数。

          取值范围为[0~2147483646]。

          YARNContainerPendingRatio

          比率

          YARN组件挂起的container比率。是挂起的container数与运行中的container数的比值。

          取值范围为[0~2147483646]。

          YARNCPUAllocated

          整型

          YARN组件已分配的虚拟CPU核心数。

          取值范围为[0~2147483646]。

          YARNCPUAvailable

          整型

          YARN组件可用的虚拟CPU核心数。

          取值范围为[0~2147483646]。

          YARNCPUAvailablePercentage

          百分比

          YARN组件可用虚拟CPU核心数百分比。是可用虚拟CPU核心数与总虚拟CPU核心数比值。

          取值范围为[0~100]。

          YARNCPUPending

          整型

          YARN组件挂起的虚拟CPU核心数。

          取值范围为[0~2147483646]。

          YARNMemoryAllocated

          整型

          YARN组件已分配内存大小。单位为MB。

          取值范围为[0~2147483646]。

          YARNMemoryAvailable

          整型

          YARN组件可用内存大小。单位为MB。

          取值范围为[0~2147483646]。

          YARNMemoryAvailablePercentage

          百分比

          YARN组件可用内存百分比。是YARN组件可用内存大小与YARN组件总内存大小的比值。

          取值范围为[0~100]。

          YARNMemoryPending

          整型

          YARN组件挂起的内存大小。

          取值范围为[0~2147483646]。

          说明
          • 上表中指标数值类型为百分比或比率时,有效数值可精确到百分位。其中百分比类型指标数值为去除百分号(%)后的小数值,如16.80即代表16.80%。

          • 混合集群的支持分析集群和流式集群的所有指标。

          在添加资源计划时,可以参考下表配置相应的参数。

          资源计划配置项说明

          配置项 说明
          时间范围 资源计划的起始时间和结束时间,精确到分钟,取值范围[00:00, 23:59]。例如资源计划开始于早上8:00,结束于10:00,则配置为8:00-10:00。结束时间必须晚于开始时间至少30分钟。
          节点数量范围 资源计划内的节点数量上下限,取值范围[0,500],在资源计划时间内,集群Task节点数量小于最小节点数时,弹性伸缩会将集群Task节点一次性扩容到最小节点数。在资源计划时间内,集群Task节点数量大于最大节点数时,弹性伸缩会将集群Task节点一次性缩容到最大节点数。最小节点数必须小于或等于最大节点数。

          说明
          • 当启用资源计划时,弹性伸缩配置中的“默认节点数量范围”将在资源计划外的时间段内强制生效。例如“默认节点数量范围”配置为1-2,配置资源计划:08:00-10:00之间节点数量范围为4-5,则在一天中的非资源计划时间段(0:00-8:00以及10:00-23:59)内,Task节点会被强制限制在1个到2个中间,若节点数量大于2则触发自动缩容,若节点数量小于1则触发自动扩容。

          • 当不启用资源计划时,节点数量范围的“默认范围”会在全部时间范围生效,如果节点数量不在“节点数量范围”的默认范围,主动增减Task节点数量到默认范围内。

          • 资源计划间时间段不可交叉,时间段交叉意为某个时间点存在两个生效的资源计划,例如配置资源计划1在08:00-10:00生效,资源计划2在09:00-11:00生效,则两个资源计划存在时间段交叉,交叉时间段09:00-10:00。

          • 资源计划不能跨天配置,例如如果要配置23:00至次日01:00的资源计划,请配置时间段为23:00-00:00和00:00-01:00的两个资源计划。

          在添加自动化脚本时,可以参考下表配置相应参数。

          自动化脚本配置说明

          配置项说明

          名称

          自动化脚本的名称。

          只能由数字、英文字符、空格、中划线和下划线组成,且不能以空格开头。

          可输入的字符串长度为1~64个字符。

          说明

          同一集群内,不允许配置相同的名称。不同集群之间,可以配置相同的名称。

          脚本路径

          脚本的路径。路径可以是OBS文件系统的路径或虚拟机本地的路径。

          l    OBS文件系统的路径,必须以s3a://开头,以.sh结尾。例如:s3a://mrs-samples/xxx.sh

          l    虚拟机本地的路径,脚本所在的路径必须以‘/’开头,以.sh结尾。例如,安装Zepelin的示例脚本路径如下:/opt/bootstrap/zepelin/zepelin_install.sh

          执行节点类型

          选择自动化脚本所执行的节点类型。

          说明

          l    如果选择Master节点,您可以通过开关选择是否只在Active Master节点执行此脚本。

          l    如果选择开启此功能,表示只在Active Master节点上执行。如果选择关闭,表示在所有Master节点执行。默认关闭。

          参数

          自动化脚本参数,支持通过传入以下预定义变量获得弹性伸缩相关信息:

          l    ${mrs_scale_node_num} :弹性伸缩节点数量,总是正数

          l    ${mrs_scale_type} :弹性伸缩类型,扩容为“scale_out”,缩容为“scale_in”

          l    ${mrs_scale_node_hostnames} :弹性伸缩节点的主机名,多个主机名之间以“,”隔开

          l    ${mrs_scale_node_ips} :弹性伸缩节点的IP,多个IP之间以“,”隔开

          l    ${mrs_scale_rule_name}:触发弹性伸缩的规则名,如果是资源计划则为“resource_plan”

          执行时机

          选择自动化脚本执行的时间。支持“扩容前”、“扩容后”、“缩容前”、“缩容后”四种类型。

          说明

          假设执行节点类型中包含Task节点:

          l    执行时机为扩容前的脚本不会在将要扩容出的Task节点上执行。

          l    执行时机为扩容后的脚本会在扩容出的Task节点上执行。

          l    执行时机为缩容前的脚本会在即将被删除的Task节点上执行。

          l    执行时机为缩容后的脚本不会在已经被删除的Task节点上执行。

          失败操作

          该脚本执行失败后,是否继续执行后续脚本和扩缩容操作。

          说明

          l    建议您在调试阶段设置为“继续”,无论此脚本是否执行成功,则集群都能继续扩缩容操作。

          l    若脚本执行失败,请到集群虚拟机机的“/var/log/Bootstrap”路径下查看失败日志。

          l    由于缩容成功不可回滚,缩容后执行的脚本失败操作只能选择“继续”。

          说明
          自动化脚本只在弹性伸缩时触发,手动调整集群节点时不会运行。
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  授权安全通信
          下一篇 :  管理数据连接
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明