活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      翼MapReduce

      翼MapReduce

        • 产品动态
        • 产品简介
        • 产品定义
        • 产品优势
        • 功能特性
        • 多租户
        • 安全增强
        • 组件Web UI便捷访问
        • 可靠性增强
        • 作业管理
        • 自定义引导操作
        • 企业项目管理
        • 元数据
        • 集群管理
        • 应用场景
        • 术语解释
        • 与其他产品的关系
        • 权限管理
        • 约束与限制
        • 计费说明
        • 资源节点
        • 产品规格
        • 产品价格
        • 计费模式
        • 购买
        • 变更
        • 续订
        • 退订
        • 快速入门
        • 如何使用翼MapReduce
        • 创建集群
        • 上传示例数据和程序
        • 添加作业
        • 从零开始使用Kerberos认证集群
        • 删除集群
        • 用户指南
        • 准备用户
        • 创建MRS操作用户
        • 创建MRS自定义策略
        • IAM用户同步MRS说明
        • 配置集群
        • 创建方式简介
        • 快速创建集群
        • 快速创建Hadoop分析集群
        • 快速创建HBase查询集群
        • 快速创建Kafka流式集群
        • 快速创建ClickHouse集群
        • 快速创建实时分析集群
        • 创建自定义集群
        • 创建自定义拓扑集群
        • 添加集群标签
        • 授权安全通信
        • 配置弹性伸缩规则
        • 管理数据连接
        • 配置数据连接
        • 配置Ranger数据连接
        • 配置Hive数据连接
        • 通过引导操作安装第三方软件
        • 查看失败的集群操作任务
        • 查看历史集群信息
        • 管理集群
        • 登录集群
        • MRS集群节点简介
        • 登录集群节点
        • 如何确认Manager的主备管理节点
        • 集群概览
        • 集群列表简介
        • 查看集群状态
        • 查看集群基本信息
        • 查看集群补丁信息
        • 查看和定制集群监控指标
        • 管理组件和主机监控
        • 集群运维
        • 导入导出数据
        • 切换集群子网
        • 配置消息通知
        • 健康检查
        • 远程运维
        • 查看MRS服务操作日志
        • 删除集群
        • 节点管理
        • 扩容集群
        • 缩容集群
        • 管理主机(节点)操作
        • 隔离主机
        • 取消隔离主机
        • 作业管理
        • MRS作业简介
        • 运行MapReduce作业
        • 运行SparkSubmit作业
        • 运行HiveSql作业
        • 运行SparkSql作业
        • 运行Flink作业
        • 运行Kafka作业
        • 查看作业配置信息和日志
        • 停止作业
        • 删除作业
        • 使用OBS加密数据运行作业
        • 配置作业消息通知
        • 组件管理
        • 对象管理简介
        • 查看配置
        • 管理服务操作
        • 配置服务参数
        • 配置服务自定义参数
        • 同步服务配置
        • 管理角色实例操作
        • 配置角色实例参数
        • 同步角色实例配置
        • 退服和入服角色实例
        • 启动及停止集群
        • 同步集群配置
        • 导出集群的配置数据
        • 支持滚动重启
        • 告警管理
        • 查看告警列表
        • 查看事件列表
        • 查看与手动清除告警
        • 补丁管理
        • 补丁操作指导
        • 滚动补丁
        • 修复隔离主机补丁
        • 租户管理
        • 使用前须知
        • 租户简介
        • 添加租户
        • 添加子租户
        • 删除租户
        • 管理租户目录
        • 恢复租户数据
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列配置
        • 引导操作
        • 引导操作简介
        • 准备引导操作脚本
        • 查看执行记录
        • 添加引导操作
        • 修改引导操作
        • 删除引导操作
        • 使用MRS客户端
        • 安装客户端
        • 安装客户端(3.x及之后版本)
        • 安装客户端(3.x之前版本)
        • 更新客户端
        • 更新客户端(3.x及之后版本)
        • 更新客户端(3.x之前版本)
        • 各组件客户端使用实践
        • 使用ClickHouse客户端
        • 使用Flink客户端
        • 使用Flume客户端
        • 使用HBase客户端
        • 使用HDFS客户端
        • 使用Hive客户端
        • 使用Impala客户端
        • 使用Kafka客户端
        • 使用Kudu客户端
        • 使用Oozie客户端
        • 使用Storm客户端
        • 使用Yarn客户端
        • 配置存算分离
        • 存算分离简介
        • 配置存算分离集群(委托方式)
        • 配置存算分离集群(AKSK方式)
        • 使用存算分离集群
        • Flink对接OBS文件系统
        • Flume对接OBS文件系统
        • HDFS客户端对接OBS文件系统
        • Hive对接OBS文件系统
        • MapReduce对接OBS文件系统
        • Spark2x对接OBS文件系统
        • Sqoop对接外部存储系统
        • Hudi对接OBS文件系统
        • 访问MRS集群上托管的开源组件Web页面
        • 开源组件Web站点
        • 开源组件端口列表
        • 通过专线访问
        • 通过弹性公网IP访问
        • 通过Windows弹性云主机访问
        • 创建连接MRS集群的SSH隧道并配置浏览器
        • 访问集群Manager
        • 访问FusionInsight Manager(MRS 3.x及之后版本)
        • 访问MRS Manager(MRS 2.x及之前版本)
        • FusionInsight Manager操作指导(适用于3.x)
        • 从这里开始
        • FusionInsight Manager入门指导
        • 查询FusionInsight Manager版本号
        • 登录管理系统
        • 登录管理节点
        • 主页
        • 主页概述
        • 管理监控指标数据报表
        • 主机管理
        • 主机管理页面
        • 查看主机列表
        • 查看主机概览
        • 查看主机进程及资源
        • 主机维护操作
        • 启动、停止主机上的所有实例
        • 执行主机健康检查
        • 分配机架
        • 隔离主机
        • 导出主机信息
        • 资源概况
        • 分布
        • 趋势
        • 集群
        • 主机
        • 运维
        • 告警
        • 告警与事件概述
        • 配置阈值
        • 配置告警屏蔽状态
        • 日志
        • 在线检索日志
        • 下载日志
        • 健康检查
        • 查看健康检查任务
        • 管理健康检查报告
        • 修改健康检查配置
        • 备份恢复设置
        • 创建备份任务
        • 创建恢复任务
        • 其他任务管理说明
        • 审计
        • 审计管理页面概述
        • 配置审计日志转储
        • 租户资源
        • 多租户介绍
        • 简介
        • 技术原理
        • 多租户管理页面概述
        • 相关模型
        • 资源概述
        • 动态资源
        • 存储资源
        • 多租户使用
        • 使用说明
        • 流程概述
        • 使用Superior调度器的租户业务
        • 创建租户
        • 添加租户
        • 添加子租户
        • 添加用户并绑定租户的角色
        • 管理租户
        • 管理租户目录
        • 恢复租户数据
        • 删除租户
        • 管理资源
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列容量配置
        • 管理全局用户策略
        • 使用Capacity调度器的租户业务
        • 创建租户
        • 添加租户
        • 添加子租户
        • 添加用户并绑定租户的角色
        • 管理租户
        • 管理租户目录
        • 恢复租户数据
        • 删除租户
        • Capacity Scheduler模式下清除租户非关联队列
        • 管理资源
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列容量配置
        • 切换调度器
        • 系统设置
        • 权限设置
        • 用户管理
        • 创建用户
        • 修改用户信息
        • 导出用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改用户密码
        • 初始化用户密码
        • 导出认证凭据文件
        • 用户组管理
        • 角色管理
        • 安全策略
        • 配置密码策略
        • 配置私有属性
        • 对接设置
        • 配置SNMP北向参数
        • 配置Syslog北向参数
        • 配置监控指标数据转储
        • 导入证书
        • OMS管理
        • OMS维护页面概述
        • 修改OMS服务配置参数
        • 部件管理
        • 查看部件包
        • 集群管理
        • 配置客户端
        • 安装客户端
        • 使用客户端
        • 更新已安装客户端的配置
        • 管理集群
        • 集群管理概述
        • 滚动重启集群
        • 管理配置过期
        • 下载客户端
        • 修改集群属性
        • 管理集群配置
        • 静态服务池
        • 静态服务资源
        • 配置集群静态资源
        • 查看集群静态资源
        • 客户端管理
        • 管理客户端
        • 批量升级客户端
        • 批量刷新hosts文件
        • 管理服务
        • 服务管理概述
        • 其他服务管理操作
        • 服务详情概述
        • 执行角色实例主备倒换
        • 资源监控
        • 采集堆栈信息
        • 切换Ranger鉴权
        • 服务配置
        • 修改服务配置参数
        • 修改服务自定义配置参数
        • 集群互信管理
        • 集群互信概述
        • 修改Manager系统域名
        • 配置跨Manager集群互信
        • 配置跨集群互信后的用户权限
        • 配置定时备份告警与审计信息
        • 管理实例
        • 实例管理概述
        • 入服与退服实例
        • 管理实例配置
        • 查看实例配置文件
        • 实例组
        • 管理实例组
        • 查看实例组信息
        • 配置实例组参数
        • 修改FusionInsight Manager添加的路由表
        • 切换维护模式
        • 例行维护
        • 日志管理
        • 关于日志
        • Manager日志清单
        • 配置日志级别与文件大小
        • 配置审计日志本地备份数
        • 查看角色实例日志
        • 备份恢复管理
        • 备份恢复简介
        • 备份数据
        • 备份OMS数据
        • 备份DBService数据
        • 备份HBase元数据
        • 备份HBase业务数据
        • 备份NameNode数据
        • 备份HDFS业务数据
        • 备份Hive业务数据
        • 备份Kafka元数据
        • 恢复数据
        • 恢复OMS数据
        • 恢复DBService数据
        • 恢复HBase元数据
        • 恢复HBase业务数据
        • 恢复NameNode数据
        • 恢复HDFS业务数据
        • 恢复Hive业务数据
        • 恢复Kafka元数据
        • 启用集群间拷贝功能
        • 管理本地快速恢复任务
        • 修改备份任务
        • 查看备份恢复任务
        • 安全管理
        • 安全概述
        • 权限模型
        • 权限机制
        • 认证策略
        • 鉴权策略
        • 用户帐号一览表
        • 默认权限信息一览
        • FusionInsight Manager安全功能
        • 帐户管理
        • 帐户安全设置
        • 解锁LDAP用户和管理帐户
        • 解锁系统内部用户
        • 修改集群组件鉴权配置开关
        • 使用普通模式集群用户在非集群节点登录
        • 修改系统用户密码
        • 修改admin密码
        • 修改操作系统用户密码
        • 修改系统内部用户密码
        • 修改Kerberos管理员密码
        • 修改OMS Kerberos管理员密码
        • 修改LDAP管理员和LDAP用户密码(含OMS LDAP)
        • 修改LDAP管理帐户密码
        • 修改组件运行用户密码
        • 修改默认数据库用户密码
        • 修改OMS数据库管理员密码
        • 修改OMS数据库访问用户密码
        • 修改组件数据库用户密码
        • 修改DBService数据库omm用户密码
        • 证书管理
        • 更换CA证书
        • 更换HA证书
        • 安全加固
        • 加固策略
        • 配置受信任IP访问LDAP
        • 加密HFile和WAL内容
        • 安全配置
        • 配置HBase允许修改操作的IP地址白名单
        • 更新集群密钥
        • 加固LDAP
        • 配置Kafka数据传输加密
        • 配置HDFS数据传输加密
        • 配置Controller与Agent间通信加密
        • 更新omm用户ssh密钥
        • 安全维护
        • 帐户维护建议
        • 密码维护建议
        • 日志维护建议
        • 安全声明
        • 告警参考(适用于MRS 3.x版本)
        • ALM-12001 审计日志转储失败
        • ALM-12004 OLdap资源异常
        • ALM-12005 OKerberos资源异常
        • ALM-12006 节点故障
        • ALM-12007 进程故障
        • ALM-12010 Manager主备节点间心跳中断
        • ALM-12011 Manager主备节点同步数据异常
        • ALM-12014 设备分区丢失
        • ALM-12015 设备分区文件系统只读
        • ALM-12016 CPU使用率超过阈值
        • ALM-12017 磁盘容量不足
        • ALM-12018 内存使用率超过阈值
        • ALM-12027 主机PID使用率超过阈值
        • ALM-12028 主机D状态进程数超过阈值
        • ALM-12033 慢盘故障
        • ALM-12034 周期备份任务失败
        • ALM-12035 恢复任务失败后数据状态未知
        • ALM-12038 监控指标转储失败
        • ALM-12039 OMS数据库主备不同步
        • ALM-12040 系统熵值不足
        • ALM-12041 关键文件权限异常
        • ALM-12042 关键文件配置异常
        • ALM-12045 网络读包丢包率超过阈值
        • ALM-12046 网络写包丢包率超过阈值
        • ALM-12047 网络读包错误率超过阈值
        • ALM-12048 网络写包错误率超过阈值
        • ALM-12049 网络读吞吐率超过阈值
        • ALM-12050 网络写吞吐率超过阈值
        • ALM-12051 磁盘Inode使用率超过阈值
        • ALM-12052 TCP临时端口使用率超过阈值
        • ALM-12053 主机文件句柄使用率超过阈值
        • ALM-12054 证书文件失效
        • ALM-12055 证书文件即将过期
        • ALM-12057 元数据未配置周期备份到第三方服务器的任务
        • ALM-12061 进程使用率超过阈值
        • ALM-12062 OMS参数配置同集群规模不匹配
        • ALM-12063 磁盘不可用
        • ALM-12064 主机随机端口范围配置与集群使用端口冲突
        • ALM-12066 节点间互信失效
        • ALM-12067 tomcat资源异常
        • ALM-12068 acs资源异常
        • ALM-12069 aos资源异常
        • ALM-12070 controller资源异常
        • ALM-12071 httpd资源异常
        • ALM-12072 floatip资源异常
        • ALM-12073 cep资源异常
        • ALM-12074 fms资源异常
        • ALM-12075 pms资源异常
        • ALM-12076 gaussDB资源异常
        • ALM-12077 omm用户过期
        • ALM-12078 omm密码过期
        • ALM-12079 omm用户即将过期
        • ALM-12080 omm密码即将过期
        • ALM-12081 ommdba用户过期
        • ALM-12082 ommdba用户即将过期
        • ALM-12083 ommdba密码即将过期
        • ALM-12084 ommdba密码过期
        • ALM-12085 服务审计日志转储失败
        • ALM-12087 系统处于升级观察期
        • ALM-12089 节点间网络互通异常
        • ALM-12101 AZ不健康
        • ALM-12102 AZ高可用组件未按容灾需求部署
        • ALM-12110 获取ECS临时ak/sk失败
        • ALM-13000 ZooKeeper服务不可用
        • ALM-13001 ZooKeeper可用连接数不足
        • ALM-13002 ZooKeeper直接内存使用率超过阈值
        • ALM-13003 ZooKeeper进程垃圾回收(GC)时间超过阈值
        • ALM-13004 ZooKeeper堆内存使用率超过阈值
        • ALM-13005 ZooKeeper中组件顶层目录的配额设置失败
        • ALM-13006 Znode数量或容量超过阈值
        • ALM-13007 ZooKeeper客户端可用连接数不足
        • ALM-13008 ZooKeeper Znode数量使用率超出阈值
        • ALM-13009 ZooKeeper Znode容量使用率超出阈值
        • ALM-13010 配置quota的目录Znode使用率超出阈值
        • ALM-14000 HDFS服务不可用
        • ALM-14001 HDFS磁盘空间使用率超过阈值
        • ALM-14002 DataNode磁盘空间使用率超过阈值
        • ALM-14003 丢失的HDFS块数量超过阈值
        • ALM-14006 HDFS文件数超过阈值
        • ALM-14007 NameNode堆内存使用率超过阈值
        • ALM-14008 DataNode堆内存使用率超过阈值
        • ALM-14009 Dead DataNode数量超过阈值
        • ALM-14010 NameService服务异常
        • ALM-14011 DataNode数据目录配置不合理
        • ALM-14012 Journalnode数据不同步
        • ALM-14013 NameNode FsImage文件更新失败
        • ALM-14014 NameNode进程垃圾回收(GC)时间超过阈值
        • ALM-14015 DataNode进程垃圾回收(GC)时间超过阈值
        • ALM-14016 DataNode直接内存使用率超过阈值
        • ALM-14017 NameNode直接内存使用率超过阈值
        • ALM-14018 NameNode非堆内存使用率超过阈值
        • ALM-14019 DataNode非堆内存使用率超过阈值
        • ALM-14020 HDFS目录条目数量超过阈值
        • ALM-14021 NameNode RPC处理平均时间超过阈值
        • ALM-14022 NameNode RPC队列平均时间超过阈值
        • ALM-14023 总副本预留磁盘空间所占比率超过阈值
        • ALM-14024 租户空间使用率超过阈值
        • ALM-14025 租户文件对象使用率超过阈值
        • ALM-14026 DataNode块数超过阈值
        • ALM-14027 DataNode磁盘故障
        • ALM-14028 待补齐的块数超过阈值
        • ALM-14029 单副本的块数超过阈值
        • ALM-16000 连接到HiveServer的session数占最大允许数的百分比超过阈值
        • ALM-16001 Hive数据仓库空间使用率超过阈值
        • ALM-16002 Hive SQL执行成功率低于阈值
        • ALM-16003 Background线程使用率超过阈值
        • ALM-16004 Hive服务不可用
        • ALM-16005 Hive服务进程堆内存使用超出阈值
        • ALM-16006 Hive服务进程直接内存使用超出阈值
        • ALM-16007 Hive GC 时间超出阈值
        • ALM-16008 Hive服务进程非堆内存使用超出阈值
        • ALM-16009 Map数超过阈值
        • ALM-16045 Hive数据仓库被删除
        • ALM-16046 Hive数据仓库权限被修改
        • ALM-16047 HiveServer已从Zookeeper注销
        • ALM-16048 Tez或者Spark库路径不存在
        • ALM-17003 Oozie服务不可用
        • ALM-17004 Oozie堆内存使用率超过阈值
        • ALM-17005 Oozie非堆内存使用率超过阈值
        • ALM-17006 Oozie直接内存使用率超过阈值
        • ALM-17007 Oozie进程垃圾回收(GC)时间超过阈值
        • ALM-18000 Yarn服务不可用
        • ALM-18002 NodeManager心跳丢失
        • ALM-18003 NodeManager不健康
        • ALM-18008 ResourceManager堆内存使用率超过阈值
        • ALM-18009 JobHistoryServer堆内存使用率超过阈值
        • ALM-18010 ResourceManager进程垃圾回收(GC)时间超过阈值
        • ALM-18011 NodeManager进程垃圾回收(GC)时间超过阈值
        • ALM-18012 JobHistoryServer进程垃圾回收(GC)时间超过阈值
        • ALM-18013 ResourceManager直接内存使用率超过阈值
        • ALM-18014 NodeManager直接内存使用率超过阈值
        • ALM-18015 JobHistoryServer直接内存使用率超过阈值
        • ALM-18016 ResourceManager非堆内存使用率超过阈值
        • ALM-18017 NodeManager非堆内存使用率超过阈值
        • ALM-18018 NodeManager堆内存使用率超过阈值
        • ALM-18019 JobHistoryServer非堆内存使用率超过阈值
        • ALM-18020 Yarn任务执行超时
        • ALM-18021 Mapreduce服务不可用
        • ALM-18022 Yarn队列资源不足
        • ALM-18023 Yarn任务挂起数超过阈值
        • ALM-18024 Yarn任务挂起内存量超阈值
        • ALM-18025 Yarn被终止的任务数超过阈值
        • ALM-18026 Yarn上运行失败的任务数超过阈值
        • ALM-19000 HBase服务不可用
        • ALM-19006 HBase容灾同步失败
        • ALM-19007 HBase GC时间超出阈值
        • ALM-19008 HBase服务进程堆内存使用率超出阈值
        • ALM-19009 HBase服务进程直接内存使用率超出阈值
        • ALM-19011 RegionServer的Region数量超出阈值
        • ALM-19012 HBase系统表目录或文件丢失
        • ALM-19013 region处在RIT状态的时长超过阈值
        • ALM-19014 在ZooKeeper上的容量配额使用率严重超过阈值
        • ALM-19015 在ZooKeeper上的数量配额使用率超过阈值
        • ALM-19016 在ZooKeeper上的数量配额使用率严重超过阈值
        • ALM-19017 在ZooKeeper上的容量配额使用率超过阈值
        • ALM-19018 HBase合并队列超出阈值
        • ALM-19019 HBase容灾等待同步的HFile文件数量超过阈值
        • ALM-19020 HBase容灾等待同步的wal文件数量超过阈值
        • ALM-20002 Hue服务不可用
        • ALM-24000 Flume服务不可用
        • ALM-24001 Flume Agent异常
        • ALM-24003 Flume Client连接中断
        • ALM-24004 Flume读取数据异常
        • ALM-24005 Flume传输数据异常
        • ALM-24006 Flume Server堆内存使用率超过阈值
        • ALM-24007 Flume Server直接内存使用率超过阈值
        • ALM-24008 Flume Server非堆内存使用率超过阈值
        • ALM-24009 Flume Server垃圾回收(GC)时间超过阈值
        • ALM-24010 Flume证书文件非法或已损坏
        • ALM-24011 Flume证书文件即将过期
        • ALM-24012 Flume证书文件已过期
        • ALM-24013 Flume MonitorServer证书文件非法或已损坏
        • ALM-24014 Flume MonitorServer证书文件即将过期
        • ALM-24015 Flume MonitorServer证书文件已过期
        • ALM-25000 LdapServer服务不可用
        • ALM-25004 LdapServer数据同步异常
        • ALM-25005 Nscd服务异常
        • ALM-25006 Sssd服务异常
        • ALM-25500 KrbServer服务不可用
        • ALM-26051 Storm服务不可用
        • ALM-26052 Storm服务可用Supervisor数量小于阈值
        • ALM-26053 Storm Slot使用率超过阈值
        • ALM-26054 Nimbus堆内存使用率超过阈值
        • ALM-27001 DBService服务不可用
        • ALM-27003 DBService主备节点间心跳中断
        • ALM-27004 DBService主备数据不同步
        • ALM-27005 数据库连接数使用率超过阈值
        • ALM-27006 数据目录磁盘空间使用率超过阈值
        • ALM-28001 Spark服务不可用(2.x及以前版本)
        • ALM-27007 数据库进入只读模式
        • ALM-29000 Impala服务不可用
        • ALM-29004 Impalad进程内存占用率超过阈值
        • ALM-29005 Impalad JDBC连接数超过阈值
        • ALM-29006 Impalad ODBC连接数超过阈值
        • ALM-29100 Kudu服务不可用
        • ALM-29104 Tserver进程内存占用率超过阈值
        • ALM-29106 Tserver进程CPU占用率过高
        • ALM-29107 Tserver进程内存使用百分比超过阈值
        • ALM-38000 Kafka服务不可用
        • ALM-38001 Kafka磁盘容量不足
        • ALM-38002 Kafka堆内存使用率超过阈值
        • ALM-38004 Kafka直接内存使用率超过阈值
        • ALM-38005 Broker进程垃圾回收(GC)时间超过阈值
        • ALM-38006 Kafka未完全同步的Partition百分比超过阈值
        • ALM-38007 Kafka默认用户状态异常
        • ALM-38008 Kafka数据目录状态异常
        • ALM-38009 Broker磁盘IO繁忙
        • ALM-38010 存在单副本的Topic
        • ALM-43001 Spark2x服务不可用
        • ALM-43006 JobHistory2x进程堆内存使用超出阈值
        • ALM-43007 JobHistory2x进程非堆内存使用超出阈值
        • ALM-43008 JobHistory2x进程直接内存使用超出阈值
        • ALM-43009 JobHistory2x进程GC时间超出阈值
        • ALM-43010 JDBCServer2x进程堆内存使用超出阈值
        • ALM-43011 JDBCServer2x进程非堆内存使用超出阈值
        • ALM-43012 JDBCServer2x进程直接内存使用超出阈值
        • ALM-43013 JDBCServer2x进程GC时间超出阈值
        • ALM-43017 JDBCServer2x进程Full GC次数超出阈值
        • ALM-43018 JobHistory2x进程Full GC次数超出阈值
        • ALM-43019 IndexServer2x进程堆内存使用超出阈值
        • ALM-43020 IndexServer2x进程非堆内存使用超出阈值
        • ALM-43021 IndexServer2x进程直接内存使用超出阈值
        • ALM-43022 IndexServer2x进程GC时间超出阈值
        • ALM-43023 IndexServer2x进程Full GC次数超出阈值
        • ALM-44004 Presto Coordinator资源组排队任务超过阈值
        • ALM-44005 Presto Coordinator进程垃圾收集时间超出阈值
        • ALM-44006 Presto Worker进程垃圾收集时间超出阈值
        • ALM-45175 OBS元数据接口调用平均时间超过阈值
        • ALM-45176 OBS元数据接口调用成功率低于阈值
        • ALM-45177 OBS数据读操作接口调用成功率低于阈值
        • ALM-45178 OBS数据写操作接口调用成功率低于阈值
        • ALM-45275 Ranger服务不可用
        • ALM-45276 RangerAdmin状态异常
        • ALM-45277 RangerAdmin堆内存使用率超过阈值
        • ALM-45278 RangerAdmin直接内存使用率超过阈值
        • ALM-45279 RangerAdmin非堆内存使用率超过阈值
        • ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值
        • ALM-45281 UserSync堆内存使用率超过阈值
        • ALM-45282 UserSync直接内存使用率超过阈值
        • ALM-45283 UserSync非堆内存使用率超过阈值
        • ALM-45284 UserSync垃圾回收(GC)时间超过阈值
        • ALM-45285 TagSync堆内存使用率超过阈值
        • ALM-45286 TagSync直接内存使用率超过阈值
        • ALM-45287 TagSync非堆内存使用率超过阈值
        • ALM-45288 TagSync垃圾回收(GC)时间超过阈值
        • ALM-45425 ClickHouse服务不可用
        • ALM-45426 ClickHouse服务在ZooKeeper的数量配额使用率超过阈值
        • ALM-45427 ClickHouse服务在ZooKeeper的容量配额使用率超过阈值
        • ALM-45736 Guardian服务不可用
        • MRS Manager操作指导(适用于2.x及之前)
        • MRS Manager简介
        • 查看集群运行任务
        • 监控管理
        • 系统概览
        • 管理服务和主机监控
        • 管理资源分布
        • 配置监控指标转储
        • 告警管理
        • 查看与手动清除告警
        • 配置监控与告警阈值
        • 配置Syslog北向参数
        • 配置SNMP北向参数
        • 对象管理
        • 对象管理简介
        • 查看配置
        • 管理服务操作
        • 配置服务参数
        • 配置服务自定义参数
        • 同步服务配置
        • 管理角色实例操作
        • 配置角色实例参数
        • 同步角色实例配置
        • 退服和入服务角色实例
        • 管理主机操作
        • 隔离主机
        • 取消隔离主机
        • 启动及停止集群
        • 同步集群配置
        • 导出集群的配置数据
        • 日志管理
        • 关于日志
        • Manager日志清单
        • 查看及导出审计日志
        • 导出服务日志
        • 配置审计日志导出参数
        • 健康检查管理
        • 执行健康检查
        • 查看并导出检查报告
        • 配置健康检查报告保存数
        • 管理健康检查报告
        • DBService健康检查指标项说明
        • Flume 健康检查指标项说明
        • HBase健康检查指标项说明
        • Host健康检查指标项说明
        • HDFS健康检查指标项说明
        • Hive健康检查指标项说明
        • Kafka健康检查指标项说明
        • KrbServer健康检查指标项说明
        • LdapServer健康检查指标项说明
        • Loader健康检查指标项说明
        • MapReduce健康检查指标项说明
        • OMS健康检查指标项说明
        • Spark健康检查指标项说明
        • Storm健康检查指标项说明
        • Yarn健康检查指标项说明
        • ZooKeeper健康检查指标项说明
        • 静态服务池管理
        • 查看静态服务池状态
        • 配置静态服务池
        • 租户管理
        • 租户简介
        • 添加租户
        • 添加子租户
        • 删除租户
        • 管理租户目录
        • 恢复租户数据
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列配置
        • 备份与恢复
        • 备份与恢复简介
        • 备份元数据
        • 恢复元数据
        • 修改备份任务
        • 查看备份恢复任务
        • 安全管理
        • 未开启Kerberos认证集群中的默认用户清单
        • 开启Kerberos认证集群中的默认用户清单
        • 修改操作系统用户密码
        • 修改admin密码
        • 修改Kerberos管理员密码
        • 修改LDAP管理员和LDAP用户密码
        • 修改组件运行用户密码
        • 修改OMS数据库管理员密码
        • 修改OMS数据库数据访问用户密码
        • 修改组件数据库用户密码
        • 更换HA证书
        • 更新集群密钥
        • 权限管理
        • 创建角色
        • 创建用户组
        • 创建用户
        • 修改用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改操作用户密码
        • 初始化系统用户密码
        • 下载用户认证文件
        • 修改密码策略
        • MRS多用户权限管理
        • MRS集群中的用户与权限
        • 开启Kerberos认证集群中的默认用户清单
        • 创建角色
        • 创建用户组
        • 创建用户
        • 修改用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改操作用户密码
        • 初始化系统用户密码
        • 下载用户认证文件
        • 修改密码策略
        • 配置跨集群互信
        • 配置并使用互信集群的用户
        • 配置MRS多用户访问OBS细粒度权限
        • 补丁操作指导
        • 安装与卸载补丁
        • 支持滚动补丁
        • 修复隔离主机补丁
        • 支持滚动重启
        • 安全性说明
        • 集群(未启用Kerberos认证)安全配置建议
        • 安全认证原理和认证机制
        • 高危操作一览表
        • 附录
        • MRS 3.x版本操作注意事项
        • 最佳实践
        • 数据分析
        • 使用Hive加载HDFS数据并分析图书评分情况
        • 通过Flink作业处理OBS数据
        • 常见问题
        • 计费类
        • 购买类
        • 操作类
        • 集群创建类
        • 帐号密码类
        • 帐号权限类
        • 客户端使用类
        • Web页面访问类
        • 监控告警类
        • 性能优化类
        • 作业开发类
        • 集群升级/补丁
        • 集群访问类
        • 大数据业务开发
        • API使用类
        • 集群管理类
        • Kerberos使用
        • 元数据管理
        • 文档下载
        • 翼MapReduce服务用户操作指南
        • 翼MapReduce服务组件操作指南
        • 翼MapReduce服务故障排除
        • 相关协议
        • 天翼云翼MapReduce服务协议
          无相关产品

          本页目录

          帮助中心翼MapReduce产品简介功能特性集群管理
          集群管理
          更新时间 2023-08-17 11:05:14
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2023-08-17 11:05:14
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本章节主要介绍翼MapReduce服务的集群管理功能。

          集群生命周期管理

          翼MR支持集群的生命周期管理包括创建集群和删除集群。

          • 创建集群:支持用户定制集群的类型,组件范围,各类型的节点数、虚拟机规格、可用区、VPC网络、认证信息,翼MR将为用户自动创建一个符合配置的集群,全程无需用户参与;同时支持用户在集群中运行自定义内容;支持快速创建多应用场景集群,比如创建Hadoop分析集群、HBase集群、Kafka集群。大数据平台同时支持部署异构集群,在集群中存在不同规格的虚机,允许在CPU类型,硬盘容量,硬盘类型,内存大小灵活组合。在集群中支持多种虚机规格混合使用。
          • 删除集群:当按需计费的集群不再需要时(包括集群中的数据和配置),用户可以选择删除集群,翼MR会将集群相关的资源全部删除。

          创建集群

          通过在翼MR服务管理面,客户可以按需创建翼MR集群,通过选择集群所建的区域及使用的云资源规格,一键式创建适合企业业务的翼MR集群。翼MR服务会根据用户选择的集群类型、版本和节点规格,帮助客户自动完成企业级大数据平台的安装部署和参数调优。

          翼MR服务为客户提供完全可控的大数据集群,客户在创建时可设置虚拟机的登录方式(密码或者密钥对),所创建的翼MR集群资源完全归客户所用。同时翼MR支持在最小可在两节点4U8G的ECS上部署大数据集群,为客户测试开发提供更多的灵活选择。

          翼MR集群类型包括分析集群、流式集群和混合集群。

          • 分析集群:用来做离线数据分析,提供的是Hadoop体系的组件。
          • 流式集群:用来做流处理任务,提供的是流式处理组件。
          • 混合集群:既可以用来做离线数据分析,又可以用来做流处理任务,提供的是Hadoop体系的组件和流式处理组件。
          • 自定义:根据业务需求,可以灵活搭配所需组件(翼MR 3.x及后续版本)。

          翼MR集群节点类型包括Master节点、Core节点和Task节点。

          • Master节点:集群中的管理节点,分布式系统的Master进程和Manager以及数据库均部署在该节点;该类型节点不可扩容。该类型节点的处理能力决定了整个集群的管理上限,MRS服务支持将Master节点规格提高,以支持更大集群的管理。
          • Core节点:支持存储和计算两种目标的节点,可扩容、缩容。因承载的数据存储,因此在缩容时,为保证数据不丢失,有较多限制,无法进行弹性伸缩。
          • Task节点:仅用于计算的节点,可扩容、缩容。因只承载计算任务,因此可以进行弹性伸缩。

          翼MR创建集群方式支持自定义创建集群和快速创建集群两种。

          • 自定义创建集群:自定义创建可以灵活地选择计费模式、配置项,针对不同的应用场景,可以选择不同规格的弹性云服务器,全方位贴合您的业务诉求。
          • 快速创建集群:用户可以根据应用场景,快速创建对应配置的集群,提高了配置效率,更加方便快捷。当前支持快速创建Hadoop分析集群、HBase集群、Kafka集群。

          − Hadoop分析集群:Hadoop分析集群完全使用开源Hadoop生态,采用YARN管理集群资源,提供Hive、Spark离线大规模分布式数据存储和计算,SparkStreaming、Flink流式数据计算,Presto交互式查询,Tez有向无环图的分布式计算框等Hadoop生态圈的组件,进行海量数据分析与查询。

          − HBase集群:HBase集群使用Hadoop和HBase组件提供一个稳定可靠,性能卓越、可伸缩、面向列的分布式云存储系统,适用于海量数据存储以及分布式计算的场景,用户可以利用HBase搭建起TB至PB级数据规模的存储系统,对数据轻松进行过滤分析,毫秒级得到响应,快速发现数据价值。

          − Kafka集群:Kafka集群使用Kafka和Storm组件提供一个开源高吞吐量,可扩展性的消息系统。广泛用于日志收集、监控数据聚合等场景,实现高效的流式数据采集,实时数据处理存储等。

          删除集群

          翼MR服务支持用户在不需要大数据集群时执行删除集群操作,集群删除后,所有大数据使用的相关云资源都会同时被释放。删除集群前,建议完成数据搬迁或者备份,确认集群无任何业务运行或者集群异常且经运维分析无法继续提供服务时再执行集群删除操作。对于数据存放在云硬盘EVS或直通盘的大数据集群,集群删除后,数据也随之删除,强烈建议您慎重选择删除集群。

          集群扩缩容

          大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展,当集群规模不符合业务要求时,用户可以通过该功能进行集群节点规模的调整,进行扩容或者缩容;在缩容节点时,翼MR会智能地选择负载最少或者迁移数据量最小节点,并且在缩容过程中,缩容节点不再接收新的任务,正在执行的任务继续执行,同时将该节点数据拷贝至其他节点,该节点进入退服状态,当该节点任务长时间运行无法结束时,会迁移至其他节点运行,最大限度地减少对集群业务的影响。

          扩容集群

          目前支持扩容集群Core节点或Task节点,用户可通过增加节点数量处理业务峰值负载。MRS集群节点扩容中和扩容后对现有集群的业务没有影响,扩容后引起的数据倾斜问题可参考页面内容进行规避。

          包周期集群扩容

          当用户创建了翼MR包周期集群后,在订购的周期之内,用户的业务增长超过预期时,就会出现超出包周期订单规模外的扩容诉求。翼MR服务支持包周期集群扩容能力,做到了在轻松帮助您完成扩容的前提下,让您继续享受着包周期的优惠。

          您只需要在您业务需要的时候,打开翼MR服务页面,点两下鼠标,便可扩容出您需要的节点数。整个扩容过程无需后台人工介入,只需几分钟,即可完美解决您遇到的日益上涨的业务数据压力。

          缩容集群

          用户可以根据业务需求量,通过简单的缩减Core节点或者Task节点,对集群进行缩容,以使MRS拥有更优的存储、计算能力,降低运维成本。用户执行MRS集群缩容后,MRS服务将根据节点已安装的服务类型自动选择可以缩容的节点。

          Core节点在缩容的时候,会对原节点上的数据进行迁移。业务上如果对数据位置做了缓存,客户端自动刷新位置信息可能会影响时延。缩容节点可能会影响部分HBase on HDFS数据的第一次访问响应时长,可以重启HBase或者对相关的表Disable/Enable来避免。

          Task节点本身不存储集群数据,属于计算节点,不存在节点数据迁移的问题。

          自动弹性伸缩

          特性简介

          随着企业的数据越来越多,越来越多的企业选择使用Spark/Hive等技术来进行分析,由于数据量大,处理任务繁重,资源的消耗比较高,因此使用成本也是比较高。当前并不是每个企业在每时每刻在进行分析,而一般是在一天的一个时间段内进行分析汇总,因此翼MR提供了弹性伸缩能力,可以自动在业务在繁忙时申请额外资源,业务不繁忙时释放闲置资源,让用户按需使用,尽可能的帮助客户降低使用成本,聚焦核心业务。

          在大数据应用,尤其是周期性的数据分析处理场景中,需要根据业务数据的周期变化,动态调整集群计算资源以满足业务需要。翼MR的弹性伸缩规则功能支持根据集群负载对集群进行弹性伸缩。此外,如果数据量为周期有规律的变化,并且希望在数据量变化前提前完成集群的扩缩容,可以使用翼MR的资源计划特性。

          翼MR服务支持规则和时间计划两种弹性伸缩的策略:

          • 弹性伸缩规则:根据集群实时负载对Task节点数量进行调整,数据量变化后触发扩缩容,有一定的延后性。
          • 资源计划:若数据量变化存在周期性规律,则可通过资源计划在数据量变化前提前完成集群的扩缩容,避免出现增加或减少资源的延后。

          弹性伸缩规则与资源计划均可触发弹性伸缩,两者即可同时配置也可单独配置。资源计划与基于负载的弹性伸缩规则叠加使用可以使得集群节点的弹性更好,足以应对偶尔超出预期的数据峰值出现。

          当某些业务场景要求在集群扩缩容之后,根据节点数量的变化对资源分配或业务逻辑进行更改时,手动扩缩容的场景客户可以登录集群节点进行操作。对于弹性伸缩场景,翼MR支持通过自定义弹性伸缩自动化脚本来解决。自动化脚本可以在弹性伸缩前后执行相应操作,自动适应业务负载的变化,免去了人工操作。同时,自动化脚本给用户实现个性需求提供了途径,完全自定义的脚本与多个可选的执行时机基本可以满足用户的各项需求,使弹性伸缩更具灵活性。

          客户价值

          翼MR的自动弹性伸缩可以帮助用户实现以下价值。

          • 降低使用成本

          部分企业在进行批量分析时,并不是时时刻刻都在进行分析,例如一般都存在数据持续接入,而到了特定时间段(例如凌晨3点)进行批量分析,可能仅需要消耗2小时。

          翼MR提供的弹性伸缩能力,可以帮助客户,在晚上的时候,将分析节点扩容到指定规模,而计算完毕后,则自动释放计算节点,尽可能的降低使用成本。

          • 平衡突发查询

          大数据集群上,由于有大量的数据,企业会经常面临临时的分析任务,例如支撑企业决策的临时数据报表等,都会导致对于资源的消耗在极短时间内剧增。翼MR提供的弹性伸缩能力,可以让突发大数据分析时,可以及时的补充计算节点,避免因为计算能力不足,导致业务宕机,使用户无需创建额外资源,当突发事件结束后,翼MR会自动判断缩容时机,自动完成缩容。

          • 聚焦核心业务

          大数据作为二次开发平台,开发人员非常难判断具体的资源消耗,因为查询分析的条件复杂性(例如全局排序,过滤,合并等)以及数据的复杂性,例如增量数据的不确定性等,都会导致预估多少计算量是非常困难的行为,而使用弹性伸缩能力,可以让业务人员专注于业务开发,无需分心再做各种资源评估。

          创建Task节点

          特性简介

          支持创建Task节点,只作为计算节点,不存放持久化的数据,是实现弹性伸缩的基础。

          客户价值

          在翼MR服务只作为计算资源的场景下,使用Task节点可以节省成本,并可以更加方便快捷地对集群节点进行扩缩容,满足用户对集群计算能力随时增减的需求。

          用户场景

          当集群数据量变化不大而集群业务处理能力需求变化比较大,大的业务处理能力只是临时需要,此时选择添加Task节点。

          • 临时业务量增大,如年底报表处理。
          • 需要在短时间内处理完原来需要处理很久的任务,如一些紧急分析任务。

          升级Master节点规格

          翼MR大数据集群采用Manager实现集群的管理,而管理集群的相关服务,如HDFS存储系统的NameNode,Yarn资源管理的ResourceManager,以及MRS的Manager管理服务都部署在集群的Master节点。

          随着新业务的上线,集群规模不断扩大,Master节点承担的管理负荷也越来越高,企业用户面临CPU负载过高,内存使用率超过阈值的问题。通常自建大数据集群需要完成数据搬迁,采购升级节点硬件配置实现Master规格提升,而MRS服务借助云服务的优势,实现一键式Master节点升级,并在升级过程中通过Master节点的主备HA保证已有业务的不间断,方便快捷帮助用户解决主节点规格升级问题。

          隔离主机

          用户发现某个主机出现异常或故障,无法提供服务或影响集群整体性能时,可以临时将主机从集群可用节点排除,使客户端访问其他可用的正常节点。在为集群安装补丁的场景中,也支持排除指定节点不安装补丁。隔离主机仅支持隔离非管理节点。

          主机隔离后该主机上的所有角色实例将被停止,且不能对主机及主机上的所有实例进行启动、停止和配置等操作。另外,主机隔离后无法统计并显示该主机硬件和主机上实例的监控状态及指标数据。

          标签管理

          标签是集群的标识,为集群添加标签,可以方便用户识别和管理拥有的集群资源。翼MR服务通过与标签管理服务(TMS)关联,可以让拥有大量云资源的用户,通过给云资源打标签,快速查找具有同一标签属性的云资源,进行统一检视、修改、删除等管理操作,方便用户对大数据集群及其他相关云资源的统一管理。

          您可以在创建集群时添加标签,也可以在集群创建完成后,在集群的详情页添加标签,您最多可以给集群添加10个标签。

          集群运维

          告警管理

          翼MR可以实时监控大数据集群,通过告警和事件可以识别系统健康状态。同时翼MR也支持用户自定义配置监控与告警阈值用于关注各指标的健康情况,当监控数据达到告警阈值,系统将会触发一条告警信息。

          翼MR还可以与消息通知服务(SMN)的消息服务系统对接,将告警信息通过短信或者邮件等形式推送给用户。

          补丁管理

          翼MR集群支持补丁操作,会及时发布开源大数据组件的补丁。用户能够在翼MR集群管理页面上查看到运行集群相关的补丁发布信息,包括其修复问题的详细说明及影响场景,客户可以根据业务运行情况自行选择是否安装补丁。补丁安装过程是一键式操作,无需人工干预,通过滚动安装,补丁升级不会停止业务,保障用户集群长期可用。

          翼MR服务可以展示详细的补丁安装过程,补丁管理也支持补丁的卸载和失败回滚。

          说明

          翼MR 3.x及之后版本暂不支持在管理控制台执行补丁管理操作。

          运维支撑

          翼MR提供的集群的资源是完全属于用户的,通常情况下,当集群出现问题,需要运维人员支撑时,运维人员是无法直接访问的。为了更好的服务客户,翼MR提供两种方式来减少定位问题时的信息传递:

          • 日志共享:用户可以在翼MR 页面发起日志共享,选择日志范围共享给运维人员,以便运维人员在不接触集群的情况下帮助定位问题。
          • 运维授权:翼MR服务提供运维授权功能,用户在使用翼MR集群过程中,发生问题可以在翼MR页面发起运维授权,由运维人员帮助客户快速定位问题,用户可以随时收回该授权。

          健康检查

          翼MR为用户提供界面化的系统运行环境自动检查服务,帮助用户实现一键式系统运行健康度巡检和审计,保障系统的正常运行,降低系统运维成本。用户查看检查结果后,还可导出检查报告用于存档及问题分析。

          消息通知

          特性简介

          大数据集群运行过程中经常会进行如下操作:

          • 大数据集群经常会发生变更,比如扩容、缩容集群。
          • 业务数据量突然变化,集群触发弹性伸缩。
          • 相关业务结束,需要终止大数据集群等。

          用户想要及时得知这些操作是否成功了,以及当集群出现大数据服务不可用,或节点故障时,用户希望不用隔段时间就登录集群查看,而是可以及时地收到告警通知。翼MR联合消息通知服务(SMN),可以将以上信息主动地通知到用户的手机及邮箱,让维护更加省心省力。

          客户价值

          配置消息通知后,可以实时给用户发送翼MR集群健康状态,用户可以通过手机短信或邮箱实时接收到翼MR集群变更及组件告警信息。翼MR可以帮助用户轻松运维,实时监控,实时发送告警,操作灵活,大数据业务部署更加省心省力。

          特性描述

          翼MR联合消息通知服务(SMN),采用主题订阅模型,提供一对多的消息订阅以及通知功能,能够实现一站式集成多种推送通知方式。

          首先,作为主题拥有者,我们可以先创建一个主题,并对主题设置访问控制权限来决定哪些发布者和订阅者可以通过该主题进行交流。翼MR将集群消息发送至您有权限发布消息的主题,然后所有订阅了该主题的订阅者(可以是手机短信、邮箱等)都将收到集群变更以及组件告警的消息。

          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  元数据
          下一篇 :  应用场景
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明