活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      翼MapReduce

      翼MapReduce

        • 产品动态
        • 产品简介
        • 产品定义
        • 产品优势
        • 功能特性
        • 多租户
        • 安全增强
        • 组件Web UI便捷访问
        • 可靠性增强
        • 作业管理
        • 自定义引导操作
        • 企业项目管理
        • 元数据
        • 集群管理
        • 应用场景
        • 术语解释
        • 与其他产品的关系
        • 权限管理
        • 约束与限制
        • 计费说明
        • 资源节点
        • 产品规格
        • 产品价格
        • 计费模式
        • 购买
        • 变更
        • 续订
        • 退订
        • 快速入门
        • 如何使用翼MapReduce
        • 创建集群
        • 上传示例数据和程序
        • 添加作业
        • 从零开始使用Kerberos认证集群
        • 删除集群
        • 用户指南
        • 准备用户
        • 创建MRS操作用户
        • 创建MRS自定义策略
        • IAM用户同步MRS说明
        • 配置集群
        • 创建方式简介
        • 快速创建集群
        • 快速创建Hadoop分析集群
        • 快速创建HBase查询集群
        • 快速创建Kafka流式集群
        • 快速创建ClickHouse集群
        • 快速创建实时分析集群
        • 创建自定义集群
        • 创建自定义拓扑集群
        • 添加集群标签
        • 授权安全通信
        • 配置弹性伸缩规则
        • 管理数据连接
        • 配置数据连接
        • 配置Ranger数据连接
        • 配置Hive数据连接
        • 通过引导操作安装第三方软件
        • 查看失败的集群操作任务
        • 查看历史集群信息
        • 管理集群
        • 登录集群
        • MRS集群节点简介
        • 登录集群节点
        • 如何确认Manager的主备管理节点
        • 集群概览
        • 集群列表简介
        • 查看集群状态
        • 查看集群基本信息
        • 查看集群补丁信息
        • 查看和定制集群监控指标
        • 管理组件和主机监控
        • 集群运维
        • 导入导出数据
        • 切换集群子网
        • 配置消息通知
        • 健康检查
        • 远程运维
        • 查看MRS服务操作日志
        • 删除集群
        • 节点管理
        • 扩容集群
        • 缩容集群
        • 管理主机(节点)操作
        • 隔离主机
        • 取消隔离主机
        • 作业管理
        • MRS作业简介
        • 运行MapReduce作业
        • 运行SparkSubmit作业
        • 运行HiveSql作业
        • 运行SparkSql作业
        • 运行Flink作业
        • 运行Kafka作业
        • 查看作业配置信息和日志
        • 停止作业
        • 删除作业
        • 使用OBS加密数据运行作业
        • 配置作业消息通知
        • 组件管理
        • 对象管理简介
        • 查看配置
        • 管理服务操作
        • 配置服务参数
        • 配置服务自定义参数
        • 同步服务配置
        • 管理角色实例操作
        • 配置角色实例参数
        • 同步角色实例配置
        • 退服和入服角色实例
        • 启动及停止集群
        • 同步集群配置
        • 导出集群的配置数据
        • 支持滚动重启
        • 告警管理
        • 查看告警列表
        • 查看事件列表
        • 查看与手动清除告警
        • 补丁管理
        • 补丁操作指导
        • 滚动补丁
        • 修复隔离主机补丁
        • 租户管理
        • 使用前须知
        • 租户简介
        • 添加租户
        • 添加子租户
        • 删除租户
        • 管理租户目录
        • 恢复租户数据
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列配置
        • 引导操作
        • 引导操作简介
        • 准备引导操作脚本
        • 查看执行记录
        • 添加引导操作
        • 修改引导操作
        • 删除引导操作
        • 使用MRS客户端
        • 安装客户端
        • 安装客户端(3.x及之后版本)
        • 安装客户端(3.x之前版本)
        • 更新客户端
        • 更新客户端(3.x及之后版本)
        • 更新客户端(3.x之前版本)
        • 各组件客户端使用实践
        • 使用ClickHouse客户端
        • 使用Flink客户端
        • 使用Flume客户端
        • 使用HBase客户端
        • 使用HDFS客户端
        • 使用Hive客户端
        • 使用Impala客户端
        • 使用Kafka客户端
        • 使用Kudu客户端
        • 使用Oozie客户端
        • 使用Storm客户端
        • 使用Yarn客户端
        • 配置存算分离
        • 存算分离简介
        • 配置存算分离集群(委托方式)
        • 配置存算分离集群(AKSK方式)
        • 使用存算分离集群
        • Flink对接OBS文件系统
        • Flume对接OBS文件系统
        • HDFS客户端对接OBS文件系统
        • Hive对接OBS文件系统
        • MapReduce对接OBS文件系统
        • Spark2x对接OBS文件系统
        • Sqoop对接外部存储系统
        • Hudi对接OBS文件系统
        • 访问MRS集群上托管的开源组件Web页面
        • 开源组件Web站点
        • 开源组件端口列表
        • 通过专线访问
        • 通过弹性公网IP访问
        • 通过Windows弹性云主机访问
        • 创建连接MRS集群的SSH隧道并配置浏览器
        • 访问集群Manager
        • 访问FusionInsight Manager(MRS 3.x及之后版本)
        • 访问MRS Manager(MRS 2.x及之前版本)
        • FusionInsight Manager操作指导(适用于3.x)
        • 从这里开始
        • FusionInsight Manager入门指导
        • 查询FusionInsight Manager版本号
        • 登录管理系统
        • 登录管理节点
        • 主页
        • 主页概述
        • 管理监控指标数据报表
        • 主机管理
        • 主机管理页面
        • 查看主机列表
        • 查看主机概览
        • 查看主机进程及资源
        • 主机维护操作
        • 启动、停止主机上的所有实例
        • 执行主机健康检查
        • 分配机架
        • 隔离主机
        • 导出主机信息
        • 资源概况
        • 分布
        • 趋势
        • 集群
        • 主机
        • 运维
        • 告警
        • 告警与事件概述
        • 配置阈值
        • 配置告警屏蔽状态
        • 日志
        • 在线检索日志
        • 下载日志
        • 健康检查
        • 查看健康检查任务
        • 管理健康检查报告
        • 修改健康检查配置
        • 备份恢复设置
        • 创建备份任务
        • 创建恢复任务
        • 其他任务管理说明
        • 审计
        • 审计管理页面概述
        • 配置审计日志转储
        • 租户资源
        • 多租户介绍
        • 简介
        • 技术原理
        • 多租户管理页面概述
        • 相关模型
        • 资源概述
        • 动态资源
        • 存储资源
        • 多租户使用
        • 使用说明
        • 流程概述
        • 使用Superior调度器的租户业务
        • 创建租户
        • 添加租户
        • 添加子租户
        • 添加用户并绑定租户的角色
        • 管理租户
        • 管理租户目录
        • 恢复租户数据
        • 删除租户
        • 管理资源
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列容量配置
        • 管理全局用户策略
        • 使用Capacity调度器的租户业务
        • 创建租户
        • 添加租户
        • 添加子租户
        • 添加用户并绑定租户的角色
        • 管理租户
        • 管理租户目录
        • 恢复租户数据
        • 删除租户
        • Capacity Scheduler模式下清除租户非关联队列
        • 管理资源
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列容量配置
        • 切换调度器
        • 系统设置
        • 权限设置
        • 用户管理
        • 创建用户
        • 修改用户信息
        • 导出用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改用户密码
        • 初始化用户密码
        • 导出认证凭据文件
        • 用户组管理
        • 角色管理
        • 安全策略
        • 配置密码策略
        • 配置私有属性
        • 对接设置
        • 配置SNMP北向参数
        • 配置Syslog北向参数
        • 配置监控指标数据转储
        • 导入证书
        • OMS管理
        • OMS维护页面概述
        • 修改OMS服务配置参数
        • 部件管理
        • 查看部件包
        • 集群管理
        • 配置客户端
        • 安装客户端
        • 使用客户端
        • 更新已安装客户端的配置
        • 管理集群
        • 集群管理概述
        • 滚动重启集群
        • 管理配置过期
        • 下载客户端
        • 修改集群属性
        • 管理集群配置
        • 静态服务池
        • 静态服务资源
        • 配置集群静态资源
        • 查看集群静态资源
        • 客户端管理
        • 管理客户端
        • 批量升级客户端
        • 批量刷新hosts文件
        • 管理服务
        • 服务管理概述
        • 其他服务管理操作
        • 服务详情概述
        • 执行角色实例主备倒换
        • 资源监控
        • 采集堆栈信息
        • 切换Ranger鉴权
        • 服务配置
        • 修改服务配置参数
        • 修改服务自定义配置参数
        • 集群互信管理
        • 集群互信概述
        • 修改Manager系统域名
        • 配置跨Manager集群互信
        • 配置跨集群互信后的用户权限
        • 配置定时备份告警与审计信息
        • 管理实例
        • 实例管理概述
        • 入服与退服实例
        • 管理实例配置
        • 查看实例配置文件
        • 实例组
        • 管理实例组
        • 查看实例组信息
        • 配置实例组参数
        • 修改FusionInsight Manager添加的路由表
        • 切换维护模式
        • 例行维护
        • 日志管理
        • 关于日志
        • Manager日志清单
        • 配置日志级别与文件大小
        • 配置审计日志本地备份数
        • 查看角色实例日志
        • 备份恢复管理
        • 备份恢复简介
        • 备份数据
        • 备份OMS数据
        • 备份DBService数据
        • 备份HBase元数据
        • 备份HBase业务数据
        • 备份NameNode数据
        • 备份HDFS业务数据
        • 备份Hive业务数据
        • 备份Kafka元数据
        • 恢复数据
        • 恢复OMS数据
        • 恢复DBService数据
        • 恢复HBase元数据
        • 恢复HBase业务数据
        • 恢复NameNode数据
        • 恢复HDFS业务数据
        • 恢复Hive业务数据
        • 恢复Kafka元数据
        • 启用集群间拷贝功能
        • 管理本地快速恢复任务
        • 修改备份任务
        • 查看备份恢复任务
        • 安全管理
        • 安全概述
        • 权限模型
        • 权限机制
        • 认证策略
        • 鉴权策略
        • 用户帐号一览表
        • 默认权限信息一览
        • FusionInsight Manager安全功能
        • 帐户管理
        • 帐户安全设置
        • 解锁LDAP用户和管理帐户
        • 解锁系统内部用户
        • 修改集群组件鉴权配置开关
        • 使用普通模式集群用户在非集群节点登录
        • 修改系统用户密码
        • 修改admin密码
        • 修改操作系统用户密码
        • 修改系统内部用户密码
        • 修改Kerberos管理员密码
        • 修改OMS Kerberos管理员密码
        • 修改LDAP管理员和LDAP用户密码(含OMS LDAP)
        • 修改LDAP管理帐户密码
        • 修改组件运行用户密码
        • 修改默认数据库用户密码
        • 修改OMS数据库管理员密码
        • 修改OMS数据库访问用户密码
        • 修改组件数据库用户密码
        • 修改DBService数据库omm用户密码
        • 证书管理
        • 更换CA证书
        • 更换HA证书
        • 安全加固
        • 加固策略
        • 配置受信任IP访问LDAP
        • 加密HFile和WAL内容
        • 安全配置
        • 配置HBase允许修改操作的IP地址白名单
        • 更新集群密钥
        • 加固LDAP
        • 配置Kafka数据传输加密
        • 配置HDFS数据传输加密
        • 配置Controller与Agent间通信加密
        • 更新omm用户ssh密钥
        • 安全维护
        • 帐户维护建议
        • 密码维护建议
        • 日志维护建议
        • 安全声明
        • 告警参考(适用于MRS 3.x版本)
        • ALM-12001 审计日志转储失败
        • ALM-12004 OLdap资源异常
        • ALM-12005 OKerberos资源异常
        • ALM-12006 节点故障
        • ALM-12007 进程故障
        • ALM-12010 Manager主备节点间心跳中断
        • ALM-12011 Manager主备节点同步数据异常
        • ALM-12014 设备分区丢失
        • ALM-12015 设备分区文件系统只读
        • ALM-12016 CPU使用率超过阈值
        • ALM-12017 磁盘容量不足
        • ALM-12018 内存使用率超过阈值
        • ALM-12027 主机PID使用率超过阈值
        • ALM-12028 主机D状态进程数超过阈值
        • ALM-12033 慢盘故障
        • ALM-12034 周期备份任务失败
        • ALM-12035 恢复任务失败后数据状态未知
        • ALM-12038 监控指标转储失败
        • ALM-12039 OMS数据库主备不同步
        • ALM-12040 系统熵值不足
        • ALM-12041 关键文件权限异常
        • ALM-12042 关键文件配置异常
        • ALM-12045 网络读包丢包率超过阈值
        • ALM-12046 网络写包丢包率超过阈值
        • ALM-12047 网络读包错误率超过阈值
        • ALM-12048 网络写包错误率超过阈值
        • ALM-12049 网络读吞吐率超过阈值
        • ALM-12050 网络写吞吐率超过阈值
        • ALM-12051 磁盘Inode使用率超过阈值
        • ALM-12052 TCP临时端口使用率超过阈值
        • ALM-12053 主机文件句柄使用率超过阈值
        • ALM-12054 证书文件失效
        • ALM-12055 证书文件即将过期
        • ALM-12057 元数据未配置周期备份到第三方服务器的任务
        • ALM-12061 进程使用率超过阈值
        • ALM-12062 OMS参数配置同集群规模不匹配
        • ALM-12063 磁盘不可用
        • ALM-12064 主机随机端口范围配置与集群使用端口冲突
        • ALM-12066 节点间互信失效
        • ALM-12067 tomcat资源异常
        • ALM-12068 acs资源异常
        • ALM-12069 aos资源异常
        • ALM-12070 controller资源异常
        • ALM-12071 httpd资源异常
        • ALM-12072 floatip资源异常
        • ALM-12073 cep资源异常
        • ALM-12074 fms资源异常
        • ALM-12075 pms资源异常
        • ALM-12076 gaussDB资源异常
        • ALM-12077 omm用户过期
        • ALM-12078 omm密码过期
        • ALM-12079 omm用户即将过期
        • ALM-12080 omm密码即将过期
        • ALM-12081 ommdba用户过期
        • ALM-12082 ommdba用户即将过期
        • ALM-12083 ommdba密码即将过期
        • ALM-12084 ommdba密码过期
        • ALM-12085 服务审计日志转储失败
        • ALM-12087 系统处于升级观察期
        • ALM-12089 节点间网络互通异常
        • ALM-12101 AZ不健康
        • ALM-12102 AZ高可用组件未按容灾需求部署
        • ALM-12110 获取ECS临时ak/sk失败
        • ALM-13000 ZooKeeper服务不可用
        • ALM-13001 ZooKeeper可用连接数不足
        • ALM-13002 ZooKeeper直接内存使用率超过阈值
        • ALM-13003 ZooKeeper进程垃圾回收(GC)时间超过阈值
        • ALM-13004 ZooKeeper堆内存使用率超过阈值
        • ALM-13005 ZooKeeper中组件顶层目录的配额设置失败
        • ALM-13006 Znode数量或容量超过阈值
        • ALM-13007 ZooKeeper客户端可用连接数不足
        • ALM-13008 ZooKeeper Znode数量使用率超出阈值
        • ALM-13009 ZooKeeper Znode容量使用率超出阈值
        • ALM-13010 配置quota的目录Znode使用率超出阈值
        • ALM-14000 HDFS服务不可用
        • ALM-14001 HDFS磁盘空间使用率超过阈值
        • ALM-14002 DataNode磁盘空间使用率超过阈值
        • ALM-14003 丢失的HDFS块数量超过阈值
        • ALM-14006 HDFS文件数超过阈值
        • ALM-14007 NameNode堆内存使用率超过阈值
        • ALM-14008 DataNode堆内存使用率超过阈值
        • ALM-14009 Dead DataNode数量超过阈值
        • ALM-14010 NameService服务异常
        • ALM-14011 DataNode数据目录配置不合理
        • ALM-14012 Journalnode数据不同步
        • ALM-14013 NameNode FsImage文件更新失败
        • ALM-14014 NameNode进程垃圾回收(GC)时间超过阈值
        • ALM-14015 DataNode进程垃圾回收(GC)时间超过阈值
        • ALM-14016 DataNode直接内存使用率超过阈值
        • ALM-14017 NameNode直接内存使用率超过阈值
        • ALM-14018 NameNode非堆内存使用率超过阈值
        • ALM-14019 DataNode非堆内存使用率超过阈值
        • ALM-14020 HDFS目录条目数量超过阈值
        • ALM-14021 NameNode RPC处理平均时间超过阈值
        • ALM-14022 NameNode RPC队列平均时间超过阈值
        • ALM-14023 总副本预留磁盘空间所占比率超过阈值
        • ALM-14024 租户空间使用率超过阈值
        • ALM-14025 租户文件对象使用率超过阈值
        • ALM-14026 DataNode块数超过阈值
        • ALM-14027 DataNode磁盘故障
        • ALM-14028 待补齐的块数超过阈值
        • ALM-14029 单副本的块数超过阈值
        • ALM-16000 连接到HiveServer的session数占最大允许数的百分比超过阈值
        • ALM-16001 Hive数据仓库空间使用率超过阈值
        • ALM-16002 Hive SQL执行成功率低于阈值
        • ALM-16003 Background线程使用率超过阈值
        • ALM-16004 Hive服务不可用
        • ALM-16005 Hive服务进程堆内存使用超出阈值
        • ALM-16006 Hive服务进程直接内存使用超出阈值
        • ALM-16007 Hive GC 时间超出阈值
        • ALM-16008 Hive服务进程非堆内存使用超出阈值
        • ALM-16009 Map数超过阈值
        • ALM-16045 Hive数据仓库被删除
        • ALM-16046 Hive数据仓库权限被修改
        • ALM-16047 HiveServer已从Zookeeper注销
        • ALM-16048 Tez或者Spark库路径不存在
        • ALM-17003 Oozie服务不可用
        • ALM-17004 Oozie堆内存使用率超过阈值
        • ALM-17005 Oozie非堆内存使用率超过阈值
        • ALM-17006 Oozie直接内存使用率超过阈值
        • ALM-17007 Oozie进程垃圾回收(GC)时间超过阈值
        • ALM-18000 Yarn服务不可用
        • ALM-18002 NodeManager心跳丢失
        • ALM-18003 NodeManager不健康
        • ALM-18008 ResourceManager堆内存使用率超过阈值
        • ALM-18009 JobHistoryServer堆内存使用率超过阈值
        • ALM-18010 ResourceManager进程垃圾回收(GC)时间超过阈值
        • ALM-18011 NodeManager进程垃圾回收(GC)时间超过阈值
        • ALM-18012 JobHistoryServer进程垃圾回收(GC)时间超过阈值
        • ALM-18013 ResourceManager直接内存使用率超过阈值
        • ALM-18014 NodeManager直接内存使用率超过阈值
        • ALM-18015 JobHistoryServer直接内存使用率超过阈值
        • ALM-18016 ResourceManager非堆内存使用率超过阈值
        • ALM-18017 NodeManager非堆内存使用率超过阈值
        • ALM-18018 NodeManager堆内存使用率超过阈值
        • ALM-18019 JobHistoryServer非堆内存使用率超过阈值
        • ALM-18020 Yarn任务执行超时
        • ALM-18021 Mapreduce服务不可用
        • ALM-18022 Yarn队列资源不足
        • ALM-18023 Yarn任务挂起数超过阈值
        • ALM-18024 Yarn任务挂起内存量超阈值
        • ALM-18025 Yarn被终止的任务数超过阈值
        • ALM-18026 Yarn上运行失败的任务数超过阈值
        • ALM-19000 HBase服务不可用
        • ALM-19006 HBase容灾同步失败
        • ALM-19007 HBase GC时间超出阈值
        • ALM-19008 HBase服务进程堆内存使用率超出阈值
        • ALM-19009 HBase服务进程直接内存使用率超出阈值
        • ALM-19011 RegionServer的Region数量超出阈值
        • ALM-19012 HBase系统表目录或文件丢失
        • ALM-19013 region处在RIT状态的时长超过阈值
        • ALM-19014 在ZooKeeper上的容量配额使用率严重超过阈值
        • ALM-19015 在ZooKeeper上的数量配额使用率超过阈值
        • ALM-19016 在ZooKeeper上的数量配额使用率严重超过阈值
        • ALM-19017 在ZooKeeper上的容量配额使用率超过阈值
        • ALM-19018 HBase合并队列超出阈值
        • ALM-19019 HBase容灾等待同步的HFile文件数量超过阈值
        • ALM-19020 HBase容灾等待同步的wal文件数量超过阈值
        • ALM-20002 Hue服务不可用
        • ALM-24000 Flume服务不可用
        • ALM-24001 Flume Agent异常
        • ALM-24003 Flume Client连接中断
        • ALM-24004 Flume读取数据异常
        • ALM-24005 Flume传输数据异常
        • ALM-24006 Flume Server堆内存使用率超过阈值
        • ALM-24007 Flume Server直接内存使用率超过阈值
        • ALM-24008 Flume Server非堆内存使用率超过阈值
        • ALM-24009 Flume Server垃圾回收(GC)时间超过阈值
        • ALM-24010 Flume证书文件非法或已损坏
        • ALM-24011 Flume证书文件即将过期
        • ALM-24012 Flume证书文件已过期
        • ALM-24013 Flume MonitorServer证书文件非法或已损坏
        • ALM-24014 Flume MonitorServer证书文件即将过期
        • ALM-24015 Flume MonitorServer证书文件已过期
        • ALM-25000 LdapServer服务不可用
        • ALM-25004 LdapServer数据同步异常
        • ALM-25005 Nscd服务异常
        • ALM-25006 Sssd服务异常
        • ALM-25500 KrbServer服务不可用
        • ALM-26051 Storm服务不可用
        • ALM-26052 Storm服务可用Supervisor数量小于阈值
        • ALM-26053 Storm Slot使用率超过阈值
        • ALM-26054 Nimbus堆内存使用率超过阈值
        • ALM-27001 DBService服务不可用
        • ALM-27003 DBService主备节点间心跳中断
        • ALM-27004 DBService主备数据不同步
        • ALM-27005 数据库连接数使用率超过阈值
        • ALM-27006 数据目录磁盘空间使用率超过阈值
        • ALM-28001 Spark服务不可用(2.x及以前版本)
        • ALM-27007 数据库进入只读模式
        • ALM-29000 Impala服务不可用
        • ALM-29004 Impalad进程内存占用率超过阈值
        • ALM-29005 Impalad JDBC连接数超过阈值
        • ALM-29006 Impalad ODBC连接数超过阈值
        • ALM-29100 Kudu服务不可用
        • ALM-29104 Tserver进程内存占用率超过阈值
        • ALM-29106 Tserver进程CPU占用率过高
        • ALM-29107 Tserver进程内存使用百分比超过阈值
        • ALM-38000 Kafka服务不可用
        • ALM-38001 Kafka磁盘容量不足
        • ALM-38002 Kafka堆内存使用率超过阈值
        • ALM-38004 Kafka直接内存使用率超过阈值
        • ALM-38005 Broker进程垃圾回收(GC)时间超过阈值
        • ALM-38006 Kafka未完全同步的Partition百分比超过阈值
        • ALM-38007 Kafka默认用户状态异常
        • ALM-38008 Kafka数据目录状态异常
        • ALM-38009 Broker磁盘IO繁忙
        • ALM-38010 存在单副本的Topic
        • ALM-43001 Spark2x服务不可用
        • ALM-43006 JobHistory2x进程堆内存使用超出阈值
        • ALM-43007 JobHistory2x进程非堆内存使用超出阈值
        • ALM-43008 JobHistory2x进程直接内存使用超出阈值
        • ALM-43009 JobHistory2x进程GC时间超出阈值
        • ALM-43010 JDBCServer2x进程堆内存使用超出阈值
        • ALM-43011 JDBCServer2x进程非堆内存使用超出阈值
        • ALM-43012 JDBCServer2x进程直接内存使用超出阈值
        • ALM-43013 JDBCServer2x进程GC时间超出阈值
        • ALM-43017 JDBCServer2x进程Full GC次数超出阈值
        • ALM-43018 JobHistory2x进程Full GC次数超出阈值
        • ALM-43019 IndexServer2x进程堆内存使用超出阈值
        • ALM-43020 IndexServer2x进程非堆内存使用超出阈值
        • ALM-43021 IndexServer2x进程直接内存使用超出阈值
        • ALM-43022 IndexServer2x进程GC时间超出阈值
        • ALM-43023 IndexServer2x进程Full GC次数超出阈值
        • ALM-44004 Presto Coordinator资源组排队任务超过阈值
        • ALM-44005 Presto Coordinator进程垃圾收集时间超出阈值
        • ALM-44006 Presto Worker进程垃圾收集时间超出阈值
        • ALM-45175 OBS元数据接口调用平均时间超过阈值
        • ALM-45176 OBS元数据接口调用成功率低于阈值
        • ALM-45177 OBS数据读操作接口调用成功率低于阈值
        • ALM-45178 OBS数据写操作接口调用成功率低于阈值
        • ALM-45275 Ranger服务不可用
        • ALM-45276 RangerAdmin状态异常
        • ALM-45277 RangerAdmin堆内存使用率超过阈值
        • ALM-45278 RangerAdmin直接内存使用率超过阈值
        • ALM-45279 RangerAdmin非堆内存使用率超过阈值
        • ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值
        • ALM-45281 UserSync堆内存使用率超过阈值
        • ALM-45282 UserSync直接内存使用率超过阈值
        • ALM-45283 UserSync非堆内存使用率超过阈值
        • ALM-45284 UserSync垃圾回收(GC)时间超过阈值
        • ALM-45285 TagSync堆内存使用率超过阈值
        • ALM-45286 TagSync直接内存使用率超过阈值
        • ALM-45287 TagSync非堆内存使用率超过阈值
        • ALM-45288 TagSync垃圾回收(GC)时间超过阈值
        • ALM-45425 ClickHouse服务不可用
        • ALM-45426 ClickHouse服务在ZooKeeper的数量配额使用率超过阈值
        • ALM-45427 ClickHouse服务在ZooKeeper的容量配额使用率超过阈值
        • ALM-45736 Guardian服务不可用
        • MRS Manager操作指导(适用于2.x及之前)
        • MRS Manager简介
        • 查看集群运行任务
        • 监控管理
        • 系统概览
        • 管理服务和主机监控
        • 管理资源分布
        • 配置监控指标转储
        • 告警管理
        • 查看与手动清除告警
        • 配置监控与告警阈值
        • 配置Syslog北向参数
        • 配置SNMP北向参数
        • 对象管理
        • 对象管理简介
        • 查看配置
        • 管理服务操作
        • 配置服务参数
        • 配置服务自定义参数
        • 同步服务配置
        • 管理角色实例操作
        • 配置角色实例参数
        • 同步角色实例配置
        • 退服和入服务角色实例
        • 管理主机操作
        • 隔离主机
        • 取消隔离主机
        • 启动及停止集群
        • 同步集群配置
        • 导出集群的配置数据
        • 日志管理
        • 关于日志
        • Manager日志清单
        • 查看及导出审计日志
        • 导出服务日志
        • 配置审计日志导出参数
        • 健康检查管理
        • 执行健康检查
        • 查看并导出检查报告
        • 配置健康检查报告保存数
        • 管理健康检查报告
        • DBService健康检查指标项说明
        • Flume 健康检查指标项说明
        • HBase健康检查指标项说明
        • Host健康检查指标项说明
        • HDFS健康检查指标项说明
        • Hive健康检查指标项说明
        • Kafka健康检查指标项说明
        • KrbServer健康检查指标项说明
        • LdapServer健康检查指标项说明
        • Loader健康检查指标项说明
        • MapReduce健康检查指标项说明
        • OMS健康检查指标项说明
        • Spark健康检查指标项说明
        • Storm健康检查指标项说明
        • Yarn健康检查指标项说明
        • ZooKeeper健康检查指标项说明
        • 静态服务池管理
        • 查看静态服务池状态
        • 配置静态服务池
        • 租户管理
        • 租户简介
        • 添加租户
        • 添加子租户
        • 删除租户
        • 管理租户目录
        • 恢复租户数据
        • 添加资源池
        • 修改资源池
        • 删除资源池
        • 配置队列
        • 配置资源池的队列容量策略
        • 清除队列配置
        • 备份与恢复
        • 备份与恢复简介
        • 备份元数据
        • 恢复元数据
        • 修改备份任务
        • 查看备份恢复任务
        • 安全管理
        • 未开启Kerberos认证集群中的默认用户清单
        • 开启Kerberos认证集群中的默认用户清单
        • 修改操作系统用户密码
        • 修改admin密码
        • 修改Kerberos管理员密码
        • 修改LDAP管理员和LDAP用户密码
        • 修改组件运行用户密码
        • 修改OMS数据库管理员密码
        • 修改OMS数据库数据访问用户密码
        • 修改组件数据库用户密码
        • 更换HA证书
        • 更新集群密钥
        • 权限管理
        • 创建角色
        • 创建用户组
        • 创建用户
        • 修改用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改操作用户密码
        • 初始化系统用户密码
        • 下载用户认证文件
        • 修改密码策略
        • MRS多用户权限管理
        • MRS集群中的用户与权限
        • 开启Kerberos认证集群中的默认用户清单
        • 创建角色
        • 创建用户组
        • 创建用户
        • 修改用户信息
        • 锁定用户
        • 解锁用户
        • 删除用户
        • 修改操作用户密码
        • 初始化系统用户密码
        • 下载用户认证文件
        • 修改密码策略
        • 配置跨集群互信
        • 配置并使用互信集群的用户
        • 配置MRS多用户访问OBS细粒度权限
        • 补丁操作指导
        • 安装与卸载补丁
        • 支持滚动补丁
        • 修复隔离主机补丁
        • 支持滚动重启
        • 安全性说明
        • 集群(未启用Kerberos认证)安全配置建议
        • 安全认证原理和认证机制
        • 高危操作一览表
        • 附录
        • MRS 3.x版本操作注意事项
        • 最佳实践
        • 数据分析
        • 使用Hive加载HDFS数据并分析图书评分情况
        • 通过Flink作业处理OBS数据
        • 常见问题
        • 计费类
        • 购买类
        • 操作类
        • 集群创建类
        • 帐号密码类
        • 帐号权限类
        • 客户端使用类
        • Web页面访问类
        • 监控告警类
        • 性能优化类
        • 作业开发类
        • 集群升级/补丁
        • 集群访问类
        • 大数据业务开发
        • API使用类
        • 集群管理类
        • Kerberos使用
        • 元数据管理
        • 文档下载
        • 翼MapReduce服务用户操作指南
        • 翼MapReduce服务组件操作指南
        • 翼MapReduce服务故障排除
        • 相关协议
        • 天翼云翼MapReduce服务协议
          无相关产品

          本页目录

          帮助中心翼MapReduce用户指南高危操作一览表
          高危操作一览表
          更新时间 2023-06-09 14:41:37
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2023-06-09 14:41:37
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本章节主要介绍翼MapReduce服务KrbServer健康检查指标项说明。

          禁用操作

          下表中描述了在集群操作与维护阶段,观察进行日常操作时应注意的禁用操作。

          禁用操作

          类别 操作风险
          严禁删除ZooKeeper相关数据目录 ClickHouse/HDFS/Yarn/HBase/Hive等很多组件都依赖于ZooKeeper,在ZooKeeper中保存元数据信息。删除ZooKeeper中相关数据目录将会影响相关组件的正常运行。
          严禁JDBCServer主备节点频繁倒换 频繁主备倒换将导致业务中断。
          严禁删除Phoenix系统表或系统表数据(SYSTEM.CATALOG、SYSTEM.STATS、SYSTEM.SEQUENCE、SYSTEM. FUNCTION) 删除系统表将导致无法正常进行业务操作。
          严禁手动修改Hive元数据库的数据(hivemeta数据库) 修改Hive元数据可能会导致Hive数据解析错误,Hive无法正常提供服务。
          禁止对Hive的元数据表手动进行insert和update操作 修改Hive元数据可能会导致Hive数据解析错误,Hive无法正常提供服务。
          严禁修改Hive私有文件目录hdfs:///tmp/hive-scratch的权限 修改该目录权限可能会导致Hive服务不可用。
          严禁修改Kafka配置文件中broker.id 修改Kafka配置文件中broker.id将会导致该节点数据失效。
          严禁修改节点主机名 主机名修改后会导致该主机上相关实例和上层组件无法正常提供服务,且无法修复。
          禁止重装节点OS 该操作会导致MRS集群进入异常状态,影响MRS集群使用。
          禁止使用私有镜像 该操作会导致MRS集群进入异常状态,影响MRS集群使用。

          以下各表分别描述了各组件在操作与维护阶段,进行日常操作时应注意的高危操作。

          集群高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          随意修改omm用户下的文件目录或者文件权限 该操作会导致MRS集群服务不可用 ★★★★★ 请勿执行该操作 观察MRS集群服务是否可用
          绑定弹性公网IP 该操作会将集群的manager所在的master节点暴露在公网,会增大来自互联网的网络攻击风险可能性 ★★★★★ 请确认绑定的弹性公网IP为可信任的公网访问IP 无
          开放集群22端口安全组规则 该操作会增大用户利用22进行漏洞攻击的风险 ★★★★★ 针对开放的22端口进行设置安全组规则,只允许可信的IP可以访问该端口,入方向规则不推荐设置允许0.0.0.0可以访问。 无
          删除集群或删除集群数据 该操作会导致数据丢失 ★★★★★ 删除前请务必再次确认该操作的必要性,同时要保证数据已完成备份 无
          缩容集群 该操作会导致数据丢失 ★★★★★ 缩容前请务必再次确认该操作的必要性,同时要保证数据已完成备份 无
          卸载磁盘或格式化数据盘 该操作会导致数据丢失 ★★★★★ 操作前请请务必再次确认该操作的必要性,同时要保证数据已完成备份 无

          Manager高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改OMS密码 该操作会重启OMS各进程,影响集群的管理维护 ★★★ 修改前确认操作的必要性,修改时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常
          导入证书 该操作会重启OMS进程和整个集群,影响集群的管理维护和业务 ★★★ 修改前确认操作的必要性,修改时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          升级 该操作会重启Manager和整个集群,影响集群的管理维护和业务 分配集群管理权限的用户,需要严格管控,以防范可能的安全风险 ★★★ 修改时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          恢复OMS 该操作会重启Manager和整个集群,影响集群的管理维护和业务 ★★★ 修改前确认操作的必要性,修改时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          修改IP 该操作会重启Manager和整个集群,影响集群的管理维护和业务 ★★★ 修改时确保同一时间无其它管理维护操作,且修改的IP填写正确无误 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          修改日志级别 如果修改为DEBUG,会导致Manager运行速度明显降低 ★★ 修改前确认操作的必要性,并及时修改回默认设定 无
          更换控制节点 该操作会导致部署在该节点上的服务中断,且当该节点同时为管理节点时,更换节点会导致重启OMS各进程,影响集群的管理维护 ★★★ 更换前确认操作的必要性,更换时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          更换管理节点 该操作会导致部署在该节点上的服务中断,会导致重启OMS各进程,影响集群的管理维护 ★★★★ 更换前确认操作的必要性,更换时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          重启下层服务时,如果勾选同时重启上层服务 该操作会导致上层服务业务中断,影响集群的管理维护和业务 ★★★★ 操作前确认操作的必要性,操作时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          修改OLDAP端口 修改该参数时,会重启LdapServer和Kerberos服务和其关联的所有服务,会影响业务运行 ★★★★★ 操作前确认操作的必要性,操作时确保同一时间无其它管理维护操作 无
          用户删除supergroup组 删除supergroup组导致相关用户权限变小,影响业务访问 ★★★★★ 修改前确认需要添加的权限,确保用户绑定的supergroup权限删除前,相关权限已经添加,不会对业务造成影响 无
          重启服务 重启过程中会中断服务,如果勾选同时重启上层服务会导致依赖该服务的上层服务中断 ★★★ 操作前确认重启的必要性 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          修改节点SSH默认端口 修改默认端口(22)将导致创建集群、添加服务/实例、添加主机、重装主机等功能无法正常使用,并且会导致集群健康检查结果中节点互信、omm/ommdba用户密码过期等检查项不准确 ★★★ 执行相关操作前将SSH端口改回默认值 无

          ClickHouse高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          删除数据目录 该操作将会导致业务信息丢失 ★★★ 请勿手动删除数据目录 观察数据目录是否正常
          缩容ClickHouseServer实例 该操作需要关注同分片中的ClickHouseServer实例节点需要同时退服缩容,否则会造成逻辑集群拓扑信息错乱;该操作执行前需检查逻辑集群内各节点的数据库和数据表信息,进行缩容预分析,保证缩容退服过程中数据迁移成功,避免数据丢失 ★★★★★ 进行缩容操作前,提前收集信息进行ClickHouse逻辑集群及实例节点状态判断 观察ClickHouse逻辑集群拓扑信息,各ClickHouseServer中数据库和数据表信息,以及数据量
          扩容ClickHouseServer实例 该操作需要关注新扩容节点是否需要创建老节点上同名的数据库或数据表,否则会造成后续数据迁移、数据均衡以及缩容退服失败 ★★★★★ 进行扩容操作前,确认新扩容ClickHouseServer实例作用和目的,是否需要同步创建相关数据库和数据表 观察ClickHouse逻辑集群拓扑信息,各ClickHouseServer中数据库和数据表信息,以及数据量
          退服ClickHouseServer实例 该操作需要关注同分片中的ClickHouseServer实例节点需要同时退服,否则会造成逻辑集群拓扑信息错乱;该操作执行前需检查逻辑集群内各节点的数据库和数据表信息,进行预分析,保证退服过程中数据迁移成功,避免数据丢失 ★★★★★ 进行退服操作前,提前收集信息进行Clickhouse逻辑集群及实例节点状态判断 观察ClickHouse逻辑集群拓扑信息,各ClickHouseServer中数据库和数据表信息,以及数据量
          入服ClickHouseServer实例 该操作需要关注入服时必须选择原有分片中的所有节点入服,否则会造成逻辑集群拓扑信息错乱 ★★★★★ 进行入服操作前,对于待入服节点的分片归属信息需要确认 观察ClickHouse逻辑集群拓扑信息
          修改数据目录下内容(创建文件、文件夹) 该操作将会导致该节点上的ClickHouse的实例故障 ★★★ 请勿手动在数据目录下创建或修改文件及文件夹 观察数据目录是否正常
          单独启停基础组件 该操作将会影响服务的一些基础功能导致业务失败 ★★★ 请勿单独启停ZooKeeper/Kerberos/LDAP等基础组件,启停基础组件请勾选关联服务 观察服务状态是否正常
          重启/停止服务 该操作将会导致业务中断 ★★ 确保在必要时重启/停止服务 观察服务是否运行正常

          DBService高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改DBService密码 修改密码需要重启服务,服务在重启过程中无法访问。 ★★★★ 修改前确认操作的必要性,修改时确保同一时间无其它管理维护操作。 观察是否有未恢复的告警产生,观察集群的管理维护是否正常
          恢复DBService数据 数据恢复后,会丢失从备份时刻到恢复时刻之间的数据。 数据恢复后,依赖DBService的组件可能配置过期,需要重启配置过期的服务。 ★★★★ 恢复前确认操作的必要性,恢复时确保同一时间无其它管理维护操作。 观察是否有未恢复的告警产生,观察集群的管理维护是否正常
          DBService主备倒换 倒换DBServer过程中,DBService无法提供服务。 ★★ 操作前确认该操作的必要性,操作时确保同一时间无其它管理维护操作。 无
          修改DBService浮动IP配置 需要重启DBService服务使配置生效,服务在重启无法访问。 如果浮动IP已被使用过,将会导致配置失败,DBService启动失败。 ★★★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效。 观察服务能否正常启动

          Flink高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改日志级别 如果修改为DEBUG,会影响任务运行性能 ★★ 修改前确认操作的必要性,并及时修改回默认设定 无
          修改文件权限 该操作可能导致任务运行失败 ★★★ 修改前确认操作的必要性 观察相关业务操作是否正常

          Flume高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改Flume实例的启动参数GC_OPTS 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          修改HDFS的副本数目dfs.replication,将默认值由3改为1 导致: 1. 存储可靠性下降,磁盘故障时,会发生数据丢失 2. NameNode重启失败,HDFS服务不可用 ★★★★ 修改相关配置项时,请仔细查看参数说明。保证数据存储的副本数不低于2 观察默认的副本值是否不为1,HDFS服务是否可以正常提供服务

          HBase高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改加密的相关配置项 l hbase.regionserver.wal.encryption l hbase.crypto.keyprovider.parameters.uri l hbase.crypto.keyprovider.parameters.encryptedtext 导致服务启动异常 ★★★★ 修改相关配置项时请严格按照提示描述,加密相关配置项是有关联的,确保修改后的值有效 观察服务能否正常启动
          已使用加密的情况下关闭或者切换加密算法,关闭主要指修改hbase.regionserver.wal.encryption为false,切换主要指AES和SMS4的切换 导致服务启动失败,数据丢失 ★★★★ 加密HFile和WAL内容的时候,如果已经使用一种加密算法加密并且已经建表,请不要随意关闭或者切换加密算法。 未建加密表(ENCRYPTION=>AES/SMS4)的情况下可以切换,否则禁止操作 无
          修改HBase实例的启动参数GC_OPTS、HBASE_HEAPSIZE 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效,且GC_OPTS与HBASE_HEAPSIZE参数值无冲突 观察服务能否正常启动
          使用OfflineMetaRepair工具 导致服务启动异常 ★★★★ 必须在HBase下线的情况下才可以使用该命令,而且不能在数据迁移的场景中使用该命令 观察HBase服务是否可以正常启动。

          HDFS高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改HDFS的NameNode的数据存储目录dfs.namenode.name.dir、DataNode的数据配置目录dfs.datanode.data.dir 导致服务启动异常 ★★★★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          执行hadoop distcp命令时,使用**-delete**参数 Distcp拷贝时,源集群没有而目的集群存在的文件,会在目的集群删除 ★★ 在使用Distcp的时候,确保是否保留目的集群多余的文件,谨慎使用**-delete**参数 Distcp数据拷贝后,查看目的的数据是否按照参数配置保留或删除
          修改HDFS实例的启动参数GC_OPTS、HADOOP_HEAPSIZE和GC_PROFILE 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效,且GC_OPTS与HADOOP_HEAPSIZE参数值无冲突 观察服务能否正常启动
          修改HDFS的副本数目dfs.replication,将默认值由3改为1 导致: 1. 存储可靠性下降,磁盘故障时,会发生数据丢失 2. NameNode重启失败,HDFS服务不可用 ★★★★ 修改相关配置项时,请仔细查看参数说明。保证数据存储的副本数不低于2 观察默认的副本值是否不为1,HDFS服务是否可以正常提供服务
          修改Hadoop中各模块的RPC通道的加密方式hadoop.rpc.protection 导致服务故障及业务异常 ★★★★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察HDFS及其他依赖HDFS的服务能否正常启动,并提供服务

          Hive高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改Hive实例的启动参数GC_OPTS 修改该参数可能会导致Hive实例无法启动 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          删除MetaStore所有实例 Hive元数据丢失,Hive无法提供服务 ★★★ 除非确定丢弃Hive所有表信息,否则不要执行该操作 观察服务能否正常启动
          使用HDFS文件系统接口或者HBase接口删除或修改Hive表对应的文件 该操作会导致Hive业务数据丢失或被篡改 ★★ 除非确定丢弃这些数据,或者确保该修改操作符合业务需求,否则不要执行该操作 观察Hive数据是否完整
          使用HDFS文件系统接口或者HBase接口修改Hive表对应的文件或目录访问权限 该操作可能会导致相关业务场景不可用 ★★★ 请勿执行该操作 观察相关业务操作是否正常
          使用HDFS文件系统接口删除或修改文件hdfs:///apps/templeton/hive-3.1.0.tar.gz 该操作可能会导致WebHCat无法正常执行业务 ★★ 请勿执行该操作 观察相关业务操作是否正常
          导出表数据覆盖写入本地目录,例如将t1表中数据导出,覆盖到“/opt/dir”路径下: insert overwrite local directory '/opt/dir' select * from t1; 该操作会删除目标目录,如果设置错误,会导致软件或者操作系统无法启动 ★★★★★ 确认需要写入的路径下不要包含任何文件;或者不要使用overwrite关键字 观察目标路径是否有文件丢失
          将不同的数据库、表或分区文件指定至相同路径,例如默认仓库路径“/user/hive/warehouse”。 执行创建操作后数据可能会紊乱,如果删除其中一个数据库、表或分区,会导致其他对象数据丢失 ★★★★★ 请勿执行该操作 观察目标路径是否有文件丢失

          Kafka高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          删除Topic 该操作将会删除已有的主题和数据 ★★★ 采用Kerberos认证,保证合法用户具有操作权限,并确保主题名称正确 观察主题是否正常处理
          删除数据目录 该操作将会导致业务信息丢失 ★★★ 请勿手动删除数据目录 观察数据目录是否正常
          修改数据目录下内容(创建文件、文件夹) 该操作将会导致该节点上的Broker实例故障 ★★★ 请勿手动在数据目录下创建或修改文件及文件夹 观察数据目录是否正常
          修改磁盘自适应功能“disk.adapter.enable”参数 该操作会在磁盘使用空间达到阈值时调整Topic数据保存周期,超出保存周期的历史数据可能被清除 ★★★ 若个别Topic不能做保存周期调整,将该Topic配置在“disk.adapter.topic.blacklist”参数中 在KafkaTopic监控页面观察数据的存储周期
          修改数据目录“log.dirs”配置 该配置不正确将会导致进程故障 ★★★ 确保所修改或者添加的数据目录为空目录,且权限正确 观察数据目录是否正常
          减容Kafka集群 该操作将会导致部分Topic数据副本数量减少,可能会导致Topic无法访问 ★★ 请先做好数据副本转移工作,然后再进行减容操作 观察分区所在备份节点是否都存活,确保数据安全
          单独启停基础组件 该操作将会影响服务的一些基础功能导致业务失败 ★★★ 请勿单独启停ZooKeeper/Kerberos/LDAP等基础组件,启停基础组件请勾选关联服务 观察服务状态是否正常
          重启/停止服务 该操作将会导致业务中断 ★★ 确保在必要时重启/停止服务 观察服务是否运行正常
          修改配置参数 该操作将需要重启服务使得配置生效 ★★ 确保在必要时修改配置 观察服务是否运行正常
          删除/修改元数据 修改或者删除ZooKeeper上Kafka的元数据可能导致Topic或者Kafka服务不可用 ★★★ 请勿删除或者修改Kafka在ZooKeeper上保存的元数据信息 观察Topic或者Kafka服务是否可用
          修改元数据备份文件 修改Kafka元数据备份文件,并被使用进行Kafka元数据恢复成功后,可能导致Topic或者Kafka服务不可用 ★★★ 请勿修改Kafka元数据备份文件 观察Topic或者Kafka服务是否可用

          KrbServer高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改KrbServer的参数KADMIN_PORT 修改该参数后,若没有及时重启KrbServer服务和其关联的所有服务,会导致集群内部KrbClient的配置参数异常,影响业务运行 ★★★★★ 修改该参数后,请重启KrbServer服务和其关联的所有服务 无
          修改KrbServer的参数kdc_ports 修改该参数后,若没有及时重启KrbServer服务和其关联的所有服务,会导致集群内部KrbClient的配置参数异常,影响业务运行 ★★★★★ 修改该参数后,请重启KrbServer服务和其关联的所有服务 无
          修改KrbServer的参数KPASSWD_PORT 修改该参数后,若没有及时重启KrbServer服务和其关联的所有服务,会导致集群内部KrbClient的配置参数异常,影响业务运行 ★★★★★ 修改该参数后,请重启KrbServer服务和其关联的所有服务 无
          修改Manager系统域名 若没有及时重启KrbServer服务和其关联的所有服务,会导致集群内部KrbClient的配置参数异常,影响业务运行 ★★★★★ 修改该参数后,请重启KrbServer服务和其关联的所有服务 无
          配置跨集群互信 该操作会重启KrbServer服务和其关联的所有服务,影响集群的管理维护和业务 ★★★★★ 更换前确认操作的必要性,更换时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常

          LdapServer高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改LdapServer的参数LDAP_SERVER_PORT 修改该参数后,若没有及时重启LdapServer服务和其关联的所有服务,会导致集群内部LdapClient的配置参数异常,影响业务运行 ★★★★★ 修改该参数后,请重启LdapServer服务和其关联的所有服务 无
          恢复LdapServer数据 该操作会重启Manager和整个集群,影响集群的管理维护和业务 ★★★★★ 修改前确认操作的必要性,修改时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          更换LdapServer所在节点 该操作会导致部署在该节点上的服务中断,且当该节点为管理节点时,更换节点会导致重启OMS各进程,影响集群的管理维护 ★★★ 更换前确认操作的必要性,更换时确保同一时间无其它管理维护操作 观察是否有未恢复的告警产生,观察集群的管理维护是否正常,业务是否正常
          修改LdapServer密码 修改密码需要重启LdapServer和Kerberos服务,影响集群的管理维护和业务 ★★★★ 修改前确认操作的必要性,修改时确保同一时间无其它管理维护操作 无
          节点重启导致LdapServer数据损坏 如果未停止LdapServer服务,直接重启LdapServer所在节点,可能导致LdapServer数据损坏 ★★★★★ 使用LdapServer备份数据进行恢复 无

          Loader高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改Loader实例的浮动IP地址loader.float.ip 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察Loader UI是否可以正常连接
          修改Loader实例的启动参数LOADER_GC_OPTS 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          往HBase导入数据时,选择清空表数据 目标表的原数据被清空 ★★ 选择时,确保目标表的数据可以清空 选择前,需确认目标表数据是否可以清空

          Spark2x高危操作

          说明

          MRS 3.x之前版本,服务名称为Spark。

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          配置项的修改(spark.yarn.queue) 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          配置项的修改(spark.driver.extraJavaOptions) 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          配置项的修改(spark.yarn.cluster.driver.extraJavaOptions) 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          配置项的修改(spark.eventLog.dir) 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          配置项的修改(SPARK_DAEMON_JAVA_OPTS) 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          删除所有JobHistory2x实例 导致历史应用的event log丢失 ★★ 至少保留一个JobHistory2x实例 观察JobHistory2x中是否可以查看历史应用信息
          删除或修改HDFS上的/user/spark2x/jars/8.1.0.1/spark-archive-2x.zip 导致JDBCServer2x启动异常及业务功能异常 ★★★ 删除/user/spark2x/jars/8.1.0.1/spark-archive-2x.zip,等待10-15分钟,zip包自动恢复 观察服务能否正常启动

          Storm高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          修改插件相关的配置项: l storm.scheduler l nimbus.authorizer l storm.thrift.transport l nimbus.blobstore.class l nimbus.topology.validator l storm.principal.tolocal 导致服务启动异常 ★★★★ 修改相关配置项时请严格按照提示描述,确保修改后的类名是存在并有效的 观察服务能否正常启动
          修改Storm实例的启动参数GC_OPTS NIMBUS_GC_OPTS SUPERVISOR_GC_OPTS UI_GC_OPTS LOGVIEWER_GC_OPTS 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          修改用户资源池配置参数resource.aware.scheduler.user.pools 导致业务提交后无法正常运行 ★★★ 修改相关配置项时请严格按照提示描述,确保给每个用户分配的资源合理有效 观察服务能否正常启动并且业务能否正常运行
          修改数据目录 该操作不当会导致服务异常,无法提供服务 ★★★★ 请勿手动操作数据目录 观察数据目录是否正常
          重启服务/实例 该操作会导致服务有短暂中断,如果有业务运行也会引起业务短暂中断 ★★★ 确保在必要时重启服务 观察服务是否运行正常,业务是否恢复
          同步配置(重启服务) 该操作会引起服务重启,导致服务短暂中断,若引起Supervisor重启会导致所运行业务短暂中断 ★★★ 确保在必要时修改配置 观察服务是否运行正常,业务是否恢复
          停止服务/实例 该操作会导致服务停止,业务中断 ★★★ 确保在必要时停止服务 观察服务是否正常停止
          删除/修改元数据 删除Nimbus元数据会导致服务异常,并且已运行业务丢失 ★★★★★ 请勿手动删除Nimbus元数据文件 观察Nimbus元数据文件是否正常
          修改文件权限 修改元数据目录和日志目录权限不当会引起服务异常 ★★★★ 请勿手动修改文件权限 观察数据目录和日志目录权限是否正常
          删除拓扑 该操作会删除正在运行中的拓扑 ★★★★ 确保在必要时删除拓扑 观察拓扑是否删除成功

          Yarn高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          删除或者修改数据目录yarn.nodemanager.local-dirs和yarn.nodemanager.log-dirs 该操作将会导致业务信息丢失 ★★★ 请勿手动删除数据目录 观察数据目录是否正常

          ZooKeeper高危操作

          操作名称 操作风险 风险等级 规避措施 重大操作观察项目
          删除或者修改ZooKeeper的数据目录 该操作将会导致业务信息丢失 ★★★ 修改ZooKeeper目录时候,严格按照扩容指导操作 观察服务能否正常启动,关联组件能否正常启动
          修改ZooKeeper实例的启动参数GC_OPTS 导致服务启动异常 ★★ 修改相关配置项时请严格按照提示描述,确保修改后的值有效 观察服务能否正常启动
          设置ZooKeeper中znode的ACL信息 修改ZooKeeper中znode的权限,可能会导致其他用户无权限访问该znode,导致系统功能异常 ★★★★ 修改相关配置项时请严格按照“ZooKeeper权限设置指南”章节操作,确保修改ACL信息,不会影响其他组件正常使用ZooKeeper 观察项目观察其他依赖ZooKeeper的组件能否正常启动,并提供服务
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  安全认证原理和认证机制
          下一篇 :  附录
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明