ALM-17003 Oozie服务不可用 本章节主要介绍ALM17003 Oozie服务不可用的告警。 告警解释 系统每5秒周期性检测Oozie服务状态,当Oozie或者Oozie所依赖的组件无法正常提供服务时,系统产生此告警。 当Oozie服务恢复可用状态时,告警自动消除。 告警属性 告警ID 告警级别 是否自动清除 17003 紧急 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 Details 对告警信息的补充。 对系统的影响 无法使用Oozie服务提交作业。 可能原因 DBService服务异常或者Oozie存储在DBService中的数据遭到破坏,导致Oozie服务不可用。 HDFS服务异常或者Oozie存储在HDFS中的数据遭到破坏时,导致Oozie服务不可用。 Yarn服务异常,导致Oozie服务不可用。 Nodeagent进程故障,导致Oozie服务不可用。 处理步骤 查询Oozie服务健康状态码 1.在FusionInsight Manager中,选择“集群 > 待操作集群的名称 > 服务 > Oozie”,单击“oozie WebUI”的“oozie”(两个任选一个),进入Oozie WebUI页面。 说明 admin用户默认不具备其他组件的管理权限,如果访问组件原生界面时出现因权限不足而打不开页面或内容显示不全时,可手动创建具备对应组件管理权限的用户进行登录。 2.在浏览器地址栏的URL地址后追加“/servicehealth”重新访问,“statusCode”对应的值即为当前Oozie的服务健康状态码。 例如,在浏览器中访问“ {"beans":[{"name":"serviceStatus","statusCode":0}]} 如果无法查询出健康状态码或者浏览器一直无响应,可能是由于Oozie进程故障导致服务不可用,请参考步骤13进行处理。 3.根据查询到的错误码执行相关处理步骤,请参考下表。 Oozie服务健康状态码一览表 状态码 错误描述 错误原因 处理步骤 0 服务正常 无 无 18002 DBService服务异常 Oozie连接DBservice失败或者存储在DBService中的数据遭到破坏。 请参考步骤4。 18003 HDFS服务异常 Oozie连接HDFS失败或者存储在HDFS中的数据遭到破坏。 请参考步骤7。 18005 Mapreduce服务异常 Yarn服务异常。 请参考步骤11。