searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

HBase集群掉电后部分Region一直处于offline状态

2024-09-25 09:31:44
54
0

问题背景与现象

    集群掉电后重启HBase服务,部分Region一直处于offline状态

原因分析

  1. 每张表都有部分Region处于offline状态,offline状态的Region分布在不同的RegionServer上。
  2. 怀疑掉电导致RegionServer部分WAL文件异常,检查WAL文件发现存在大量splitting状态的WAL文件。
  3. 如果WAL文件损坏无法回放就会以splitting状态保存在WAL目录下,这部分WAL文件保存的数据对应的Region无法正常上线。

解决办法

  1. 手动将splitting状态的WAL全部移走。

    hdfs dfs -mv /hbase/WALs/hostnamexxxxx-splitting /tmp/back/

  2. 执行hbase hbck -fixAssignments上线Region成功。
0条评论
0 / 1000
5****m
9文章数
0粉丝数
5****m
9 文章 | 0 粉丝
原创

HBase集群掉电后部分Region一直处于offline状态

2024-09-25 09:31:44
54
0

问题背景与现象

    集群掉电后重启HBase服务,部分Region一直处于offline状态

原因分析

  1. 每张表都有部分Region处于offline状态,offline状态的Region分布在不同的RegionServer上。
  2. 怀疑掉电导致RegionServer部分WAL文件异常,检查WAL文件发现存在大量splitting状态的WAL文件。
  3. 如果WAL文件损坏无法回放就会以splitting状态保存在WAL目录下,这部分WAL文件保存的数据对应的Region无法正常上线。

解决办法

  1. 手动将splitting状态的WAL全部移走。

    hdfs dfs -mv /hbase/WALs/hostnamexxxxx-splitting /tmp/back/

  2. 执行hbase hbck -fixAssignments上线Region成功。
文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0