searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

HBase Sync功能导致HBase入库性能下降

2024-09-25 09:31:40
64
0

问题背景与现象

HBase入库慢,regionserver日志中大量打印slow sync。

原因分析
    1.对比正常写入时间段监控,检查HBase服务整体CPU、内存以及NameNode RPC在异常时间段是否增加;
    2.检查regionserver日志中slow sync打印是否集中在个别RegionServer节点;
    3.如果slow sync集中于个别regionserver节点,检查该节点是否存在热点region、节点RPC是否持续被占用、是否Full GC,请求量是否增加。
   4.如果regionserver节点中slow sync无规律,检查datanode日志中slow打印情况,根据slow类型分析写入慢原因;
      a.Slow manageWriterOsCache:将块写入OS缓存有延迟。
      b.Slow BlockReceiver write packet to mirror :网络上写块有延迟。
      c.Slow BlockReceiver write data to disk cost 、Slow flushOrSync:将块写入磁盘有延时。
   根据regionserver中写入慢的block id在NameNode日志中查询块写入链路,根据链路信息分析写入三个副本时哪个副本写入有异常,DataNode性能不足,导致写入文件耗时较长。

解决办法
   1.网络原因联系网络工程师整改网络
   2.磁盘问题需具体分析是磁盘性能不足还是磁盘坏道
   3.如果HDFS或HBase服务写入性能已达到瓶颈,可关闭sync功能。

hbase.regionserver.hfile.durable.sync=false

hbase.regionserver.wal.durable.sync=false

0条评论
0 / 1000
5****m
9文章数
0粉丝数
5****m
9 文章 | 0 粉丝
原创

HBase Sync功能导致HBase入库性能下降

2024-09-25 09:31:40
64
0

问题背景与现象

HBase入库慢,regionserver日志中大量打印slow sync。

原因分析
    1.对比正常写入时间段监控,检查HBase服务整体CPU、内存以及NameNode RPC在异常时间段是否增加;
    2.检查regionserver日志中slow sync打印是否集中在个别RegionServer节点;
    3.如果slow sync集中于个别regionserver节点,检查该节点是否存在热点region、节点RPC是否持续被占用、是否Full GC,请求量是否增加。
   4.如果regionserver节点中slow sync无规律,检查datanode日志中slow打印情况,根据slow类型分析写入慢原因;
      a.Slow manageWriterOsCache:将块写入OS缓存有延迟。
      b.Slow BlockReceiver write packet to mirror :网络上写块有延迟。
      c.Slow BlockReceiver write data to disk cost 、Slow flushOrSync:将块写入磁盘有延时。
   根据regionserver中写入慢的block id在NameNode日志中查询块写入链路,根据链路信息分析写入三个副本时哪个副本写入有异常,DataNode性能不足,导致写入文件耗时较长。

解决办法
   1.网络原因联系网络工程师整改网络
   2.磁盘问题需具体分析是磁盘性能不足还是磁盘坏道
   3.如果HDFS或HBase服务写入性能已达到瓶颈,可关闭sync功能。

hbase.regionserver.hfile.durable.sync=false

hbase.regionserver.wal.durable.sync=false

文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0