ALM-14026 DataNode块数超过阈值 查看是否有关联告警 5.在FusionInsight Manager首页,选择“运维 > 告警 > 告警”中查看是否存在告警“ALM14002 DataNode磁盘空间使用率超过阈值”。 是,执行步骤6。 否,执行步骤8。 6.参考“ALM14002 DataNode磁盘空间使用率超过阈值”进行处理,查看对应告警是否清除。 是,执行步骤7。 否,执行步骤8。 7.等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤8。 对DataNode进行扩容 8.对DataNode进行扩容。 9.在FusionInsight Manager首页,等待5分钟后,查看本告警是否清除。 是,处理完毕。 否,执行步骤10。 收集故障信息 10.在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。 11.在“服务”中勾选待操作集群的“HDFS”。 12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后20分钟,单击“下载”。 13.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 DataNode JVM参数配置规则 DataNode JVM参数“GCOPTS”默认值为: Xms2G Xmx4G XX:NewSize128M XX:MaxNewSize256M XX:MetaspaceSize128M XX:MaxMetaspaceSize128M XX:+UseConcMarkSweepGC XX:+CMSParallelRemarkEnabled XX:CMSInitiatingOccupancyFraction65 XX:+PrintGCDetails Dsun.rmi.dgc.client.gcInterval0x7FFFFFFFFFFFFFE Dsun.rmi.dgc.server.gcInterval0x7FFFFFFFFFFFFFE XX:OmitStackTraceInFastThrow XX:+PrintGCDateStamps XX:+UseGCLogFileRotation XX:NumberOfGCLogFiles10 XX:GCLogFileSize1M Djdk.tls.ephemeralDHKeySize2048 集群中每个DataNode实例平均保存的Blocks HDFS Block 3÷DataNode节点数,单个DataNode实例平均Block数量变化时请修改默认值中的“Xms2G Xmx4G XX:NewSize128M XX:MaxNewSize256M”。参考值如下表所示。 DataNode JVM配置 单个DataNode实例平均Block数量 参考值 2,000,000 Xms6G Xmx6G XX:NewSize512M XX:MaxNewSize512M 5,000,000 Xms12G Xmx12G XX:NewSize1G XX:MaxNewSize1G Xmx内存值对应DataNode节点块数阈值,每GB对应500000块数,用户可根据需要调整内存值。