Hadoop datanode启动异常 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode

编程入门 行业动态 更新时间:2024-10-13 04:24:52

Hadoop datanode启动<a href=https://www.elefans.com/category/jswz/34/1771210.html style=异常 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode"/>

Hadoop datanode启动异常 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode

文章目录

      • 现象
      • 排查
      • 解决

现象

线上收到hadoop集群datanode掉线告警。

排查

1、确认datanode状态

$ jps
24752 Jps
1428 JournalNode

发现未存在datanode进程。

2、尝试单独启动datanode,发现还是不行,错误日志信息如下:
$ hadoop-daemon.sh start datanode

2022-11-25 15:58:43,267 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool (Datanode Uuid cc451ed7-45c6-460c-a30b-bb68e54ef8fb) service to jjhxxxx/10.x.x.x:8020 All specified directories have failed to load.
2022-11-25 15:58:43,268 INFO org.apache.hadoop.hdfs.servermon.Storage: Using 11 threads to upgrade data directories (dfs.datanode.parallel.volumes.load.threads.num=11, dataDirs=11)
2022-11-25 15:58:43,313 INFO org.apache.hadoop.hdfs.servermon.Storage: Lock on /disk1/hdfs/datanode/in_use.lock acquired by nodename 18522@jjhxxx
2022-11-25 15:58:43,314 WARN org.apache.hadoop.hdfs.servermon.Storage: Failed to add storage directory [DISK]file:/disk1/hdfs/datanode
java.io.IOException: Incompatible clusterIDs in /disk1/hdfs/datanode: namenode clusterID = CID-28fd667c-4411-4a5d-a2b0-fb5190fec245; datanode clusterID = CID-bca80872-89c0-428f-af56-3cff6e6e16c2
$ grep -C 5 ERROR hadoop-hdfs-datanode-jjhxxx.log|grep namenode
java.io.IOException: Incompatible clusterIDs in /disk1/hdfs/datanode: namenode clusterID = CID-28fd667c-4411-4a5d-a2b0-fb5190fec245; datanode clusterID = CID-bca80872-89c0-428f-af56-3cff6e6e16c2

此时会发现问题所在:
namenode clusterID = CID-28fd667c-4411-4a5d-a2b0-fb5190fec245
datanode clusterID = CID-bca80872-89c0-428f-af56-3cff6e6e16c2
发现这两个id不一致,经查阅相关资料,id不一致会导致Initialization failed for Block pool。

解决

将name/current/VERSION 文件中的 clusterID的值,拷贝到 name/current/VERSION 文件中的 clusterID的=后面 ,也就是让name data两个的clusterID保持一致,示例如下:

#其中某一天datanode节点
hdfs@localhost:/disk1/hdfs/datanode/current$ cat VERSION 
#Fri Nov 25 16:28:58 CST 2022
storageID=DS-beab9a85-2dc8-4111-a269-2322ad2f7458
clusterID=CID-bca80872-89c0-428f-af56-3cff6e6e16c2
cTime=0
datanodeUuid=cc451ed7-45c6-460c-a30b-bb68e54ef8fb
storageType=DATA_NODE
layoutVersion=-57#单独的namenode节点
cat /disk1/hdfs/namenode/current/VERSION 
#Fri Apr 15 18:26:07 CST 2022
namespaceID=1752898827
clusterID=CID-bca80872-89c0-428f-af56-3cff6e6e16c2
cTime=1570465355748
storageType=NAME_NODE
blockpoolID=BP-1290606271-10.x.x.x-1570465355748
layoutVersion=-64

然后再次尝试启动datanode进程。

更多推荐

Hadoop datanode启动异常 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode

本文发布于:2024-02-10 22:27:13,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1677644.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:异常   ERROR   org   datanode   Hadoop

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!