千家信息网

CM上HDFS容量显示与实际命令不一致的问题分析

发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,CM上HDFS容量显示与实际命令不一致的问题分析,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。温馨提示:如果使用电脑查看图片不清晰,可以
千家信息网最后更新 2025年12月01日CM上HDFS容量显示与实际命令不一致的问题分析

CM上HDFS容量显示与实际命令不一致的问题分析,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。

1.问题描述


通过Cloudera Manager看到HDFS的容量使用显示为103.9GB

通过HDFS的50070界面查看到HDFS的容量使用情况为41.63GB

使用hadoop fs -du -h /命令查看HDFS的使用情况,HDFS的使用为41.63GB

疑问:为什么Cloudera Manager上显示HDFS空间的使用量会比HDFS真实使用量大很多?

2.问题分析


在Cloudera Manager上鼠标停留在HDFS容量配置上会显示容量使用说明,如下图所示:

CM上显示HDFS配置容量由两部分组成DFS使用的空间和非DFS使用的空间两部分组成。

接下来我们再看看HDFS的50070界面的统计信息可以看到有DFS Used和Non DFS Used两个信息。

将DFS Used和Non DFS Used两个数据相加刚好与Cloudera Manager上显示的配置容量103.9GB一致。

问题又来了"Non DFS Used"这一部分空间是什么?"Non DFS Used"是如何计算的?

3.Non DFS Used说明


这里Fayson拿集群的一个节点cdh03来说明,如下是cdh03节点磁盘挂载信息,/data/disk1盘是HDFS配置的数据目录。

1.在HDFS的DataNode配置中"dfs.datanode.du.reserved"用来为HDFS的数据盘预留一定的空间,默认为10GB

那这样HDFS对该盘的使用空间为100GB - 9.99GB=90GB

2.使用hadoop dfsadmin -report命令查看HDFS空间各个节点的使用情况

如上截图为cdh03.fayson.com节点DFS使用报告,包含了DFS的总容量,已使用容量,可用容量以及"Non DFS Used"。

3.Non DFS Used的计算方式大概为

磁盘总容量 - 节点预留容量(dfs.datanode.du.reserved)- DFS Used - DFS Remaining即为"Non DFS Used"

100GB - 10GB - 13.88GB - 57.55GB ≈ 18.03GB

所以根据以上得出结论,当我们为数据盘预留了10GB给系统或其他非HDFS文件的存储空间,那么DFS的使用空间就为90GB,但是非HDFS文件占用空间超过10GB则会占用DFS配置的90GB空间,所以"Non DFS Used"就是占用DFS容量的那部分空间。

4.总结


在Cloudera Manager中显示的HDFS容量配置分为了两个部分DFS使用的空间和非DFS使用的空间。

其中的"Non DFS Used"空间即为DN节点每块盘中在排除预留空间后非HDFS文件占用DFS容量的那部分空间(如kudu数据、Kafka数据、用户自己的数据等)。

看完上述内容,你们掌握CM上HDFS容量显示与实际命令不一致的问题分析的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!

空间 容量 问题 数据 配置 节点 部分 命令 一致 分析 两个 信息 情况 文件 实际 使用量 内容 图片 方法 更多 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 计算机网络技术主要理论 北京字节网络技术有限公司 服务器的管理员有2个吗 北京臻盛网络技术有限公司靠谱吗 好的网络技术加盟排行前十 中学网络安全专题教育活动 不使用数据库怎么显示分页 sql数据库中回收权限 深圳摩斯网络技术有限公司好吗 数据库添加sql语句 控制网络技术北京科技大学 软件开发 验收单 检察院调研网络安全 首届中国网络安全论坛 平谷区推广网络技术口碑推荐 服务器配置与管理的心得体会 网络安全等级保护2.0相关标准 网络安全靠人民活动教案 我的世界1.7.10服务器搭建 警察网络安全课件ppt图片 落实党组网络安全工作责任制 国际qq网络技术 大学生网络安全创新 汇投网络技术公司 吉林大学图书馆数据库导航 大数据时代下的网络安全分析 戴尔服务器t320怎么装系统 网络安全专项整治工作是落实 数据库如何批量添加内容 安徽安卓软件开发大概要多少钱
0