如何使用Hadoop存档工具
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,这篇文章给大家分享的是有关如何使用Hadoop存档工具的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。每个文件按块方式存储, 每个块的元数据存储在namenode的内存中Ha
千家信息网最后更新 2025年12月03日如何使用Hadoop存档工具
这篇文章给大家分享的是有关如何使用Hadoop存档工具的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
每个文件按块方式存储, 每个块的元数据存储在namenode的内存中
Hadoop存档文件或HAR文件是一个更高效的文件存档工具,它将文件存入HDFS块,在减少内存使用的同时,允许对文件进行透明地访问
Hadoop存档文件可以用作MapReduce的输入
使用Hadoop存档工具
Hadoop存档是通过archive工具根据一组文件创建而来的,该存档工具运行一个MapReduce作业来并行处理所有的输入文件
使用archive
hadoop archive -archiveName files.har /my/files /my
第一个选项是存档文件的名称,这里是第一个参数 file.har
第二个参数是需要存档的文件
第三个参数是HAR文件的输出目录
列出HAR文件中的文件
hadoop fs -ls /my/files.har
递归列出HAR文件中的文件
hadoop fs -lsr /my/files.har
其他文件系统中引用HAR文件,则需要使用不同的URI路径格式,示例如下
hadoop fs -lsr 不足 新建一个存档文件会创建原始文件的一个副本 一旦创建,不能修改 InputFormat不知道文件已经存档
感谢各位的阅读!关于"如何使用Hadoop存档工具"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
文件
存档
工具
参数
内存
内容
更多
篇文章
存储
输入
不同
不错
原始
实用
三个
会创
副本
同时
名称
数据
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
简谱视唱软件开发
信息安全指的是网络安全吗
烟草行业网络安全三个不得
网络安全设备监控范围
网络安全见阅
hyper服务器
海康威视嵌入式软件开发待遇
2核4g服务器
网络安全市场合纵连横
服务器电源是什么材质
社区服务器是什么
数据库树结构计算
数据库学生考勤管理系统课程设计
浅谈网络安全的核心内容
古籍数据库活动
阿里巴巴 网络安全招聘
暗黑2重制版全球服务器
数据库加字段数据备份
东莞微商软件开发程序
九牛科技互联网
ibm服务器电源功率
国家电网软件开发公司
tdms 数据库
郑州工业软件开发定制费用
我的世界怎样输入服务器的号码
电商网络安全研究报告
网络安全手抄报小手拉大手一等奖
联合国贸易数据库转口贸易
dms备份数据库
数据库连接的八个步骤