千家信息网

hadoop streaming archives解压jar、zip、tar.gz的验证分析

发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这篇文章主要讲解了"hadoop streaming archives解压jar、zip、tar.gz的验证分析",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究
千家信息网最后更新 2025年12月02日hadoop streaming archives解压jar、zip、tar.gz的验证分析

这篇文章主要讲解了"hadoop streaming archives解压jar、zip、tar.gz的验证分析",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"hadoop streaming archives解压jar、zip、tar.gz的验证分析"吧!

1、archives作用描述:

Hadoop中DistributedCache方法之一(其他参考文章后面的参考文章) ,作用是 将指定文件分发到各个Task的工作目录下,并对名称后缀为".jar"、".zip",".tar.gz"、".tgz"的文件自动解压,默认情况下,解压后的内容存放到工作目录下名称为解压前文件名的目录中,比如压缩包为dict.zip,则解压后内容存放到目录dict.zip中。为此,你可以给文件起个别名/软链接,比如dict.zip#dict,这样,压缩包会被解压到目录dict中。

2、测试jar文件(基本直接摘抄参考文档的)

$ ls test_jar/file  file1    file2 file = this is file1(实验的时候这里搞错了,应该是用file1,对结果无影响,不做修改了)file2 = this is file2$ jar cvf cache.jar -C test_jar/ .$ hdfs dfs -put cache.jar /user/work/cachefile#touch 一个input.txt文件,然后put到 /user/work/cachefile$ hdfs dfs -cat /user/work/cachefile/input.txtcache/file   (cache是解压后的目录名,用#重定义的别名,参加下面的)cache/file2HADOOP_HOME=/home/hadoop/hadoop-2.3.0-cdh6.1.3$HADOOP_HOME/bin/hadoop fs -rmr /cacheout/$HADOOP_HOME/bin/hadoop  jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-2.3.0-cdh6.1.3.jar \ -archives  /user/work/cachefile/cache.jar#cache \ -Dmapred.map.tasks=1 \ -Dmapred.reduce.tasks=1 \ -Dmapred.job.name="Experiment" \ -input "cachefile/input2.txt"  \ -output "/cacheout/" \ -mapper "xargs cat" \ -reducer "cat" hadoop fs -cat /cacheout/*this is file 2this is file1

3、测试zip & tar.gz

分别打包zip , tar.gz的压缩包,put到hdfs继续测试。

-archives  /user/work/cachefile/cache.tar.gz#cache \    只修改后缀名,会报文件找不到的错误

查错:确认是否能解压,将mapper 改成:

-mapper "ls cache" \

发现:jar文件 :结果有4个文件,分别是META-INF、file、file1、file2

zip & tar.gz:只有一个,是test_jar的目录名

然后查看3种包的压缩文件,显然是解压成功了,找不到文件的原因是目录问题,这个就要详细研究下3中打包方式了,不再赘述。:

感谢各位的阅读,以上就是"hadoop streaming archives解压jar、zip、tar.gz的验证分析"的内容了,经过本文的学习后,相信大家对hadoop streaming archives解压jar、zip、tar.gz的验证分析这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

文件 目录 验证 分析 内容 文章 参考 学习 测试 作用 名称 后缀 情况 目录名 结果 问题 工作 研究 成功 为此 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 安全管理系统数据库 服务器的高可用性 数据库热度最高的技术 王者荣耀能互转服务器吗 用什么写数据库 mdb数据库是什么 在中标麒麟下安装达梦数据库 慕课网络技术与应用 一个代理服务器能给多少人用 马鞍山安卓软件开发费用 国外客户验厂对网络安全的要求 腾讯云服务器升级配置费用 软件开发项目验收流程及方案 网络安全黑板报六年级 服务器登录不上去什么意思 软件开发跟固态硬盘 74422161服务器号 gbase数据库删除了怎么恢复 下列不是网络安全相关法律法规 魔兽世界 已从服务器断开 戴尔服务器如何装固态硬盘 金蝶标准版u盘更换服务器 河北大学网络安全考什么 福建医院网络技术招聘 战地五服务器管理员怎么看别人 数据库有比较深入的面试视频 t630服务器开关在哪 网络安全答题比赛是什么 mysql建数据库的代码 茁壮网络技术支持面试
0