spark-yarn 模式 jar包优化
发表于:2025-12-05 作者:千家信息网编辑
千家信息网最后更新 2025年12月05日,在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。spark支持
千家信息网最后更新 2025年12月05日spark-yarn 模式 jar包优化
在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。
spark支持如下几个参数
spark.yarn.jars:只能指定具体jar包,在spark1.6.2(包括)以前,从官网上可以下载一个大的jar包,写上这个jar包即可,但是在2.0过后,就成为了一大堆小包
spark.yarn.archive:这个支持文件夹,但是有一点要注意,
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars")
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars/")
只有第一种写法正确,第二种错误,第二种写法不会读取任何jar包。
写法
支持
模式
参数
只有
大堆
小包
文件
文件夹
是在
机器
程序
过后
错误
阿里
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
sql迁移到db2数据库
杭州net软件开发费用是多少
工控系统网络安全培训制度
湖南小红袄网络技术
网络安全作文100字叙述文
软件开发工作量单位
漂亮的网络安全的画怎么画视频
船舶遭遇的网络安全事件
华为软件开发工程师辛苦吗
战地5怎么看最近玩过的服务器
法律数据库软件排名
共筑网络安全绿色家园
网络安全亟待培养专业人才
数据库查询没有挂科的学生姓名
浪潮信息服务器
日本pc软件开发
网络安全故事800字
数据库的基本操作选择投影
网站数据库修改路径
养老平台软件开发的优势厂商
南京水又网络技术有限公司
思科网络技术学院教程习题
对日软件开发面试内容有哪些
坪山软件开发
湖南学it软件开发培训机构
服务器为何有防静电
舆情类网络安全
司法局参加网络安全宣传周
互联网金融科技对保险的挑战
上海苹果软件开发如何收费