Spark2.4.2源码编译
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,软件版本:jdk:1.8maven:3.61 http://maven.apache.org/download.cgispark:2.42 https://archive.apache.org/dis
千家信息网最后更新 2025年12月03日Spark2.4.2源码编译
软件版本:
jdk:1.8
maven:3.61 http://maven.apache.org/download.cgi
spark:2.42 https://archive.apache.org/dist/spark/spark-2.4.2/
hadoop版本:hadoop-2.6.0-cdh6.7.0(spark编译支持的hadoop版本,不需要安装)
配置maven:
#配置环境变量[root@hadoop004 soft]# cat /etc/profile.d/maven.sh MAVEN_HOME=/usr/local/mavenexport PATH=$MAVEN_HOME/bin:$PATH#确认maven版本[root@hadoop004 maven]# mvn --versionApache Maven 3.6.1 (d66c9c0b3152b2e69ee9bac180bb8fcc8e6af555; 2019-04-05T03:00:29+08:00)Maven home: /usr/local/mavenJava version: 1.8.0_111, vendor: Oracle Corporation, runtime: /usr/java/jdk1.8.0_111/jreDefault locale: en_US, platform encoding: UTF-8OS name: "linux", version: "3.10.0-862.3.2.el7.x86_64", arch: "amd64", family: "unix"#配置mvn的本地存放地址:settings.xml文件/usr/local/maven/repo #配置mvn下载源为阿里云的maven仓库,加速下载alimaven aliyun maven http://maven.aliyun.com/nexus/content/groups/public/ central
配置Spark:
tar xf spark-2.4.2.tgzcd spark-2.4.2.tgz#修改pom.xml文件,添加clouder仓库cloudera https://repository.cloudera.com/artifactory/cloudera-repos/
执行编译命令:
#在spark目录下执行./dev/make-distribution.sh --name 2.6.0-cdh6.7.0 --tgz -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver -Dhadoop.version=2.6.0-cdh6.7.0注:本次编译时长大约为35分钟,中间无任何报错;注:默认使用的scala版本为最新的,如果要指定scala版本,通过以下方式修改比如把scala版本改为 2.10./dev/change-scala-version.sh 2.10
参数说明:
--name:生成压缩包的后缀名字;前缀默认为spark版本的名字,本例为:spark-2.4.2-bin
--tgz:采用压缩格式为tar,压缩的后缀名为.tgz
-Pyarn:表示spark需要运行在yarn上面
-Phadoop-2.6:表示spark使用hadoop的profile的id
-Dhadoop.version=2.6.0-cdh6.7.0:表示spark使用hadoop的版本;如果不指定,默认使用的是2.2.0的hadoop
-Phive -Phive-thriftserver:表示支持hive
其它参数:
-DskipTests:跳过测试
生成的文件:
在spark目录下:spark-2.4.2-bin-2.6.0-cdh6.7.0.tgz
使用编译后的spark部署:
tar xf spark-2.4.2-bin-2.6.0-cdh6.7.0.tgzln -s spark-2.4.2-bin-2.6.0-cdh6.7.0 spark#配置spark的环境变量[hadoop@hadoop001 ~]$ vim .bash_profileexport SPARK_HOME=/home/hadoop/app/spark-2.4.2-bin-2.6.0-cdh6.7.0export PATH=${SPARK_HOME}/bin:$PATH[hadoop@hadoop001 ~]$ source .bash_profile#运行spark测试[hadoop@hadoop001 ~]$ spark-shell 19/04/29 10:51:04 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicableUsing Spark's default log4j profile: org/apache/spark/log4j-defaults.propertiesSetting default log level to "WARN".To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).Spark context Web UI available at http://hadoop001:4040Spark context available as 'sc' (master = local[*], app id = local-1556506274719).Spark session available as 'spark'.Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ _ \/ _ `/ __/ '_/ /___/ .__/\_,_/_/ /_/\_\ version 2.4.2 /_/ Using Scala version 2.11.12 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_111)Type in expressions to have them evaluated.Type :help for more information.scala>
版本
配置
编译
文件
仓库
参数
变量
名字
后缀
环境
目录
支持
测试
生成
运行
前缀
命令
地址
方式
时长
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
广州专业软件开发销售厂
江苏省网络安全公示
ajax读取db数据库
潮州app软件开发哪家好
php服务器脚本
魔兽世界服务器普通
软件开发实习生主要干嘛
与服务器连接超时请稍后再试
广州市贝佳软件开发公司
泰州纬立网络技术参考价格
函数按名字查数据库
介绍数据库全面的书
广州erp软件开发如何收费
魔兽世界新服务器多久开
信息网络安全防护网
固原网络技术怎么样
求生之路服务器如何投票换图
北理工网络安全专业招研信息
分析网络安全研究的动因
前端加载文件服务器的静态资源
云腾网络技术有限公司
长沙应用软件开发多少钱
泛微数据库调休清零
数据库查询最高的两名
2021年网络安全会议时间
桓台中小企业oa软件开发
特朗普谈网络安全局
完美世界电竞服务器维护
某网站的用 户数据库
江苏工程软件开发平均价格