记载我的spark源码阅读火花
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,记载我的spark源码阅读火花知识点:1、seq:列表,适合存有序重复数据,进行快速插入/删除元素等场景,Set是集合,适合存无序非重复数据,进行快速查找海量元素等场景memoryKeys = Seq
千家信息网最后更新 2025年12月03日记载我的spark源码阅读火花
记载我的spark源码阅读火花
知识点:
1、seq:列表,适合存有序重复数据,进行快速插入/删除元素等场景,
Set是集合,适合存无序非重复数据,进行快速查找海量元素等场景
memoryKeys = Seq( )
2、private 声明变量为私有
privateval hadoopConf = SparkHadoopUtil.get.newConfiguration(conf)
private[this] val value
private[spark],声明变量为私有,并且在包spark是可见的,这里的[spark],是一种保护的作用域。
这是Master的类声明,同样在master域里
private[master] class Master(
3、没有括号的函数
下面是个函数调用
hellotheworld //无参数不括号
4、可变参数的函数
(s:*)={ s.foreach(x=>(x))}5、函数的奇葩定义:
(x:y:):=x+y =(x:y:)=>x+y (x:)(y:):=x+y anonymous=(x:y:)=>x+y
6、import:可以在任何地方出现,作用范围是直到包含该语句的块末尾,好处是避免产生名称冲突。
SparkConf(loadDefaults: Boolean) Cloneable Logging { SparkConf._7、this:函数的末尾最后一句
setExecutorEnv(variables: Seq[(StringString)]): SparkConf = { ((kv) <- variables) { setExecutorEnv(kv) } }该函数返回SparkConf类型的值
8、模式匹配之master配置类型
master match{case "local" =>case LOCAL_N_REGEX(threads) =>case LOCAL_N_FAILURES_REGEX(threads, maxFailures) =>case SPARK_REGEX(sparkUrl) =>case LOCAL_CLUSTER_REGEX(numSlaves, coresPerSlave, memoryPerSlave) =>case "yarn-standalone" | "yarn-cluster" =>
case "yarn-client" =>
case SIMR_REGEX(simrUrl) =>
case mesosUrl @ MESOS_REGEX(_) =>
可见有上述几种配置类型
9、scala的Parallelize实现
第一种RDD生产方式,就是从本地的collection生成,可以看见生成的是ParallelCollectionRDD类型的
parallelize[T: ClassTag]( seq: Seq[T]numSlices: Int = defaultParallelism): RDD[T] = withScope { assertNotStopped() ParallelCollectionRDD[T](seqnumSlicesMap[IntSeq[String]]())}
函数
类型
作用
元素
参数
变量
场景
括号
数据
末尾
生成
私有
配置
源码
火花
生产方式
名称
地方
奇葩
好处
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
国防网络安全的意义
xp系统时间同步服务器
护苗网络安全课堂图片
武汉动力网络技术公司
网络安全作品有奖
数据库开发技术期末试题及答案
ibm服务器改装raid教程
数据库提取数据到html视频
网络安全征文300字小学生
数据库学习需要的电脑性能
qq数据库c
能源统计年鉴数据库官网
软件开发行业维保标准
陆行鸟 服务器
网络安全学生工作前景如何
socket连接服务器端
滁州软件开发培训费用
私立华联学院计算机网络技术
网络安全开发前景
湖北航天安全接入服务器地址
架构学什么软件开发
华三r4900服务器配置管理卡
软件开发徐州发展前景
无线网络技术教材
贯彻落实加强网络安全信息
中国各省碳排放数据库
中国好故事数据库评价
Srio软件开发需求 ddr3
赛思网络技术公司怎么样
什么服务器安全模式