spark生成表格套用公式是什么
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这期内容当中小编将会给大家带来有关spark生成表格套用公式是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。IndexABCD1102882938简化业务描述后
千家信息网最后更新 2025年12月02日spark生成表格套用公式是什么
这期内容当中小编将会给大家带来有关spark生成表格套用公式是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
| Index | A | B | C | D |
| 1 | 10 | 2 | 8 | 8 |
| 2 | 9 | |||
| 3 | 8 |
简化业务描述后,需求为:
有表格如上,A列及第一行可以直接给出,其余空白字段要求按公式算出。
公式:
1) B[x] = A[x]-1
2) C[x] = A[x] - B[x]
3) D[x] = (C[x]+D[x-1])/2 //(上一行同列+本行前一列)/2
计算后的表格值应为:
| Index | A | B | C | D |
| 1 | 10 | 2 | 8 | 8 |
| 2 | 9 | 7 | 2 | 5 |
| 3 | 8 | 4 | 4 | 4.5 |
代码
import org.apache.spark.rdd.RDDimport org.apache.spark.sql.types._import org.apache.spark.sql.{Row, SparkSession}val schema = StructType( List( StructField("ID", DoubleType, true), StructField( "A", DoubleType, true), StructField( "B", DoubleType, true), StructField( "C", DoubleType, true), StructField( "D", DoubleType, true) ))val data1: RDD[Row] = spark.sparkContext.parallelize( Seq( Row(1.0,10.0,2.0,8.0,8.0) ))val df1 = spark.createDataFrame(data1, schema)df1.createOrReplaceTempView("df1")val data2: RDD[Row] = spark.sparkContext.parallelize( Seq( Row(1.0,9.0,null,null,null) ))val df2 = spark.createDataFrame(data2, schema)df2.createOrReplaceTempView("df2")def func_1(x: Int) = { x - 1}def func_2(x:Int,y:Int):Int = { x - func_1(y)}def func_3(x:Int,y:Int,z:Int):Int = { (x+func_2(y,z))/2}spark.udf.register("func_1", func_1 _)spark.udf.register("func_2", func_2 _)spark.udf.register("func_3", func_3 _)spark.sql( """ |select | df2.ID, | df2.A, | func_1(df1.D) as B, | func_2(df2.A,df1.D) as C, | func_3(df1.D,df2.A,df1.D) as D |from df2 inner join df1 on df1.ID = df2.ID | """.stripMargin).show()上述就是小编为大家分享的spark生成表格套用公式是什么了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
公式
表格
生成
一行
内容
分析
专业
业务
中小
代码
内容丰富
同列
如上
字段
就是
文章
更多
本行
知识
空白
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
spss数据库资料分析
广东华商网络技术
河南计算机网络技术专升本上岸
大连网络安全监督管理局
超进化物语最新服务器
烟台直销软件开发
mc服务器ip地址怎么改
网络安全毕业生待遇
财务软件开发难学吗
asp 连接数据库
率土之滨多久出一个服务器
服务器三秒一滴
config改数据库
网络安全事件信息上报工作
海康DS-670视频服务器
云服务器 网盘
科技互联网金融股
互联网最高科技
zfs服务器安全性
网络安全财富故事
紫外强度计软件开发
信息网络安全管理知识答卷
成都前端软件开发有用吗
服务器上门服务
网络技术 文献
网络安全李韬
数据库实体等基本概念
服务器端在企业经销商管理
服务器三秒一滴
天津rust服务器托管虚拟主机