spark怎么编写udaf函数求中位数
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,本篇内容主要讲解"spark怎么编写udaf函数求中位数",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"spark怎么编写udaf函数求中位数"吧!pack
千家信息网最后更新 2025年12月03日spark怎么编写udaf函数求中位数
本篇内容主要讲解"spark怎么编写udaf函数求中位数",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"spark怎么编写udaf函数求中位数"吧!
package com.frank.sparktest.java;import org.apache.spark.sql.Row;import org.apache.spark.sql.expressions.MutableAggregationBuffer;import org.apache.spark.sql.expressions.UserDefinedAggregateFunction;import org.apache.spark.sql.types.DataType;import org.apache.spark.sql.types.DataTypes;import org.apache.spark.sql.types.StructField;import org.apache.spark.sql.types.StructType;import java.util.ArrayList;import java.util.Arrays;import java.util.Collections;import java.util.List;public class MedianUdaf extends UserDefinedAggregateFunction { private StructType inputSchema; private StructType bufferSchema; public MedianUdaf(){ List inputFields = new ArrayList<>(); inputFields.add(DataTypes.createStructField("nums",DataTypes.IntegerType,true)); inputSchema=DataTypes.createStructType(inputFields); List bufferFields = new ArrayList<>(); bufferFields.add(DataTypes.createStructField("datas",DataTypes.StringType,true)); bufferSchema=DataTypes.createStructType(bufferFields); } @Override public StructType inputSchema() { return inputSchema; } @Override public StructType bufferSchema() { return bufferSchema; } @Override public DataType dataType() { return DataTypes.DoubleType; } @Override public boolean deterministic() { return true; } @Override public void initialize(MutableAggregationBuffer buffer) { buffer.update(0,0); buffer.update(1,0); } @Override public void update(MutableAggregationBuffer buffer, Row input) { if (!input.isNullAt(0)){ buffer.update(0,buffer.getString(0)+","+input.getInt(0)); } } @Override public void merge(MutableAggregationBuffer buffer1, Row buffer2) { buffer1.update(0,buffer1.getString(0)+","+buffer2.getInt(0)); } @Override public Object evaluate(Row buffer) { List list = new ArrayList(); List stringList = Arrays.asList(buffer.getString(0).split(",")); for (String s : stringList){ list.add(Integer.valueOf(s)); } Collections.sort(list); int size = list.size(); int num=0; if(size % 2 == 1) { num = list.get((size / 2)+1); } if(size %2 == 0) { num = (list.get(size / 2)+list.get((size / 2)+1))/2; } return num; }} 上面是代码段,可以直接拿来使用
下面是测试程序
package com.frank.sparktest.java;import org.apache.spark.sql.SQLContext;import org.apache.spark.sql.SparkSession;import org.apache.spark.sql.types.DataTypes;import java.io.IOException;import java.util.stream.IntStream;public class DemoUDAF { public static void main(String[] args) throws IOException { SQLContext sqlContext = SparkSession.builder().master("local").getOrCreate().sqlContext(); sqlContext.udf().register("generate", (Integer start, Integer end)-> IntStream.range(start, end+1).boxed().toArray(), DataTypes.createArrayType(DataTypes.IntegerType)); sqlContext.udf().register("media",new MedianUdaf()); sqlContext.sql("select generate(1,10)").show(); }}到此,相信大家对"spark怎么编写udaf函数求中位数"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
中位数
函数
内容
学习
实用
更深
代码
兴趣
实用性
实际
操作简单
方法
更多
朋友
程序
网站
频道
查询
测试
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
辽宁智能边缘计算服务器
软件开发技能培训要多少钱
数据库磁盘繁忙检查
vf数据库与数据表常用命令
sql数据库怎么写期初余额
数据库光盘映像文件如何安装
idm代理服务器是干什么的
手机网络安全选项在哪里设置
商品数据库的格式
计算机网络技术发源于
社区网络安全宣传口号
网络安全教育手抄报的字体
数据库文件的转移
河北企业软件开发承诺守信
江苏省网络安全宣传周是
东财网络安全管理中心
福建通讯软件开发设施应用
高科技互联网大会
ajax服务器请求拒绝
湖南创新网络技术服务单价
修改学校服务器成绩
海南高宇网络技术有限公司游戏是虚假宣传吗
服务器1 核
带100台电脑服务器配置
网络服务器系统安装教程详细步骤
上位机软件开发指南
厦门奕宝互联网科技有限公司
地税局强化网络安全
龙芯服务器文件夹乱码
网络安全法诞生视屏