千家信息网

spark怎么编写udaf函数求中位数

发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,本篇内容主要讲解"spark怎么编写udaf函数求中位数",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"spark怎么编写udaf函数求中位数"吧!pack
千家信息网最后更新 2025年12月03日spark怎么编写udaf函数求中位数

本篇内容主要讲解"spark怎么编写udaf函数求中位数",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"spark怎么编写udaf函数求中位数"吧!

package com.frank.sparktest.java;import org.apache.spark.sql.Row;import org.apache.spark.sql.expressions.MutableAggregationBuffer;import org.apache.spark.sql.expressions.UserDefinedAggregateFunction;import org.apache.spark.sql.types.DataType;import org.apache.spark.sql.types.DataTypes;import org.apache.spark.sql.types.StructField;import org.apache.spark.sql.types.StructType;import java.util.ArrayList;import java.util.Arrays;import java.util.Collections;import java.util.List;public class MedianUdaf extends UserDefinedAggregateFunction {    private StructType inputSchema;    private StructType bufferSchema;    public MedianUdaf(){        List inputFields = new ArrayList<>();        inputFields.add(DataTypes.createStructField("nums",DataTypes.IntegerType,true));        inputSchema=DataTypes.createStructType(inputFields);        List bufferFields = new ArrayList<>();        bufferFields.add(DataTypes.createStructField("datas",DataTypes.StringType,true));        bufferSchema=DataTypes.createStructType(bufferFields);    }    @Override    public StructType inputSchema() {        return inputSchema;    }    @Override    public StructType bufferSchema() {        return bufferSchema;    }    @Override    public DataType dataType() {        return DataTypes.DoubleType;    }    @Override    public boolean deterministic() {        return true;    }    @Override    public void initialize(MutableAggregationBuffer buffer) {        buffer.update(0,0);        buffer.update(1,0);    }    @Override    public void update(MutableAggregationBuffer buffer, Row input) {        if (!input.isNullAt(0)){            buffer.update(0,buffer.getString(0)+","+input.getInt(0));        }    }    @Override    public void merge(MutableAggregationBuffer buffer1, Row buffer2) {        buffer1.update(0,buffer1.getString(0)+","+buffer2.getInt(0));    }    @Override    public Object evaluate(Row buffer) {        List list = new ArrayList();        List stringList = Arrays.asList(buffer.getString(0).split(","));        for (String s : stringList){            list.add(Integer.valueOf(s));        }        Collections.sort(list);        int size = list.size();        int num=0;        if(size % 2 == 1) {            num = list.get((size / 2)+1);        }        if(size %2  == 0) {            num = (list.get(size / 2)+list.get((size / 2)+1))/2;        }        return num;    }}

上面是代码段,可以直接拿来使用

下面是测试程序

package com.frank.sparktest.java;import org.apache.spark.sql.SQLContext;import org.apache.spark.sql.SparkSession;import org.apache.spark.sql.types.DataTypes;import java.io.IOException;import java.util.stream.IntStream;public class DemoUDAF {    public static void main(String[] args) throws IOException {        SQLContext sqlContext = SparkSession.builder().master("local").getOrCreate().sqlContext();        sqlContext.udf().register("generate", (Integer start, Integer end)-> IntStream.range(start, end+1).boxed().toArray(), DataTypes.createArrayType(DataTypes.IntegerType));        sqlContext.udf().register("media",new MedianUdaf());        sqlContext.sql("select generate(1,10)").show();    }}

到此,相信大家对"spark怎么编写udaf函数求中位数"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

中位数 函数 内容 学习 实用 更深 代码 兴趣 实用性 实际 操作简单 方法 更多 朋友 程序 网站 频道 查询 测试 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 辽宁智能边缘计算服务器 软件开发技能培训要多少钱 数据库磁盘繁忙检查 vf数据库与数据表常用命令 sql数据库怎么写期初余额 数据库光盘映像文件如何安装 idm代理服务器是干什么的 手机网络安全选项在哪里设置 商品数据库的格式 计算机网络技术发源于 社区网络安全宣传口号 网络安全教育手抄报的字体 数据库文件的转移 河北企业软件开发承诺守信 江苏省网络安全宣传周是 东财网络安全管理中心 福建通讯软件开发设施应用 高科技互联网大会 ajax服务器请求拒绝 湖南创新网络技术服务单价 修改学校服务器成绩 海南高宇网络技术有限公司游戏是虚假宣传吗 服务器1 核 带100台电脑服务器配置 网络服务器系统安装教程详细步骤 上位机软件开发指南 厦门奕宝互联网科技有限公司 地税局强化网络安全 龙芯服务器文件夹乱码 网络安全法诞生视屏
0