Spark sql的批处理物理计划BatchScanExec有什么用
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,这篇文章将为大家详细讲解有关Spark sql的批处理物理计划BatchScanExec有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。BatchScanEx
千家信息网最后更新 2025年12月03日Spark sql的批处理物理计划BatchScanExec有什么用
这篇文章将为大家详细讲解有关Spark sql的批处理物理计划BatchScanExec有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
BatchScanExec是batch类的物理计划,对应的逻辑计划是DataSourceV2Relation,是Datasource。
它的入参是Scan类,Scan类有两个重要方法,一个获取分区列表信息;另一个方法获取读取器工厂。
override lazy val partitions: Seq[InputPartition] = batch.planInputPartitions() override lazy val readerFactory: PartitionReaderFactory = batch.createReaderFactory() override lazy val inputRDD: RDD[InternalRow] = { new DataSourceRDD(sparkContext, partitions, readerFactory, supportsColumnar) }planInputPartitions方法获取分区列表;createReaderFactory获取分区读取者工厂,这两者决定一个DataSourceRDD来作为inputRDD对象。
对于传统的DataSource类,只要实现对应数据源的Scan子类就可以使用了。
而StreamingDataSourceV2Relation对应的物理计划是MicroBatchScanExec和ContinuousScanExec,这时候Scan就不用了,而使用MicroBatchStream和ContinuousStream两个流的定义类。
关于"Spark sql的批处理物理计划BatchScanExec有什么用"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
物理
方法
篇文章
两个
工厂
更多
不错
实用
重要
不用
传统
信息
内容
子类
对象
数据
数据源
文章
知识
逻辑
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
地下城进入游戏服务器断网
软件开发团队取什么名字
数据库是指数相容性吗
飞鱼软件开发
智能物联网与网络技术
数据库错误20585
数据库触发器的实现实验
网络安全充电器
加推软件开发
java数据库级联
绿色全光网络技术联盟会
游戏中无法连接服务器是怎么回事
学习网络安全的行业
服务器管理网口怎么用
在关系数据库 物理结构
虚拟服务器 内部端口
黑魂3无法登陆服务器2022
深圳网络安全咨询公司
soul服务器异常502
ftp服务器添加新用户
idea复制创建数据库表
数据库表结构有什么问题
常州安卓应用软件开发
小说存为数据库用什么结构
mac 代理 服务器
日本 网络安全基本法
国际网络安全协议投票
山东省考网络安全管理职位体测吗
国家通信网络安全
服务器显示2u什么意思