Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,这篇文章主要介绍Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!flume打到hdfs上时,按照文件大小
千家信息网最后更新 2025年12月03日Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办
这篇文章主要介绍Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
flume打到hdfs上时,按照文件大小生成文件,在达到指定大小之前数据都是以.tmp文件形式保存在hdfs上,hive外部表也会加载这些文件,但是当文件完成后.tmp会消失,这时候hive会报找不到文件的错误。解决方法是自己写hive的pathfilter类,hive加载数据的时候把tmp文件过滤掉不加载即可。
错误信息如下:
自定义PathFilter类如下:
/** * * @Title: FileFilterExcludeTmpFiles.java * @Description: hive加载分区表时会加载.tmp的文件,该类型文件在flume滚动数据之后就会消失,此时hive找不到该文件就会报错 * 该类会将.tmp的文件过滤掉,不加载进hive的分区表中 * @version V0.1.0 * @see */public class FileFilterExcludeTmpFiles implements PathFilter{ private static final Logger logger = LoggerFactory.getLogger(FileFilterExcludeTmpFiles.class); public boolean accept(Path path) { // TODO Auto-generated method stub return !name.startsWith("_") && !name.startsWith(".") && !name.endsWith(".tmp"); }}编写完后,打成jar包上传服务器,再修改hive-site.xml文件,修改如下:
hive.aux.jars.path file:///usr/lib/mylib/FilterTmpPath.jar The location of the plugin jars that contain implementations of user defined functions and serdes. mapred.input.pathFilter.class cn.utils.hive.FileFilterExcludeTmpFiles
以上是"Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办"这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!
文件
分区表
数据
怎么办
内容
大小
篇文章
错误
会报
价值
信息
兴趣
小伙
小伙伴
形式
方法
时候
更多
服务器
知识
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
新乡矩阵互联网科技
网络安全事件应急预案分级
java表格更改数据库
易语言mdb数据库找最大值
32线程服务器
服务器操作系统
腾讯云数据库到期处理机制
美国农业部数据库如何查
宋佳黄轩网络安全
博爱软件开发怎么样
如何修改电脑数据库名称
麦快我的世界服务器
幻塔手机不一样服务器一样吗
南华大学的网络安全实验室
dns服务与web服务器
彩虹六号服务器缩写
mu 奇迹 服务器
网络安全红客书籍
ibm 服务器 型号
如何免费试用腾讯云服务器
服务器存储账户口令
山东手机软件开发团队
对于网络安全防范
科达录音服务器
互联网应用汇软件开发的简介
想学网络安全学啥专业
网络技术公司大全
曼乐网络技术有限公司
精进电动软件开发
路由器信号强但是无法连接服务器