千家信息网

flume的功能是什么

发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,这篇文章主要介绍"flume的功能是什么",在日常操作中,相信很多人在flume的功能是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"flume的功能是什么"的疑惑
千家信息网最后更新 2025年12月01日flume的功能是什么

这篇文章主要介绍"flume的功能是什么",在日常操作中,相信很多人在flume的功能是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"flume的功能是什么"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

flume自带写hdfs的组建 hdfs sink,功能和性能都不错,就是有些缺点不好克服。

1,收集的日志一直在写hadoop,虽然可以订一个规则间断写hadoop,例如设置batchSize等,但在大压力下,几乎可以认为是每时每刻都在写hafs.

2,容错性差,日志收集的过程中,hadoop出现错误(例如,hdfs丢块)等问题,就会崩溃。

3,还有4,5等等,就是hdfs sink 有些问题了,不写了。

这里写一个先收集日志到本地,形成文件,然后把这个文件上载到远程的hadoop上。

这样做有好处,

1,日志收聚到本地文件。在收集日志过程中出现的hadoop错误、异常等等文件,在收集日志成文件的工程中不存在。

2,上传到hadoop采用文件的方式,使用hadoop自己的fs API,可以有很好的效率。

3,很好的容错机制,上传文件的工程中出现hadoop问题,导致文件上传失败,没关系,下一个工作任务再上传就好了,只有上传成功才删除本地文件。

4,还有好多了,这里不写了。

大致的架构

这里做假单的解释:

LocalToHDFSSink.java 就是flume sink的启动类,在配置文件中要做配置的,a1.sinks.k1.type = com.fone.flume.sink.localFile.LocalToHDFSSink

其中如下代码:

@Overridepublic void start() {......    CronTriggerFileHDFS cronTriggerFileHDFS = new CronTriggerFileHDFS();        LOG.info("定时器设置,cron expression :{} .", cronExpression);try {            cronTriggerFileHDFS.run(filePath, hdfsPath, cronExpression, isKeep);        } catch (Exception e) {            LOG.warn("向hdfs写文件的定时器错误,错误:{}.", e);        }        sinkCounter.start();......}
@Overridepublic void stop() {......if (cronTriggerFileHDFS != null) {try {                cronTriggerFileHDFS.shutdown();            } catch (Exception e) {// TODO Auto-generated catch block                e.printStackTrace();            }        }......}

开关定时器。

定时器设定:a1.sinks.k1.local.cronExpression = 0 */15  * * * ? 按照quartZ的设置要求进行设置,不了解者去看quartZ cronTigger设置。

LocalToHDFSSink的文件存储是这样的,本地文件给定一个初始的目录a1.sinks.k1.local.directory,日志在这个初始的目录存储,动态的目录结构通过a1.sinks.k1.local.middleDir 设置。

远程的hadoop给定一个初始的目录a1.sinks.k1.hdfs.directory ,其它的目录结构和文件与本地的设置完全相同,也就是把a1.sinks.k1.local.directory目录下的所有内容,复制到a1.sinks.k1.hdfs.directory 完成工作。

日志收集文件在本地产生,没有完成的时候,带文件名后缀.tmp,完成后去掉.tmp,以此作为是否现在执行复制到hadoop的标志。

其余的看代码吧。

到此,关于"flume的功能是什么"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

文件 日志 目录 功能 定时器 错误 问题 学习 就是 代码 工程 更多 结构 过程 容错 存储 工作 帮助 配置 不错 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 数据库在客户关系的实际应用 数据库数量过多怎么办 网络安全员年度工作总结 真正的裸金属服务器是否需要硬盘 h3c服务器关机后一直响 做好春节期间网络安全工作的通知 行业应用软件开发服务是指什么 部队网络安全对照检讨反思 服务器需要一直重启吗 阿里云服务器管理终端 数据库answers什么意思 住建局贯彻落实网络安全责任制 网络技术的发展过称 网络安全事件预警是什么 饥荒服务器搭建证书不存在 网络安全演练举办 联系人数据库怎么恢复软件 医鹿抢九价服务器被挤爆 2022年看门狗服务器关了 民航网络安全 当代大学生如何学习网络安全 数据库系统的任务和目标 h3c服务器关机后一直响 金明科技软件开发 山东省网信办网络安全专家 科技互联网活动策划 中智软件开发 面试 业务模型和数据库模型 香港服务器空间 请问酒店网络安全怎么办
0