logstash将Kafka中的日志数据订阅到HDFS
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,前言:通常情况下,我们将Kafka的日志数据通过logstash订阅输出到ES,然后用Kibana来做可视化分析,这就是我们通常用的ELK日志分析模式。但是基于ELK的日志分析,通常比较常用的是实时分
千家信息网最后更新 2025年12月03日logstash将Kafka中的日志数据订阅到HDFS
前言:通常情况下,我们将Kafka的日志数据通过logstash订阅输出到ES,然后用Kibana来做可视化分析,这就是我们通常用的ELK日志分析模式。但是基于ELK的日志分析,通常比较常用的是实时分析,日志存个十天半个月都会删掉。那么在一些情况下,我需要将日志数据也存一份到我HDFS,积累到比较久的时间做半年、一年甚至更长时间的大数据分析。下面就来说如何最简单的通过logstash将kafka中的数据订阅一份到hdfs。

一:安装logstash(下载tar包安装也行,我直接yum装了)
#yum install logstash-2.1.1
二:从github上克隆代码
#git clone https://github.com/heqin5136/logstash-output-webhdfs-discontinued.git#lslogstash-output-webhdfs-discontinued
三:安装logstash-output-webhdfs插件
#cd logstash-output-webhdfs-discontinuedlogstash的bin目录下有个plugin,使用plugin来安装插件#/opt/logstash/bin/plugin install logstash-output-webhdfs

四:配置logstash
#vim /etc/logstash/conf.d/logstash.confinput { kafka { zk_connect => '10.10.10.1:2181,10.10.10.2:2181,10.10.10.3:2181' #kafka的zk集群地址 group_id => 'hdfs' #消费者组,不要和ELK上的消费者一样 topic_id => 'apiAppWebCms-topic' #topic consumer_id => 'logstash-consumer-10.10.8.8' #消费者id,自定义,我写本机ip。 consumer_threads => 1 queue_size => 200 codec => 'json' }}output { #如果你一个topic中会有好几种日志,可以提取出来分开存储在hdfs上。if [type] == "apiNginxLog" { webhdfs { workers => 2 host => "10.10.8.1" #hdfs的namenode地址 port => 50070 #webhdfs端口 user => "hdfs" #hdfs运行的用户啊,以这个用户的权限去写hdfs。 path => "/data/logstash/apiNginxLog-%{+YYYY}-%{+MM}-%{+dd}/logstash-%{+HH}.log #按天建目录,按小时建log文件。 flush_size => 500# compression => "snappy" #压缩格式,可以不压缩 idle_flush_time => 10 retry_interval => 0.5 } }if [type] == "apiAppLog" { webhdfs { workers => 2 host => "10.64.8.1" port => 50070 user => "hdfs" path => "/data/logstash/api/apiAppLog-%{+YYYY}-%{+MM}-%{+dd}.log" flush_size => 500# compression => "snappy" idle_flush_time => 10 retry_interval => 0.5 } } stdout { codec => rubydebug }}五:启动logstash
#/etc/init.d/logstash start
已经可以成功写入了。
日志
分析
数据
消费者
消费
订阅
地址
常用
情况
插件
用户
目录
成功
下有
代码
前言
半年
实时
小时
就是
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
南阳网络技术参考价格
网络安全培训工作安排
做兼职什么app软件开发
校园网络专用服务器设备
迅购网络技术服务中心
旷视科技网络技术有限公司
泽晟软件开发有限公司
网络技术与人工智能论文
嵌入式软件开发和后端开发
epi无法连接数据库
山西太原国企php软件开发
制定网络安全策略需那些内容
盐城厂家软件开发平台
最好用的数据库软件最新完整版
关于网络安全宣传标题
怎样建立传感器数据库
希腊网络安全风险大吗
垃圾分类信息数据库
网络技术选择题库
数据库oracle查询工具
华为5g网络技术有多强
青浦区服务器回收哪里有
怎么学习sql数据库
吉林网络技术转让平均价格
校园网络安全上网安全
软件开发与平面设计哪个工资高
武汉电商erp软件开发
网络安全防护技术培训
成功软件开发有限公司
网络安全与执法专业哪个警校最好