Spark Streaming结合Flume和Kafka的日志分析是怎样的
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,今天就跟大家聊聊有关Spark Streaming结合Flume和Kafka的日志分析是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。S
千家信息网最后更新 2025年12月01日Spark Streaming结合Flume和Kafka的日志分析是怎样的
今天就跟大家聊聊有关Spark Streaming结合Flume和Kafka的日志分析是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
Spark Streaming结合Flume、Kafka的日志分析
1.修改相应的配置文件
按照 http://my.oschina.net/sunmin/blog/692994
整合安装Flume+Kafka+SparkStreaming
将flume/conf/producer.conf将需要监控的日志输出文件修改为本地的log 路径:/var/log/nginx/www.eric.aysaas.com-access.log
2.导入相关 jar 包
(快捷键 Ctrl + Alt + Shift + s),点击Project Structure界面左侧的"Modules"显示下图界面
jar 包自己编译,或者去载 http://search.maven.org/#search|ga|1|g%3A%22org.apache.spark%22%20AND%20v%3A%221.6.1%22
3.新建log/KafkaTest.scala 代码如下
import kafka.serializer.StringDecoderimport org.apache.spark.SparkConfimport org.apache.spark.streaming.dstream.DStreamimport org.apache.spark.streaming.{Seconds, StreamingContext}import org.apache.spark.streaming.kafka.KafkaUtils/** * flume+kafka+SparkStreaming 实时 nginx 日志获取 * Created by eric on 16/6/29. */object KafkaLog { def main(agrs: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster("local[1]").setAppName("StreamingTest") val ssc = new StreamingContext(sparkConf, Seconds(20))//代表一个给定的秒数的实例 val topic = "HappyBirthDayToAnYuan" val topicSet = topic.split(" ").toSet //用 brokers and topics 创建 direct kafka stream val kafkaParams = Map[String, String]("metadata.broker.list" -> "localhost:9092") //直接从 kafka brokers 拉取信息,而不使用任何接收器. val messages = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder]( ssc, kafkaParams, topicSet ) val lines = messages.map(_._2) lines.print() val words: DStream[String] = lines.flatMap(_.split("\n")) words.count().print() //启动 ssc.start() ssc.awaitTermination() }}4.Test
访问本地页面产生日志 http://www.eric.aysaas.com/app/admin
在这20秒内总共产生的日志行数为:
看完上述内容,你们对Spark Streaming结合Flume和Kafka的日志分析是怎样的有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
日志
分析
内容
文件
界面
下图
代码
代表
实例
实时
快捷键
接收器
更多
知识
篇文章
行业
资讯
资讯频道
路径
页面
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
使用香港服务器的域名需要备案吗
网络安全的封面图
db2连数据库
用友服务器怎么连接网络
用浏览器管理jdbc数据库
易欧互联网科技有限公司
松江区企业软件开发定制报价表
数据库中的码
我的世界服务器增加人数上限
上海国家网络安全周
南航广州软件开发待遇
数据库 补充作业
网络安全基础笔试分析题
在大连做软件开发有前途吗
电器硬件软件开发公司
上海商业软件开发零售价
两台服务器如何做一主一备
焦作市驰骋网络技术有限公司
数据库支持管理工具
软件开发java接单群
服务器管理怎么下载
实时数据库位
ctf网络安全比赛怎么玩
彭博社数据库
穿越火线什么服务器最有钱
中山会所会员系统软件开发
潼南天气预报软件开发
软件开发在那里兼职
连不上服务器数据库的原因
江苏电商软件开发定制