在线日志分析项目解读
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,1,日志的采集从flume agent 上的数据一般分到两条线上一条是kafka 集群 ,后期可以用流式处理(spark streaming 或storm 等等)一条是到hdfs,后期可以用hive处
千家信息网最后更新 2025年12月03日在线日志分析项目解读
1,日志的采集
从flume agent 上的数据一般分到两条线上一条是kafka 集群 ,后期可以用流式处理(spark streaming 或storm 等等)一条是到hdfs,后期可以用hive处理,
业界叫lambda架构 architecture (一般公司的推荐系统,就是用这种架构)
flume-ng agent 采集收集日志后,聚合在一个节点上(也可以不聚合)
为什么要聚合?为什么不直接写到kafka集群?
假如公司规模比较大,有无数个flume节点,这么多都连kafka,会增加复杂度,有个聚合节点(会是多个节点组成,防止单节点挂了),还可以对日志格式统一处理,筛选不要的数据
hdfs 可以永久保存数据,mr 可以处理多久数据都行
kafka 集群数据可以存储一定时间不能长期存储,sparkstreaming 只能处理一定时间访问内数据
storm 流
数据源 nginx 日志,mysql 日志,tomcat 日志等等->
flume ->
kafka 消息件 消息发送到这里缓存数据一段时间 ->
spark streaming+spark sql on yarn cluster (实时计算) -> 存储
1.->redis adminLTE + flask 前端组件 + echarts3 集成到监控的系统上
2.->influxdb 时序分布式数据库 grafana 可视化组件(这两种结合比较好)
(elk kibana )
存储+可视化分析
画图工具
http://www.processon.com/
数据
日志
节点
处理
存储
时间
集群
公司
架构
消息
系统
组件
可视化
分析
复杂
业界
分布式
前端
复杂度
多个
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器开机时间命令
db指的是数据库
九代3D数字彩票游戏机数据库
cf好友服务器不稳定怎么回事
软件开发商业模式是什么
人机交互软件开发
头号玩家网络安全
mysql数据库是
软件开发专业自我评价
网络安全运维好处
服务器防护设备
冬奥会网络安全专项方案
大学生网络安全培训总结
access 数据库主键
汉南哪里有软件开发公司
网络技术归根结底
滁州物业管理软件开发定制公司
数据库锁机制设备
京科联通网络技术有限公司座机
数据库操作选择查询知识点
海南通用软件开发要多少钱
皮特软件开发
Wi-Fi的服务器
中小学生安全教育知识 网络安全
花雨庭的服务器地址电脑
葫芦娃服务器
江西师范大学网络安全专业
流媒体服务器 直播
广东互联网信息科技有限公司
计算机网络技术(35