千家信息网

Kafka集群在马蜂窝大数据平台的优化是怎样的

发表于:2025-11-08 作者:千家信息网编辑
千家信息网最后更新 2025年11月08日,本篇文章给大家分享的是有关Kafka集群在马蜂窝大数据平台的优化是怎样的,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Kafka是当下热
千家信息网最后更新 2025年11月08日Kafka集群在马蜂窝大数据平台的优化是怎样的

本篇文章给大家分享的是有关Kafka集群在马蜂窝大数据平台的优化是怎样的,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

  Kafka是当下热门的消息队列中间件,它可以实时地处理海量数据,具备高吞吐、低延时等特性及可靠的消息异步传递机制,可以很好地解决不同系统间数据的交流和传递问题。

  Kafka在马蜂窝也有非常广泛的应用,为很多核心的业务提供支撑。下面将围绕Kafka在马蜂窝大数据平台的应用实践,介绍相关业务场景、在Kafka应用的不同阶段我们遇到了哪些问题以及如何解决、之后还有哪些计划等。

应用场景

  从Kafka在大数据平台的应用场景来看,主要分为以下三类:

  第一类是将Kafka作为数据库,提供大数据平台对实时数据的存储服务。从来源和用途两个维度来说,可以将实时数据分为业务端DB数据、监控类型日志、基于埋点的客户端日志(H5、WEB、APP、小程序)和服务端日志。

  第二类是为数据分析提供数据源,各埋点日志会作为数据源,支持并对接公司离线数据、实时数据仓库及分析系统,包括多维查询、实时DruidOLAP、日志明细等。

  第三类是为业务方提供数据订阅。除了在大数据平台内部的应用之外,我们还使用Kafka为推荐搜索、大交通、酒店、内容中心等核心业务提供数据订阅服务,如用户实时特征计算、用户实时画像训练及实时推荐、反作弊、业务监控报警等。

四个阶段

  早期大数据平台之所以引入Kafka作为业务日志的收集处理系统,主要是考虑到它高吞吐低延迟、多重订阅、数据回溯等特点,可以更好地满足大数据场景的需求。但随着业务量的迅速增加,以及在业务使用和系统维护中遇到的问题,例如注册机制、监控机制等的不完善,导致出现问题无法快速定位,以及一些线上实时任务发生故障后没有快速恢复导致消息积压等,使Kafka集群的稳定性和可用性得受到挑战,经历了几次严重的故障。

  解决以上问题对我们来说迫切而棘手。针对大数据平台在使用Kafka上存在的一些痛点,我们从集群使用到应用层扩展做了一系列的实践,整体来说包括四个阶段:

  第一阶段:版本升级。围绕平台数据生产和消费方面存在的一些瓶颈和问题,我们针对目前的Kafka版本进行技术选型,最终确定使用1.1.1版本。

  第二阶段:资源隔离。为了支持业务的快速发展,我们完善了多集群建设以及集群内Topic间的资源隔离。

  第三阶段:权限控制和监控告警。

  首先在安全方面,早期的Kafka集群处于裸跑状态。由于多产品线共用Kafka,很容易由于误读其他业务的Topic导致数据安全问题。因此我们基于SASL/SCRAM+ACL增加了鉴权的功能。

  在监控告警方面,Kafka目前已然成为实时计算中输入数据源的标配,那么其中Lag积压情况、吞吐情况就成为实时任务是否健康的重要指标。因此,大数据平台构建了统一的Kafka监控告警平台并命名「雷达」,多维度监控Kafka集群及使用方情况。

  第四阶段:应用扩展。早期Kafka在对公司各业务线开放的过程中,由于缺乏统一的使用规范,导致了一些业务方的不正确使用。为解决该痛点,我们构建了实时订阅平台,通过应用服务的形式赋能给业务方,实现数据生产和消费申请、平台的用户授权、使用方监控告警等众多环节流程化自动化,打造从需求方使用到资源全方位管控的整体闭环。

以上就是Kafka集群在马蜂窝大数据平台的优化是怎样的,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。

数据 平台 业务 实时 应用 集群 监控 问题 阶段 日志 马蜂 马蜂窝 场景 系统 服务 订阅 情况 数据源 方面 机制 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 上海饷哆网络技术有限公司 勤哲服务器防火墙 阿里云服务器网站安全 数据库工程师软考历年真题 深度os应用软件开发开台 大三本科软件开发如何找工作 程序员用什么软件开发工资高 杭州智慧工会软件开发哪家公司好 网络安全运营月报 郑州大学网络安全学院院长 怎么登录数据库的命令 高铁互联网科技股 贵州便民平台软件开发公司 数据库原型系统 大型网站服务器租用需要什么 在哪可以学习网络技术 美国军队网络安全防护体系 西城区信息化软件开发客户至上 甘肃数据库安全 数据库在数据更新时应该注意什么 北京计算机软件开发需要多少钱 数据库中如何设置默认日期 互联网商务云科技PPT 鼎湖宝盈网络技术有限公司 陕西 网络安全中标 铁路网络安全防护可研报告 什么情况要用SQL数据库作用 车子停在服务器会被扣钱吗 医院无密码的网络安全吗 dubbo 服务器
0