kafka节点假死
发表于:2025-11-06 作者:千家信息网编辑
千家信息网最后更新 2025年11月06日,一、前言早上醒来打开微信,同事反馈kafka集群从昨天凌晨开始写入频繁失败,赶紧打开电脑查看了kafka集群的机器监控,日志信息,发现其中一个节点的集群负载从昨天凌晨突然掉下来了,和同事反馈的时间点大
千家信息网最后更新 2025年11月06日kafka节点假死
一、前言
早上醒来打开微信,同事反馈kafka集群从昨天凌晨开始写入频繁失败,赶紧打开电脑查看了kafka集群的机器监控,日志信息,发现其中一个节点的集群负载从昨天凌晨突然掉下来了,和同事反馈的时间点大概一致,于是乎就登录服务器开始干活。
二、排错
1、查看机器监控,看是否能大概定位是哪个节点有异常

2、根据机器监控大概定位到其中一个异常节点,登录服务器查看kafka日志,发现有报错日志,并且日志就停留在这个这个时间点:
[2017-06-01 16:59:59,851] ERROR Processor got uncaught exception. (kafka.network.Processor)java.lang.OutOfMemoryError: Direct buffer memory at java.nio.Bits.reserveMemory(Bits.java:658) at java.nio.DirectByteBuffer.(DirectByteBuffer.java:123) at java.nio.ByteBuffer.allocateDirect(ByteBuffer.java:306) at sun.nio.ch.Util.getTemporaryDirectBuffer(Util.java:174) at sun.nio.ch.IOUtil.read(IOUtil.java:195) at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:379) at org.apache.kafka.common.network.PlaintextTransportLayer.read(PlaintextTransportLayer.java:108) at org.apache.kafka.common.network.NetworkReceive.readFromReadableChannel(NetworkReceive.java:97) at org.apache.kafka.common.network.NetworkReceive.readFrom(NetworkReceive.java:71) at org.apache.kafka.common.network.KafkaChannel.receive(KafkaChannel.java:160) at org.apache.kafka.common.network.KafkaChannel.read(KafkaChannel.java:141) at org.apache.kafka.common.network.Selector.poll(Selector.java:286) at kafka.network.Processor.run(SocketServer.scala:413)
3、查看kafka进程和监听端口情况,发现都正常,尼玛假死了
ps -ef |grep kafka ## 查看kafka的进程netstat -ntlp |grep 9092 ##9092kafka的监听端口
4、既然已经假死了,只能重启了
ps -ef |grep kafka |grep -v grep |awk '{print $2}' | xargs kill -9 /usr/local/kafka/bin;nohup ./kafka-server-start.sh ../config/server.properties &5、重启后在观察该节点的kafka日志,在一顿index重建之后,上面的报错信息在疯狂的刷,最后谷歌一番,解决了该问题
三、解决方案:
在
/usr/local/kafka/binkafka-run-class.sh
去掉
-XX:+DisableExplicitGC
添加
-XX:MaxDirectMemorySize=512m
在一次重启kafka,问题解决。
PS:参考链接:http://ju.outofmemory.cn/entry/75905
日志
节点
机器
集群
监控
信息
同事
时间
服务器
端口
进程
问题
定位
服务
登录
监听
频繁
一致
疯狂
前言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全管理法第八十四条
顶级网络安全工程师怎么学的
信息技术中的数据库
安徽云都网络技术有限公司
数据库设计与应用实训的思考建议
判决书数据库技术论坛
云南小学生网络安全教育
石家庄一站式服务器
12月南宁网络安全大赛
sql数据库日志查询
网吧服务器怎么设置
幼儿园开展网络安全周活动
亿赞普中国网络技术有限公司
数据库名表名字段名是什么
软件开发在哪里最好
普陀区营销网络技术服务制造价格
数据库年龄求
ssl代理服务器的作用
广州python软件开发报价
江西企业软件开发零售价
游戏数据库曝光
下列哪一项不是基因数据库
小学网络安全讲座主持稿
ICT网络技术路线
明日方舟网络安全初始化失败
网络安全的机构
网络技术支持管理制度表述
数据库表空间迁移
互联网怎样促进科技创新
沈阳市网络安全 制度