Kafka中的消息是否会丢失和重复消费

参考答案

首先,要确定Kafka的消息是否丢失或重复,从两个方面分析入手:消息发送和消息消费。

1.   消息发送

1.1  Kafka 消息发送有两种方式:

  • 同步(sync)
  • 异步(async)

默认是同步方式,可以通过producer.type属性进行配置。

1.2  Kafka 通过配置 request.required.acks 属性,来确认消息的生产:

  • 0 — 表示不进行消息接收是否成功的确认;
  • 1 — 表示当Leader接收成功时确认;
  • -1 — 表示Leader和Follower都接收成功时确认。

1.3   综上所述,有6种消息生产的情况,下面分析消息丢失的两个场景:

  • acks=0 — 不和Kafka集群进行消息接收确认,则当网络异常、缓冲区满了等情况时,消息可能丢失;
  • acks=1  — 同步模式下,只有Leader确认接收成功后但挂掉了,副本没有同步,数据可能丢失。

2.   消息消费

2.1   Kafka 消息消费有两个consumer接口:

  • Low-level API:消费者自己维护offset等值,可以实现对Kafka的完全控制;
  • High-level API:封装了对parition和offset的管理,使用简单;

2.2   如果使用高级接口High-level API,可能出现的问题及解决方法:

  • 可能存在的问题:当消息消费者从集群中把消息取出来、并提交了新的消息offset值后,还没来得及消费就挂掉了,下次再消费时,之前没消费成功的消息就会消失。
  • 解决办法:针对消息丢失:同步模式下,确认机制设置为-1,即让消息写入Leader和Follower之后再确认消息发送成功;异步模式下,为防止缓冲区满,可以在配置文件设置不限制阻塞超时时间,当缓冲区满时让生产者一直处于阻塞状态;针对消息重复:将消息的唯一标识保存到外部介质中,每次消费时判断是否处理过即可。

以上,是 Kafka 面试题【Kafka中的消息是否会丢失和重复消费】的参考答案。

输出,是最好的学习方法

欢迎在评论区留下你的问题、笔记或知识点补充~

—end—

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧