在Ubuntu上配置Kafka时,网络优化是一个重要的环节,可以显著提升Kafka的性能和稳定性。以下是一些关键的网络优化策略:
batch.size:从默认的16KB提升至128KB~1MB,减少网络请求次数。linger.ms:为50~100ms,允许生产端积累更多消息进行批量发送。snappy 或 lz4,压缩率与计算开销平衡,可减少50%的网络传输量。acks=1(仅Leader确认),牺牲少量可靠性以换取吞吐量提升30%。replication.factor=3保障高可用,但需避免副本过多导致同步延迟。num.network.threads=8(网络收发线程,适配万兆网卡),num.io.threads=16(磁盘I/O线程,匹配CPU核心数)。log.segment.bytes=1GB:减少分段数量,降低索引开销。log.retention.hours=168(7天)自动清理过期数据,避免磁盘占满。fetch.min.bytes=1MB:减少拉取频率,提升吞吐量40%。max.poll.records=1000:单次拉取更多消息,降低处理开销。enable.auto.commit=true)并设置 auto.commit.interval.ms=5000,平衡数据一致性与性能。sendfile系统调用,数据从页缓存直接发送到网卡,减少4次数据拷贝,提升吞吐量2倍。kafka-producer-perf-test 和 kafka-consumer-perf-test 模拟压测,验证优化效果。UnderReplicatedPartitions)、请求队列时间(RequestQueueTimeMs)。通过上述优化策略,可以显著提升Kafka在Ubuntu上的性能和稳定性。建议根据具体业务场景调整参数,并定期通过Chaos Testing模拟故障,验证集群的健壮性。