Kafka在Linux环境下的性能提升需从硬件选择、操作系统参数、Kafka配置及监控等多维度协同优化,以下是具体措施:
-Xms4G -Xmx4G,初始与最大堆内存一致,减少GC停顿)。/etc/security/limits.conf,添加* soft nofile 65536、* hard nofile 65536(软/硬限制设为65536),避免因文件描述符不足导致连接拒绝。vm.swappiness=1(默认60),降低系统使用交换分区的概率,优先使用物理内存。vm.dirty_background_ratio=5(脏页占比达到5%时触发后台刷盘)、vm.dirty_ratio=10(脏页占比达到10%时强制刷盘),平衡内存与磁盘I/O。/etc/sysctl.conf,添加net.core.rmem_max=16777216、net.core.wmem_max=16777216(TCP读/写缓冲区最大值)、net.ipv4.tcp_fin_timeout=30(TCP连接超时时间)、net.ipv4.tcp_tw_reuse=1(复用TIME_WAIT连接),提升网络吞吐与连接效率。num.network.threads:处理网络请求的线程数,建议设置为CPU核心数的1-2倍(如8核CPU设为8-16)。num.io.threads:处理磁盘I/O的线程数,建议设置为磁盘数量的1-2倍(如4块SSD设为4-8)。log.segment.bytes:单个日志段大小,建议设置为128MB-512MB(默认1GB过大,会增加日志清理时间)。log.retention.hours:日志保留时间,根据业务需求设置(如168小时=7天),避免磁盘空间浪费。num.partitions:主题分区数,需大于消费者数量(如10个消费者设为10-20),提升并行处理能力。default.replication.factor:默认副本因子,建议设置为3(保证高可用),但需权衡网络开销(副本同步会增加带宽消耗)。batch.size:生产者批量发送消息的大小,建议设置为1MB(默认16KB,增大可减少网络请求次数)。linger.ms:生产者发送前等待时间,建议设置为100ms以上(默认0ms,等待可合并更多消息)。compression.type:消息压缩类型,推荐lz4(压缩率高且CPU开销低),可减少网络传输量。-Xms4G -Xmx4G)。-XX:+UseG1GC),相比CMS更适合大堆内存,可减少GC停顿时间。-XX:MetaspaceSize=128m -XX:MaxMetaspaceSize=256m(元空间用于存储类元数据,避免溢出)。net.core.somaxconn(最大并发连接数,建议设为8192)、net.ipv4.tcp_max_syn_backlog(SYN队列长度,建议设为8192)、net.ipv4.ip_local_port_range(端口范围,建议设为1024-65535),提升网络连接能力。socket.send.buffer.bytes/socket.receive.buffer.bytes:发送/接收缓冲区大小,建议设置为1MB(默认100KB,增大可提升吞吐)。num.network.threads:如前述,处理网络请求的线程数。advertised.listeners区分内外网地址,实现内外网流量逻辑隔离,避免相互影响。server.log),排查异常(如磁盘满、网络中断)。log.retention参数)、重建索引(kafka-log-dirs工具)、滚动升级Kafka版本(获取性能改进)。