定位与总体思路
常见瓶颈与对策一览
| 瓶颈类型 | 典型症状 | 快速验证 | 优化要点 |
|---|---|---|---|
| 小文件过多 | NameNode 堆内存高、RPC 延迟上升、列表目录慢 | 统计目录文件数、监控堆使用 | 合并小文件(归档/HAR)、减少单目录条目、合理分区/分桶 |
| 数据本地性差 | 大量跨节点读、网络吞吐打满 | 查看作业本地读比例、网络监控 | 增加数据亲和调度、扩容同机架节点、避免频繁数据倾斜 |
| 磁盘 I/O 瓶颈 | 写/读吞吐上不去、iostat 高 util、await 高 | iostat -x 1、磁盘繁忙度 | 使用 SSD、多磁盘目录、合理 I/O 调度器(SSD 用 noop/deadline) |
| 网络瓶颈 | 带宽跑满、副本复制慢、远程读多 | sar -n DEV、ifstat | 升级至 10Gbps+、启用短路读/数据本地读、减少跨机房流量 |
| NameNode 元数据压力 | RPC 排队、启动慢、GC 频繁 | JMX RPC 队列、GC 日志 | 增大堆与 handler、控制小文件、必要时 Federation/HA |
| 参数/系统限制 | 打开文件数不够、连接数受限、TIME_WAIT 多 | ulimit -n、ss -s、netstat -n | 提升文件描述符/端口范围、调优 TCP、禁用 atime、调大预读 |
关键配置与操作系统优化
验证与持续调优
扩容与架构优化