/etc/sysctl.conf):增大文件句柄数(fs.file-max)、优化TCP连接参数(如net.ipv4.tcp_tw_reuse=1)。vm.dirty_ratio(建议50)和vm.dirty_background_ratio(建议10)。hadoop-env.sh中设置HADOOP_NAMENODE_OPTS(如-Xmx4096m);Hadoop 3.x可手动配置内存分配。dfs.namenode.handler.count(默认10,建议调整为集群规模的20倍对数)。hdfs-site.xml中通过dfs.namenode.name.dir配置多个存储目录,提升可靠性。dfs.datanode.data.dir配置多磁盘目录,分散数据存储压力。dfs.datanode.max.transfer.threads(默认4096,可增至8192)以提升并发读写能力。dfs.blocksize(如128MB或256MB,大文件建议更大)。core-site.xml中配置fs.trash.interval(如60分钟)和fs.trash.checkpoint.interval,避免误删数据。TestDFSIO工具测试读写性能,分析网络带宽与磁盘I/O瓶颈。hdfs diskbalancer命令平衡节点内磁盘数据分布,避免单盘负载过高。Hadoop Archive工具),减少NameNode元数据压力。dfs.hosts)限制节点访问,防止恶意节点加入。hdfs dfsadmin -refreshNodes刷新节点状态,无需重启集群。注意事项:优化前需备份数据,测试环境验证配置有效性,避免影响生产环境稳定性。