HDFS配置文件的关键参数主要包括以下几个方面:
core-site.xml
fs.defaultFS
: 指定默认文件系统的URI,通常设置为HDFS的URL,例如 hdfs://namenode_host:9000
。hdfs-site.xml
dfs.replication
: 设置HDFS中文件的副本数。dfs.blocksize
: 设置HDFS中文件块的大小。dfs.namenode.name.dir
: 配置NameNode存储元数据的目录。dfs.datanode.data.dir
: 配置DataNode存储数据块的目录。dfs.namenode.rpc-address
: 配置NameNode的RPC地址和端口。dfs.namenode.http-address
: 配置NameNode的HTTP地址和端口。dfs.namenode.shared.edits.dir
: 标识Journal节点。dfs.journalnode.edits.dir
: 存储Journal数据的地方。dfs.client.failover.proxy.provider
: 用于Java客户端来连接Active的NameNode。hdfs-site.sh(在HA配置中)
dfs.nameservices
: HDFS名字节点服务的逻辑名称。dfs.ha.namenodes.<nameservice_id>
: 每一个NameNode在集群中的唯一标识。dfs.namenode.rpc-address.<nameservice_id>.<namenode_id>
: NameNode在RPC时使用的端口。dfs.namenode.http-address.<nameservice_id>.<namenode_id>
: NameNode对外提供的HTTP服务的端口。dfs.namenode.shared.edits.dir
: 标识Journal节点。dfs.journalnode.edits.dir
: 存储Journal数据的地方。这些参数涵盖了HDFS的基本配置、高可用性配置、数据存储和访问等方面的设置。根据具体的需求和集群规模,可能还需要调整其他相关参数。