Hadoop在Ubuntu上通过**HDFS(Hadoop分布式文件系统)**实现数据存储,核心机制如下:
hdfs-site.xml
配置DataNode的数据存储路径(如dfs.datanode.data.dir
)和NameNode的元数据存储路径(如dfs.namenode.name.dir
)。hadoop fs
命令上传、下载、删除文件,例如hdfs dfs -put localfile.txt /
将本地文件上传至HDFS根目录。注:伪分布式模式下,NameNode和DataNode可运行在同一节点,需通过配置文件指定存储路径并格式化NameNode。