在Ubuntu上实现Hadoop数据存储,需先安装配置Hadoop环境,再通过HDFS命令操作数据。以下是关键步骤:
JAVA_HOME
。/usr/local/hadoop
),配置环境变量HADOOP_HOME
。core-site.xml
,设置HDFS默认路径(如hdfs://localhost:9000
)。hdfs-site.xml
,指定NameNode和DataNode数据存储目录(如/usr/local/hadoop/data/name
和/usr/local/hadoop/data/data
)。hdfs namenode -format
,初始化文件系统。start-dfs.sh
和start-yarn.sh
启动HDFS和YARN。hdfs dfs -put
命令将本地文件上传至HDFS指定路径(如/user/hadoop/input
)。示例命令:
# 上传本地文件到HDFS
hdfs dfs -mkdir -p /user/hadoop/input
hdfs dfs -put ~/local_file.txt /user/hadoop/input
# 查看HDFS文件
hdfs dfs -ls /user/hadoop/input
说明: