如何在CentOS上使用HDFS命令行工具 - 问答

在CentOS上使用HDFS命令行工具，您需要首先安装Hadoop，并配置好Hadoop环境变量。以下是详细步骤：

1. 安装Hadoop

方法一：使用yum安装

CentOS官方仓库提供了Hadoop的安装包，可以通过yum进行安装。

sudo yum install hadoop

方法二：手动下载并安装

访问Hadoop官方网站下载最新版本的Hadoop。
解压下载的文件到指定目录，例如/usr/local/hadoop。

sudo tar -xzvf hadoop-3.x.x.tar.gz -C /usr/local/

配置环境变量。

编辑/etc/profile.d/hadoop.sh文件：

sudo vi /etc/profile.d/hadoop.sh

添加以下内容：

export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

使配置生效：

source /etc/profile.d/hadoop.sh

2. 配置Hadoop

修改core-site.xml

编辑$HADOOP_HOME/etc/hadoop/core-site.xml文件：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

修改hdfs-site.xml

编辑$HADOOP_HOME/etc/hadoop/hdfs-site.xml文件：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop/data/datanode</value>
    </property>
</configuration>

格式化HDFS

在首次启动HDFS之前，需要对其进行格式化：

hdfs namenode -format

3. 启动Hadoop集群

启动NameNode和DataNode

start-dfs.sh

启动YARN（如果需要）

start-yarn.sh

4. 使用HDFS命令行工具

列出目录内容

hdfs dfs -ls /

创建目录

hdfs dfs -mkdir /user/hadoop/testdir

上传文件到HDFS

hdfs dfs -put /local/path/to/file.txt /user/hadoop/testdir/

下载文件从HDFS

hdfs dfs -get /user/hadoop/testdir/file.txt /local/path/to/

查看文件内容

hdfs dfs -cat /user/hadoop/testdir/file.txt

删除文件或目录

hdfs dfs -rm /user/hadoop/testdir/file.txt
hdfs dfs -rm -r /user/hadoop/testdir

5. 停止Hadoop集群

停止NameNode和DataNode

stop-dfs.sh

停止YARN（如果启动了）

stop-yarn.sh

通过以上步骤，您可以在CentOS上成功安装并配置Hadoop，并使用HDFS命令行工具进行文件操作。

0 赞

0 踩