在 Ubuntu 上查看 HDFS(Hadoop 分布式文件系统)的状态,可以通过命令行界面使用 Hadoop 提供的命令。以下是一些常用的方法:
hdfs dfsadmin 命令hdfs dfsadmin 命令可以用来获取 HDFS 的状态信息。例如,要查看 HDFS 的健康状况和各个 DataNode 的状态,可以使用以下命令:
hdfs dfsadmin -report
这个命令会显示集群中所有 DataNode 的状态,包括它们的容量、剩余空间、以及是否处于活跃状态。
hdfs getconf 命令你可以使用 hdfs getconf 命令来查看 HDFS 的配置参数,这有助于了解集群的配置情况:
hdfs getconf -confKey dfs.replication
这将返回 HDFS 的默认副本因子设置。
大多数 Hadoop 集群都提供了一个 Web 界面来监控和管理集群。默认情况下,HDFS 的 ResourceManager Web UI 可以在以下地址访问:
http://<ResourceManager-Host>:8088/cluster
在这个界面中,你可以查看集群的整体状态,包括正在运行的作业、节点状态、以及存储使用情况。
jps 命令在集群的任意节点上运行 jps 命令可以查看当前运行的 Java 进程,这有助于确认 Hadoop 的各个组件(如 NameNode、DataNode、ResourceManager 等)是否正在运行:
jps
输出中应该包含 NameNode、DataNode、SecondaryNameNode、ResourceManager 和 NodeManager 等进程。
如果需要更详细的信息,可以查看 Hadoop 的日志文件。日志文件通常位于 $HADOOP_HOME/logs 目录下。你可以使用 tail 命令来实时查看日志文件的最新内容:
tail -f $HADOOP_HOME/logs/hadoop-<username>-namenode-<hostname>.log
将 <username> 和 <hostname> 替换为相应的用户名和主机名。
确保在执行这些命令之前,你已经正确配置了 Hadoop 环境变量,如 HADOOP_HOME 和 PATH。如果你是在一个完全隔离的环境中操作,可能需要先设置这些环境变量或者使用完整路径来执行命令。