在CentOS系统中,HDFS(Hadoop Distributed File System)的常用命令主要包括以下几类:
启动HDFS
start-dfs.sh
停止HDFS
stop-dfs.sh
格式化NameNode(仅在首次启动或重置集群时使用)
hdfs namenode -format
查看HDFS状态
hdfs dfsadmin -report
创建目录
hdfs dfs -mkdir /path/to/directory
删除目录或文件
hdfs dfs -rm -r /path/to/directory
hdfs dfs -rm /path/to/file
上传文件到HDFS
hdfs dfs -put localfile /path/to/hdfs
从HDFS下载文件到本地
hdfs dfs -get /path/to/hdfs localfile
查看HDFS中的文件和目录列表
hdfs dfs -ls /path/to/directory
复制文件或目录
hdfs dfs -cp /source/path /destination/path
移动或重命名文件或目录
hdfs dfs -mv /source/path /destination/path
更改文件或目录的权限
hdfs dfs -chmod 755 /path/to/file_or_directory
更改文件或目录的所有者
hdfs dfs -chown username:groupname /path/to/file_or_directory
设置副本因子
hdfs dfs -setrep -w 3 /path/to/file
检查文件的块信息
hdfs fsck /path/to/file -files -blocks -locations
查看HDFS的块报告
hdfs dfsadmin -report
调整HDFS配置
hdfs-site.xml
和core-site.xml
文件,然后重启HDFS服务。查看HDFS的NameNode和DataNode日志
$HADOOP_HOME/logs
目录下。使用Web界面监控HDFS
http://namenode_host:50070
。列出所有正在运行的Java进程
jps
查找特定进程ID的进程信息
ps -ef | grep <process_name>
杀死进程
kill -9 <process_id>
sudo
)。总之,熟练掌握这些HDFS常用命令对于日常管理和维护Hadoop集群至关重要。