在Debian上部署Hadoop集群可参考以下步骤:
sudo apt update
和sudo apt install openjdk-8-jdk
命令安装OpenJDK 8。ssh-keygen -t rsa
生成密钥,再用cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
将公钥添加到授权列表,最后通过ssh-copy-id
命令将公钥复制到其他节点。wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
,然后解压到指定目录,如/opt/hadoop
。~/.bashrc
文件,添加export HADOOP_HOME=/opt/hadoop
和export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
,并执行source ~/.bashrc
使配置生效。/opt/hadoop/etc/hadoop
目录下,编辑core-site.xml
、hdfs-site.xml
、mapred-site.xml
和yarn-site.xml
等文件,设置相关参数,如fs.defaultFS
、dfs.replication
等。/etc/hosts
文件,添加所有节点的IP地址和主机名。hdfs namenode -format
命令。start-dfs.sh
和start-yarn.sh
脚本,启动HDFS和YARN服务。