以下是在Ubuntu上搭建Hadoop测试环境(以伪分布式为例)的步骤:
sudo adduser hadoop创建新用户,然后sudo usermod -aG sudo hadoop将其加入sudo组。sudo apt update && sudo apt upgrade -y,安装Javasudo apt install default-jdk -y,安装SSHsudo apt install openssh-server。wget https://hadoop.apache.org/release/3.3.6.html,然后tar -xzvf hadoop-3.3.6.tar.gz,移动到/usr/local并重命名sudo mv hadoop-3.3.6 /usr/local/hadoop。~/.bashrc,添加export HADOOP_HOME=/usr/local/hadoop和export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin,然后source ~/.bashrc。$HADOOP_HOME/etc/hadoop,配置core-site.xml,设置fs.defaultFS为hdfs://localhost:9000等;配置hdfs-site.xml,设置dfs.replication为1等。hdfs namenode -format格式化HDFS,然后start-dfs.sh和start-yarn.sh启动服务。jps查看进程,有NameNode、DataNode等进程表示启动成功,也可在浏览器访问http://localhost:9870查看HDFS状态。