安装Hadoop在Linux上需要执行以下步骤:
前往Apache Hadoop官方网站(https://hadoop.apache.org/)下载最新的Hadoop版本。
或者使用以下命令从终端下载Hadoop软件包:
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
tar -xzvf hadoop-3.3.1.tar.gz
~/.bashrc
文件:vim ~/.bashrc
# Hadoop Configuration
export HADOOP_HOME=/path/to/hadoop-3.3.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
保存并退出文件。
执行以下命令以使环境变量生效:
source ~/.bashrc
cd /path/to/hadoop-3.3.1/etc/hadoop
hadoop-env.sh
文件并修改Java路径:vim hadoop-env.sh
将以下行修改为正确的Java路径:
export JAVA_HOME=/path/to/java
core-site.xml
文件并添加以下配置:<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
hdfs-site.xml
文件并添加以下配置:<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
hdfs namenode -format
start-dfs.sh
现在,您已经在Linux上成功安装和启动了Hadoop。您可以通过访问http://localhost:9870来查看Hadoop集群的Web界面。