在Debian上配置Oracle集群是一个复杂的过程,需要仔细规划和逐步执行。以下是一个基本的步骤指南,帮助你搭建一个Debian Oracle集群。
Hadoop是基于Java开发的,因此需要在每个节点上安装Java。建议使用OpenJDK 8。
sudo apt update
sudo apt install openjdk-8-jdk
java -version
在所有节点之间配置SSH免密登录,以便于节点间的通信。
ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys
从Apache Hadoop官网下载最新的稳定版本,并解压到每个节点的相同路径下。
wget https://downloads.apache.org/hadoop/core/hadoop-3.4.1/hadoop-3.4.1.tar.gz
tar -xzf hadoop-3.4.1.tar.gz
cd hadoop-3.4.1
修改每个节点上的~/.bashrc或~/.bash_profile文件,添加Hadoop的路径变量。
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source ~/.bashrc
在一个节点上创建Hadoop集群配置文件hadoop-env.sh,然后将此文件复制到其他节点。在配置文件中设置Hadoop的参数,如本地文件系统路径、HDFS路径、副本数等。
在配置文件core-site.xml中设置HDFS的相关参数,如通信端口、URI等。
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
</configuration>
如果你还想使用YARN作为Hadoop的资源管理器,需要在配置文件yarn-site.xml中设置YARN的相关参数。
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
在主节点上执行以下命令,启动Hadoop集群。
$HADOOP_HOME/sbin/start-dfs.sh
$HADOOP_HOME/sbin/start-yarn.sh
$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh start historyserver
在主节点上执行以下命令,验证Hadoop集群是否正常运行。
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar pi 4 10000