如何部署Spark集群

发布时间：2021-07-29 16:57:21 作者：Leah
来源：亿速云阅读：175

今天就跟大家聊聊有关如何部署Spark集群，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

1. 安装环境简介

硬件环境：两台四核cpu、4G内存、500G硬盘的虚拟机。

软件环境：64位Ubuntu12.04 LTS；主机名分别为spark1、spark2，IP地址分别为1**.1*.**.***/***。JDK版本为1.7。集群上已经成功部署了Hadoop2.2，详细的部署过程可以参见另一篇文档Yarn的安装与部署。

2. 安装Scala2.9.3

1）在/home/test/spark目录下面运行wget http://www.scala-lang.org/downloads/distrib/files/scala-2.9.3.tgz命令，下载scala的二进制包。

2）解压下载后的文件，配置环境变量：编辑/etc/profile文件，添加如下内容：

export SCALA_HOME=/home/test/spark/scala/scala-2.9.3 export PATH=$SCALA_HOME/bin

3）运行source /etc/profile使环境变量的修改立即生效。在spark2上执行相同的操作，安装scala。

3. 下载编译好的spark文件，地址为：http://d3kbcqa49mib13.cloudfront.net/spark-0.8.1-incubating-bin-hadoop2.tgz。下载后解压。

4.配置conf/spark-env.sh环境变量，添加如下内容：

export SCALA_HOME=/home/test/spark/scala/scala-2.9.3

5. 在/etc/profile中配置SPARK_EXAMPLES_JAR以及spark的环境变量：添加如下内容：

export SPRAK_EXAMPLES_JAR=/home/test/spark/spark-0.8.1-incubating-bin-hadoop2/examples/target/scala-2.9.3/spark-examples_2.9.3-assembly-0.8.1-incubating.jar export SPARK_HOME=/home/test/spark/spark-0.8.1-incubating-bin-hadoop2 export PATH=$SPARK_HOME/bin

6. 修改/conf/slaves文件，在文件中添加如下内容：