您好,登录后才能下订单哦!
密码登录
登录注册
点击 登录注册 即表示同意《亿速云用户服务条款》
# Spark 2.0集群环境的安装步骤
## 一、环境准备
### 1. 硬件要求
- 至少3台服务器(1个Master节点,2个Worker节点)
- 每台机器建议配置:
- CPU: 4核以上
- 内存: 8GB以上
- 磁盘: 50GB以上可用空间
### 2. 软件要求
- 操作系统: Linux(推荐CentOS 7/Ubuntu 16.04+)
- Java: JDK 1.8+
- Scala: 2.11.x(与Spark 2.0兼容版本)
- Hadoop: 2.7+(可选,如需HDFS支持)
## 二、基础环境配置
### 1. 安装JDK
```bash
# 所有节点执行
sudo yum install java-1.8.0-openjdk-devel # CentOS
# 或
sudo apt-get install openjdk-8-jdk # Ubuntu
# 验证安装
java -version
# 在Master节点执行
ssh-keygen -t rsa
ssh-copy-id worker1
ssh-copy-id worker2
# 所有节点修改/etc/hosts
192.168.1.100 master
192.168.1.101 worker1
192.168.1.102 worker2
wget https://archive.apache.org/dist/spark/spark-2.0.0/spark-2.0.0-bin-hadoop2.7.tgz
tar -zxvf spark-2.0.0-bin-hadoop2.7.tgz
mv spark-2.0.0-bin-hadoop2.7 /opt/spark
# 所有节点修改~/.bashrc
export SPARK_HOME=/opt/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
source ~/.bashrc
cd /opt/spark/conf
cp spark-env.sh.template spark-env.sh
cp slaves.template slaves
编辑spark-env.sh
:
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export SPARK_MASTER_HOST=master
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=2
export SPARK_WORKER_MEMORY=4g
编辑slaves
文件:
worker1
worker2
# 在Master节点执行
$SPARK_HOME/sbin/start-master.sh
# 在Master节点执行
$SPARK_HOME/sbin/start-slaves.sh
访问Web UI:http://master:8080
应看到2个Worker节点注册成功
spark-shell --master spark://master:7077
val data = Array(1, 2, 3, 4, 5)
val distData = sc.parallelize(data)
distData.reduce(_ + _)
spark-submit --master spark://master:7077 \
--class org.apache.spark.examples.SparkPi \
$SPARK_HOME/examples/jars/spark-examples_2.11-2.0.0.jar 10
Worker节点无法连接Master
sudo systemctl stop firewalld # CentOS
sudo ufw disable # Ubuntu
ping master
内存不足错误
spark-env.sh
中的SPARK_WORKER_MEMORY
值export SPARK_DAEMON_MEMORY=2g
端口冲突
export SPARK_MASTER_WEBUI_PORT=8081
命令 | 说明 |
---|---|
start-master.sh |
启动Master节点 |
start-slaves.sh |
启动所有Worker节点 |
stop-master.sh |
停止Master节点 |
stop-slaves.sh |
停止所有Worker节点 |
spark-daemon.sh |
启停单个守护进程 |
注意:本文档基于Spark 2.0.0版本编写,其他版本可能需要调整配置参数。生产环境建议使用最新稳定版。 “`
该文档包含约1000字,采用Markdown格式编写,包含代码块、表格、列表等元素,适合作为技术文档使用。实际部署时请根据具体环境调整参数。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。