Spark在Linux上安装步骤是什么

发布时间：2025-04-02 04:36:07 作者：小樊
来源：亿速云阅读：147

在Linux系统上安装Apache Spark涉及几个步骤。以下是一个基本的指南：

确保你的Linux系统已经安装了以下软件：

你可以从Apache Spark的官方网站下载最新版本的Spark。例如，下载 Spark 3.3.2 版本：

wget https://downloads.apache.org/spark/spark-3.3.2/spark-3.3.2-bin-hadoop3.tgz

下载完成后，解压文件到指定目录，例如 /opt：

sudo tar -xzf spark-3.3.2-bin-hadoop3.tgz -C /opt

编辑 ~/.bashrc 或 ~/.zshrc 文件，添加以下内容：

export SPARK_HOME=/opt/spark-3.3.2-bin-hadoop3
export PATH=$SPARK_HOME/bin:$PATH

然后使配置生效：

source ~/.bashrc

运行以下命令来验证Spark是否安装成功：

spark-shell

如果一切正常，你应该会看到Spark的REPL (Read-Eval-Print Loop)界面。

进入Spark的安装目录，使用以下命令启动Spark集群（如果是伪分布式模式）：

cd /opt/spark-3.3.2-bin-hadoop3
./sbin/start-master.sh
./sbin/start-slaves.sh

通过浏览器访问Spark的Web管理界面：

http://<your-master-ip>:8099

这将显示Spark集群的当前概况。

在终端中输入以下命令启动 spark-shell：

./bin/spark-shell

如果出现Scala提示符，表示安装成功。

以上步骤应该能够帮助你在Linux系统上成功安装和运行Apache Spark。如果在安装过程中遇到任何问题，请检查环境变量配置是否正确，并确保所有依赖项都已正确安装。

相关阅读