您好,登录后才能下订单哦!
# Linux系统如何安装Flink
Apache Flink 是一个开源的流处理框架,广泛应用于大数据实时计算场景。本文将详细介绍在Linux系统中安装Flink的完整流程,涵盖环境准备、安装步骤和基础验证。
---
## 一、环境准备
### 1. 系统要求
- **操作系统**:Ubuntu 20.04/CentOS 7 或更高版本(本文以Ubuntu为例)
- **Java环境**:Flink 需要 Java 8/11(推荐 OpenJDK)
- **硬件配置**:至少 2GB 内存,10GB 磁盘空间
### 2. 安装依赖
```bash
# 更新系统软件包
sudo apt update && sudo apt upgrade -y
# 安装OpenJDK 11
sudo apt install openjdk-11-jdk -y
# 验证Java安装
java -version
从Flink官网下载稳定版(本文以1.17.1为例):
wget https://dlcdn.apache.org/flink/flink-1.17.1/flink-1.17.1-bin-scala_2.12.tgz
tar -xzf flink-1.17.1-bin-scala_2.12.tgz
mv flink-1.17.1 /opt/flink
编辑 ~/.bashrc
文件:
echo 'export FLINK_HOME=/opt/flink' >> ~/.bashrc
echo 'export PATH=$PATH:$FLINK_HOME/bin' >> ~/.bashrc
source ~/.bashrc
修改 conf/flink-conf.yaml
:
# 设置JobManager地址(单机模式可不修改)
jobmanager.rpc.address: localhost
# 调整内存分配(根据实际硬件调整)
taskmanager.memory.process.size: 1024m
# 启动单机集群
$FLINK_HOME/bin/start-cluster.sh
# 验证进程
jps
# 应显示 StandaloneSessionClusterEntrypoint 和 TaskManagerRunner
浏览器访问 http://<服务器IP>:8081
,可查看集群状态和任务监控。
# 运行WordCount示例
$FLINK_HOME/bin/flink run $FLINK_HOME/examples/batch/WordCount.jar
任务完成后,输出日志会显示计算结果路径(默认在 log
目录下)。
错误提示:UnsupportedClassVersionError
解决方案:确认Java版本符合要求,可通过 update-alternatives --config java
切换版本。
错误提示:Address already in use
解决方案:修改 conf/flink-conf.yaml
中的 rest.port
参数。
错误提示:OutOfMemoryError
解决方案:调整 conf/flink-conf.yaml
中的内存配置参数。
配置ZooKeeper以实现JobManager高可用:
high-availability: zookeeper
high-availability.zookeeper.quorum: zk1:2181,zk2:2181
若需访问HDFS,需下载对应版本的flink-shaded-hadoop
包并放入lib
目录。
通过上述步骤,您已完成Flink在Linux系统上的基础安装与验证。后续可进一步探索: - 使用Flink SQL进行流批一体处理 - 部署Kubernetes原生集群 - 集成Kafka等消息队列
如需更详细的配置指南,请参考官方文档。 “`
注:实际部署时请根据生产环境需求调整内存、网络等参数。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。