在Ubuntu上设置Kafka数据存储主要涉及配置Kafka的日志目录和日志保留策略,以确保数据能够被持久化存储。以下是一个基本的步骤指南:
sudo apt-get update
sudo apt-get install openjdk-8-jdk
java -version
wget https://downloads.apache.org/zookeeper/zookeeper-3.7.0/apache-zookeeper-3.7.0-bin.tar.gz
tar -xzf apache-zookeeper-3.7.0-bin.tar.gz
sudo mv apache-zookeeper-3.7.0 /opt/zookeeper
编辑 /opt/zookeeper/conf/zoo.cfg 文件,设置数据目录和客户端连接端口:
dataDir=/opt/zookeeper/data
clientPort=2181
/opt/zookeeper/bin/zkServer.sh start
wget https://downloads.apache.org/kafka/2.8.0/kafka_2.13-2.8.0.tgz
tar -xzf kafka_2.13-2.8.0.tgz
sudo mv kafka_2.13-2.8.0 /opt/kafka
编辑 /opt/kafka/config/server.properties 文件,设置日志目录、日志保留策略等:
log.dirs=/tmp/kafka-logs
log.retention.hours=168
num.partitions=3
replication.factor=2
zookeeper.connect=localhost:2181
/opt/zookeeper/bin/kafka-server-start.sh /opt/kafka/config/zookeeper.properties
/opt/kafka/bin/kafka-server-start.sh /opt/kafka/config/server.properties
创建一个Topic来验证Kafka是否正常工作:
/opt/kafka/bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 2 --partitions 3 --topic test
/tmp/kafka-logs 存在并且有写权限。以上步骤是在Ubuntu系统中配置Apache Kafka的基本流程,具体配置可能会因不同的需求和版本而有所差异,需要根据实际情况进行调整。