在EMR上部署storm on yarn的详细步骤

发布时间：2021-08-18 17:58:59 作者：chen
来源：亿速云阅读：165

在EMR上部署Storm on YARN的详细步骤

在Amazon EMR（Elastic MapReduce）上部署Storm on YARN可以帮助您在大数据环境中实现实时数据处理。以下是详细的部署步骤：

1. 创建EMR集群

首先，登录AWS管理控制台，进入EMR服务页面。点击“创建集群”按钮，选择适当的实例类型和数量。在“应用程序”部分，选择Hadoop和YARN作为核心组件。

2. 安装Storm

在EMR集群创建完成后，通过SSH连接到主节点。使用以下命令下载并安装Storm：

wget https://downloads.apache.org/storm/apache-storm-2.3.0/apache-storm-2.3.0.tar.gz
tar -xzf apache-storm-2.3.0.tar.gz
sudo mv apache-storm-2.3.0 /usr/local/storm

3. 配置Storm on YARN

编辑/usr/local/storm/conf/storm.yaml文件，添加以下配置：

storm.zookeeper.servers:
  - "zk1.example.com"
  - "zk2.example.com"
  - "zk3.example.com"

nimbus.seeds: ["nimbus1.example.com"]

storm.local.dir: "/mnt/storm"

storm.yarn.jar: "/usr/local/storm/lib/storm-yarn-2.3.0.jar"

4. 启动Storm on YARN

使用以下命令启动Storm on YARN：

/usr/local/storm/bin/storm-yarn launch /usr/local/storm/conf/storm.yaml

5. 验证部署

通过YARN的Web UI或命令行工具检查Storm应用程序是否成功启动。您还可以通过Storm UI监控拓扑的运行状态。

6. 提交拓扑

使用以下命令提交Storm拓扑：

/usr/local/storm/bin/storm jar your-topology.jar com.example.YourTopologyClass

通过以上步骤，您可以在EMR上成功部署Storm on YARN，并开始实时数据处理任务。