Hadoop框架的运行模式主要有两种:本地模式和分布式模式。
本地模式(Local Mode):在本地模式下,Hadoop框架运行在单个节点上,所有的输入数据和中间结果都存储在本地磁盘。本地模式主要用于开发和调试,可以快速验证程序的正确性。
分布式模式(Distributed Mode):在分布式模式下,Hadoop框架运行在多个节点上,每个节点负责处理一部分数据。输入数据会被切分成多个块,然后分发到不同的节点上进行处理。每个节点之间通过网络进行通信和数据交换。分布式模式可以处理大规模的数据集,提供高可靠性和高性能的计算能力。
在分布式模式下,Hadoop框架还可以采用不同的部署方式,包括伪分布式模式(Pseudo-Distributed Mode)和完全分布式模式(Fully-Distributed Mode)。伪分布式模式是在单个节点上模拟多个节点的运行环境,适用于开发和测试。完全分布式模式是在多个真实的节点上运行,适用于生产环境中处理大规模数据集。