hadoop的使用方法

发布时间：2021-07-27 15:52:23 作者：chen
来源：亿速云阅读：252

这篇文章主要讲解了“hadoop的使用方法”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“hadoop的使用方法”吧！

Hadoop使用主/从（Master/Slave）架构，主要角色有NameNode，DataNode，secondary NameNode，JobTracker，TaskTracker组成。

其中NameNode，secondary NameNode，JobTracker运行在Master节点上，DataNode和TaskTracker运行在Slave节点上。

1，NameNode

NameNode是HDFS的守护程序，负责记录文件是如何分割成数据块的，以及这些数据块被存储到哪些数据节点上。它的功能是对内存及I/O进行集中管理。

2，DataNode

集群中每个从服务器都运行一个DataNode后台程序，后台程序负责把HDFS数据块读写到本地文件系统。需要读写数据时，由NameNode告诉客户端去哪个DataNode进行具体的读写操作。

3，Secondary NameNode

Secondary NameNode是一个用来监控HDFS状态的辅助后台程序，如果NameNode发生问题，可以使用Secondary NameNode作为备用的NameNode。

4，JobTracker

JobTracker后台程序用来连接应用程序与Hadoop，用户应用提交到集群后，由JobTracker决定哪个文件处理哪个task执行，一旦某个task失败，JobTracker会自动开启这个task。

5，TaskTracker

TaskTracker负责存储数据的DataNode相结合，位于从节点，负责各自的task。

1.Cygwin下用Open SSH启动SSH服务

2.运行命令

cd ./bin
./hadoop namenode -format
./start-all.sh
#启动成功后测试
./hadoop fs -mkdir In
./hadoop dfs -ls /

感谢各位的阅读，以上就是“hadoop的使用方法”的内容了，经过本文的学习后，相信大家对hadoop的使用方法这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是亿速云，小编将为大家推送更多相关知识点的文章，欢迎关注！

相关阅读