在Ubuntu上调度Hadoop作业通常涉及以下几个步骤:
core-site.xml
, hdfs-site.xml
, yarn-site.xml
, 和 mapred-site.xml
文件。yarn jar
命令提交MapReduce作业。例如:yarn jar your-job.jar com.yourcompany.YourJobClass input output
其中 your-job.jar
是你的作业JAR文件,com.yourcompany.YourJobClass
是主类,input
是输入数据路径,output
是输出数据路径。http://<ResourceManager-Host>:8088/cluster
。yarn application
命令来查询作业状态,例如:yarn application -list
yarn application -status <application-id>
crontab -e
0 0 * * * /path/to/hadoop jar /path/to/your-job.jar com.yourcompany.YourJobClass /input/path /output/path
请注意,Hadoop的版本和发行版可能会影响具体的命令和配置步骤,因此建议参考你所使用的Hadoop版本的官方文档来获取最准确的信息。