mapreduce job提交流程源码级分析（三）

　　mapreduce
job提交流程源码级分析（二）（原创）这篇文章说到了jobSubmitClient.submitJob(jobId,
submitJobDir.toString(),
jobCopy.getCredentials())提交job，最终调用的是JobTracker.submitJob；而这篇文章JobTracker启动流程源码级分析则是分析的JobTracker的启动过程，JobTracker启动之后就会等待提交作业管理作业等。

　　接下来看看JobTracker.submitJob方法，调用这个方法之前已经将相关的资源分片信息、配置信息、外部文件、第三方jar包、一些归档文件以及job.jar上传到HDFS中了。

 1  public JobStatus submitJob(JobID jobId, String jobSubmitDir, Credentials ts)

 2       throws IOException {

 3     JobInfo jobInfo = null;

 4     UserGroupInformation ugi = UserGroupInformation.getCurrentUser();

 5     synchronized (this) {

 6       if (jobs.containsKey(jobId)) {

 7         // job already running, don‘t start twice

 8         return jobs.get(jobId).getStatus();

 9       }

10       jobInfo = new JobInfo(jobId, new Text(ugi.getShortUserName()),

11           new Path(jobSubmitDir));

12     }

13

14     // Create the JobInProgress, do not lock the JobTracker since

15     // we are about to copy job.xml from HDFS

16     //当JobTracker接收到新的job请求（即submitJob()函数被调用）后，

17     //会创建一个JobInProgress对象并通过它来管理和调度任务。

18     //JobInProgress在创建的时候会初始化一系列与任务有关的参数，调用到FileSystem，

19     //把在JobClient端上传的所有任务文件下载到本地的文件系统中的临时目录里。这其中包括上传的*.jar文件包、

20     //记录配置信息的xml、记录分割信息的文件。

21     JobInProgress job = null;

22     try {

23       job = new JobInProgress(this, this.conf, jobInfo, 0, ts);

24     } catch (Exception e) {

25       throw new IOException(e);

26     }

27

28     synchronized (this) {

29       // check if queue is RUNNING

30       String queue = job.getProfile().getQueueName();

31       if (!queueManager.isRunning(queue)) {

32         throw new IOException("Queue \"" + queue + "\" is not running");

33       }

34       try {

35         aclsManager.checkAccess(job, ugi, Operation.SUBMIT_JOB);

36       } catch (IOException ioe) {

37         LOG.warn("Access denied for user " + job.getJobConf().getUser()

38             + ". Ignoring job " + jobId, ioe);

39         job.fail();

40         throw ioe;

41       }

42

43       // Check the job if it cannot run in the cluster because of invalid memory

44       // requirements.

45       try {

46         checkMemoryRequirements(job);

47       } catch (IOException ioe) {

48         throw ioe;

49       }

50       boolean recovered = true; // TODO: Once the Job recovery code is there,

51       // (MAPREDUCE-873) we

52       // must pass the "recovered" flag accurately.

53       // This is handled in the trunk/0.22

54       if (!recovered) {

55         // Store the information in a file so that the job can be recovered

56         // later (if at all)

57         Path jobDir = getSystemDirectoryForJob(jobId);

58         FileSystem.mkdirs(fs, jobDir, new FsPermission(SYSTEM_DIR_PERMISSION));

59         FSDataOutputStream out = fs.create(getSystemFileForJob(jobId));

60         jobInfo.write(out);

61         out.close();

62       }

63

64       // Submit the job

65       JobStatus status;

66       try {

67         status = addJob(jobId, job);

68       } catch (IOException ioe) {

69         LOG.info("Job " + jobId + " submission failed!", ioe);

70         status = job.getStatus();

71         status.setFailureInfo(StringUtils.stringifyException(ioe));

72         failJob(job);

73         throw ioe;

74       }

75

76       return status;

77     }

78   }

　　一、首先看看jobs众有无要提交的Job，jobs是一个Map<JobID, JobInProgress>
这里存储着所有已知的Job及其对应的JobInProgress信息。如果已经存在这个Job则直接返回这个Job的状态；如果不存在则利用JobID和jobSubmitDir构造一个JobInfo对象，JobInfo类实现了Writable可以被序列化，而且存储三个字段JobID、user、以及上传资源的目录jobSubmitDir；

　　二、创建一个JobInProgress对象，JobInProgress类主要用于监控和跟踪作业运行状态，存在于作业的整个运行过程中，并未调度器提供最底层的调度接口，维护了两部分信息：一种是静态信息这些在作业提交之时就确定好了；另一种是动态的会随着作业的运行而动态变化的。job
= new JobInProgress(this, this.conf, jobInfo, 0,
ts)，这里会创建一个JobProfile一直跟踪作业的运行，不管作业作业活着还是死了；

　　三、checkMemoryRequirements(job)检查Job是否有无效的内存需求而不能运行，检查JobTracker的配置有无问题，再检查Job的内存配置有无问题；

　　四、是否存储作业信息以备恢复。在1.0.0版本中这还没实现(在这就是没存储信息)，要存的信息是一个JobInfo对象存储着作业的存储目录、ID以及user。

　　五、status = addJob(jobId,
job)这是核心的提交方法。会将此Job放入jobs中，jobs保存着JobTracker所有运行作业的对应关系<jobID，JobInProgress>；然后让所有的JobInProgressListener监听这个Job，根据JobTracker启动流程源码级分析
中可以知道这些JobInProgressListener实例都是通过调度器初始化(JobQueueTaskScheduler.start()方法)时，有俩线程一个是监控Job生命周期的，一个是对新加入的Job初始化的；然后加入监控统计中，返回job状态job.getStatus()。

　　这样Job的提交过程就完了，剩下的就是作业的调度分配及监控了。后续再讲吧

参考：

　　董西成，《Hadoop技术内幕：深入解析MapReduce架构设计与实现原理》

mapreduce job提交流程源码级分析（三）,布布扣,bubuko.com

时间： 2024-10-24 13:18:34

mapreduce job提交流程源码级分析（三）

mapreduce job提交流程源码级分析（三）的相关文章

JobTracker启动流程源码级分析

TaskTracker启动过程源码级分析

MapReduce job在JobTracker初始化源码级分析

监听器初始化Job、JobTracker相应TaskTracker心跳、调度器分配task源码级分析

MapReduce中TextInputFormat分片和读取分片数据源码级分析

TableInputFormat分片及分片数据读取源码级分析

嵌入式linux开发uboot移植（二）——uboot工程源码目录分析

Flume-NG(1.5版本)中SpillableMemoryChannel源码级分析

Flume-NG内置计数器(监控)源码级分析