Agent是Ambari一个核心模块,主要负责在集群节点上执行命令(install/start/stop)和上报状态(liveness/progress/alert)。
要理解实现细节甚至修改源代码,首先要有总体宏观的认识。笔者粗略浏览了一下Agent代码,认为可以从三大基本抽象入手,来描绘总体的概览。
抽象
Agent定义了三个基本抽象,也是三个抽象类:
Resource表示Agent可操作的对象,每个Resource都定义成Python Class,可以在以下源码包看到各个实现类:
ambari-common/src/main/python/resource_management/core/resources/
Provider封装了对Resource的各种操作,每个Resource都对应一个Provider,可以在以下源码包看到各个实现类:
ambari-common/src/main/python/resource_management/core/providers
Script表示Agent将调用的一个脚本,该脚本用于install/start/stop某个服务组件,也就是说每个服务组件都需要提供一个Script实现类,可以在各个服务的脚本包里看到它们:
ambari-server/src/main/resources/stacks/HDP/${version}/services/${service}/package/scripts
举例: File是一个Resource,FileProvider封装了action_create和action_delete方法(即Agent可以在系统上创建或删除某文件)。NameNode是一个Script,封装了HDFS NameNode的安装/启动/停止等操作。
整合
下面来看看Resource-Provider-Script哥三是怎么整合到一起来实现Agent功能的。我们以HDFS NameNode的安装操作为例:
- 在HDFS服务的脚本包下有一个namenode.py文件,它定义了class NameNode,是Script的实现类,override了install/start/stop等方法。
- Agent收到Server的安装NameNode命令后,将调用NameNode.install()。
- NameNode.install()之后的调用链如下:
NameNode.install() ->
Script.install_packages() ->
Package(packageName) ->
Resource.__init__() ->
Environment.run_action() ->
PackageProvider.action_install()
NameNode对应Script,Package对应Resource,PackageProvider对应Provider。