Kubernetes1.1源代码分析（二） / 憋错料

3、controller-manager模块

在controller manager模块中有几个重要的结构体，其中包括EndpointController、ReplicationManager、GCController、NodeController、ServiceController、RouteController、ResourceQuotaController，下面会进行介绍。在controller manager模块还有几个处于试验阶段的功能和结构体，这里不会进行介绍。

3.1、EndpointController

EndpointController是个入口控制器结构体，表示一组包含服务的Pods副本。里面有POD入口控制器podController变量和Service入口控制器serviceController变量，里面还有POD存储变量podStore和Service存储变量serviceStore，EndpointController结构体中还有queue变量和client变量。

type EndpointController struct {
    client *client.Client
    serviceStore cache.StoreToServiceLister
    podStore     cache.StoreToPodLister
    queue *workqueue.Type
    serviceController *framework.Controller
    podController     *framework.Controller
}

POD存储变量podStore和Service存储变量serviceStore都使用到了Store接口，Store接口其实就是一个通用的KEY/VALUE键值存储接口，这个接口用来实现对对象的操作，包括增加对象、更新对象、删除对象、列出所有KEY、列出所有对象、通过KEY查询对象等操作。KEY/VALUE键值存储接口的具体实现使用到了threadSafeMap结构体：

type threadSafeMap struct {
    lock  sync.RWMutex
    items map[string]interface{}
    indexers Indexers
    indices Indices
}

从中可以看出变量items其实就是GO语言的map类型，通过map来实现KEY到VALUE的映射。在threadSafeMap结构体中有个变量lock，这是一个读写互斥锁，通过这个锁来保证对map的操作是线程安全的，也就是多个线程同时操作map时不会产生不确定的结果。

POD存储变量podStore和Service存储变量serviceStore都是用来作为EndpointController端的缓存使用。

EndpointController结构体中queue变量是一个Type结构体：

type Type struct {
    queue []t
    dirty set
    processing set
    cond *sync.Cond
    shuttingDown bool
}

Type结构体就是一个工作队列，这个工作队列处理上有下面几个特点：

提供先进先出的处理模式
相同的内容放入这个工作队列多次后，这个工作队列只能处理一次
当一个内容被处理后，这个内容可以重新被放入队列中
队列关闭通知

EndpointController结构体中client变量是一个Client结构体：

type Client struct {
    *RESTClient
    *ExtensionsClient
    *DiscoveryClient
}

通过这个Client结构体来实现EndpointController结构体中serviceController和podController与kubernetes api-server的通讯。

POD入口控制器podController变量和Service入口控制器serviceController变量都使用到了Controller结构体:

type Controller struct {
    config         Config
    reflector      *cache.Reflector
    reflectorMutex sync.RWMutex
}

Controller结构体是一个通用的控制器结构体，这个结构体中有config、reflector和reflectorMutex三个变量。config变量是一个Config结构体，Config结构体的作用是负责控制器结构体所有的设置工作。Reflector变量是一个Reflector结构体，这个结构体是一个反射器结构体，负责监控指定的资源，并且通过反射机制对指定存储中的任何改变做出相应。ReflectorMutex这个变量同前面介绍过的threadSafeMap结构体中lock变量都使用到了RWMutex结构体，用来做读写互斥锁使用。

上面介绍了EndpointController这个结构体，下面介绍kuberneters controller manager如何使用这个结构体的。

首先controller manager创建Endpoint控制器，并且按照EndpointController结构体对Endpoint控制器中的serviceStore、podStore、queue、serviceController和podController几个变量进行初始化。

然后将serviceController和podController作为GO程序进行启动，也就是通过关键字“go”来运行，Go语言对并发编程的支持是天生的、自然的和高效的。Go语言为此专门创造出了一个关键字“go”。使用这个关键字，我们就可以很容易的使一个函数被并发的执行。

启动后，serviceController和podController两个控制器开始各自工作，这两个控制器都使用client变量同api-server进行通讯，将从api-server获取到的service和pod信息存放到本地serviceStore和podStore两个变量中缓存，之后都是通过对本地缓存进行处理，这两个控制器定期对缓存进行更新，以减少同api-server之间的通讯。这两个控制器都将需要处理的内容放入变量queue的队列中，getPodServiceMemberships函数会根据pod信息找到对应的service信息，这样就保证了变量queue的队列中只有service信息。

接着Endpoint控制器启动了几个worker程序，这些worker程序的作用在于处理queue队列中的service内容，在处理完之后标识service内容为已处理。Endpoint控制器默认启动5个worker来处理，当然可以启动更多的worker来加快queue队列中内容的处理速度，但是这样的话也会增加更多的CPU负载和网络负载。

每一个worker程序都从变量queue队列中取出一个service内容进行处理，最后同api-server进行通讯，对不存在的service创建endpoints，对已经存在的service更新endpoints。

3.2、ReplicationManager

下面介绍controller manager模块中ReplicationManager结构体，这是个副本控制器结构体，用来对kuberneters上已经运行的POD进行控制对象同步的，实际上这个副本控制器应该命名为ReplicationController，之所以没有这样命名，是为了同API对象“ReplicationController”进行区分。

type ReplicationManager struct {
    kubeClient client.Interface
    podControl controller.PodControlInterface
    burstReplicas int
    syncHandler func(rcKey string) error
    expectations controller.ControllerExpectationsInterface
    rcStore cache.StoreToReplicationControllerLister
    rcController *framework.Controller
    podStore cache.StoreToPodLister
    podController *framework.Controller
    podStoreSynced func() bool
    queue *workqueue.Type
}

ReplicationManager结构体中变量kubeClient是一个GO语言接口，用来同api-server通讯，变量podControl是一个GO语言接口，用来创建和删除POD。在ReplicationManager结构体中很多变量类型在上面EndpointController结构体中都已经介绍过，这里不在重复介绍，这里直接介绍kuberneters controller manager如何使用ReplicationManager这个结构体的。

首先controller manager创建ReplicationManager控制器，并且按照ReplicationManager结构体对ReplicationManager控制器中的几个变量进行初始化。

然后将rcController和podController作为GO程序进行启动，启动后，rcController和podController两个控制器开始各自工作，这两个控制器都使用client变量同api-server进行通讯，将从api-server获取到的replicationcontroller和pod信息存放到本地rcStore和podStore两个变量中缓存，之后都是通过对本地缓存进行处理，这两个控制器定期对缓存进行更新，以减少同api-server之间的通讯。这两个控制器都将需要处理的内容放入变量queue的队列中，由worker进行处理。

ReplicationManager控制器启动了几个worker程序，这些worker程序的作用在于处理queue队列中的replicationcontroller内容，在处理完之后标识replicationcontroller内容为已处理。ReplicationManager控制器默认启动5个worker来处理，每一个worker程序都从变量queue队列中取出一个replicationcontroller内容进行处理，最终会比较replicationcontroller中配置的POD副本数和系统中POD实际运行个数，如果这两个数值相同，那么不进行处理，如果replicationcontroller中配置的POD副本数大于系统中POD实际运行个数，那么会创建POD，如果replicationcontroller中配置的POD副本数小于系统中POD实际运行个数，那么会删除POD，删除的过程中会按照系统中POD运行状态进行排序，先删除比较早期状态的POD，比如如果同时not-ready状态和ready状态，那么会先删除not-ready状态的POD，如果unscheduled状态和scheduled状态，那么会先删除unscheduled状态的POD，如果pending状态和running状态，那么会先删除pending状态的POD。

创建POD或者删除POD都是向api-server发送POST请求，请求的过程作为GO程序进行启动，也就是通过关键字“go”来运行，前面已经介绍过了GO程序，每次启动一个GO程序，相当于一次并发执行，可以看出来如果并发数太多，会影响api-server以及整个kubernetes自身性能，所以基于kubernetes性能需求上的考虑，对于POD的创建或者删除，每次一批最多处理500个操作，也就是说kubernetes控制住了replicationcontroller操作POD副本的并发数。

3.3、GCController

在controller manager模块中还有个结构体叫做GCController：

type GCController struct {
    kubeClient     client.Interface
    podStore       cache.StoreToPodLister
    podStoreSyncer *framework.Controller
    deletePod      func(namespace, name string) error
    threshold      int
}

这个结构体负责对POD进行回收处理，当终止状态的POD数量超过了kubernetes设定的上限值，那么通过GCController结构体对POD进行回收处理，回收过程通过删除POD来完成，直到终止状态的POD数量在kubernetes设定的上限值以内，删除POD时，会先删除最早创建的POD,kubernetes设定的上限值默认是12500。

这个结构体的使用方式比较简单，通过对前面EndpointController结构体和ReplicationManager结构体的介绍，可以很容易的了解kubernetes如何使用GCController这个结构体的，这里就不详细进行介绍了。

到此为止，我们介绍了controll manager中三个结构体的使用，这三个结构体分别是EndpointController、ReplicationManager和GCController，controll manager都是通过GO程序来使用这三个结构体的，也就是通过关键字“go”来运行。

3.4、NodeController

下面介绍controller manager模块中NodeController结构体，这个结构体负责对Node进行监控。

type NodeController struct {
    allocateNodeCIDRs       bool
    cloud                   cloudprovider.Interface
    clusterCIDR             *net.IPNet
    deletingPodsRateLimiter util.RateLimiter
    knownNodeSet            sets.String
    kubeClient              client.Interface
    lookupIP func(host string) ([]net.IP, error)
    nodeStatusMap map[string]nodeStatusData
    now           func() unversioned.Time
    evictorLock *sync.Mutex
    podEvictor         *RateLimitedTimedQueue
    terminationEvictor *RateLimitedTimedQueue
    podEvictionTimeout time.Duration
    maximumGracePeriod time.Duration
    recorder           record.EventRecorder
    podController *framework.Controller
    podStore      cache.StoreToPodLister
    nodeController *framework.Controller
    nodeStore      cache.StoreToNodeLister
    forcefullyDeletePod func(*api.Pod)
}

这个结构体中变量knownNodeSet是一个字符串集合类型，在GO语言语法中是没有set类型的，所以kubernetes自己实现了一个set类型。变量podEvictor是一个NODE删除队列，用来存放已经不存在的NODE信息，目的是为了删除这些NODE上的POD信息。

controller manager创建NodeController控制器，接着NodeController控制器将结构体中nodeController和podController作为GO程序进行启动，然后使用GO程序启动三个处理逻辑，第一个处理逻辑是监控NODE状态，第二个处理逻辑是删除指定NODE上面所有的POD，第三个处理逻辑是删除指定NODE上所有终止状态的POD。

我们着重看看这三个处理逻辑。先看监控NODE状态这个处理逻辑。这个处理逻辑首先从api-server查询出来所有NODE信息，在变量knownNodeSet中进行查找，变量knownNodeSet用来存放在Kubernetes上已经注册的所有NODE名称，如果不在已经注册的NODE集合中，那么说明是新注册的NODE，插入到已经注册的集合中；然后查找是否存在已经被删除的NODE信息，如果存在，那么从已经注册的NODE集合中删除，并且将NODE名称放入NODE删除队列中。如果kubernetes是在云提供商的资源上部署的，那么这里还可以用云提供商的资源自动给NODE分配IP和掩码。

再看删除指定NODE上面所有的POD的处理逻辑。这个处理逻辑根据NODE删除队列中的NODE信息依次处理，将每个NODE上面所有的POD都删除掉，对于已经处于终止状态的POD不进行处理。

最后看删除指定NODE上所有终止状态的POD的处理逻辑。这个处理逻辑实际上是第二个删除逻辑的补充，它同第二个处理逻辑的区别在于，这个逻辑只处理NODE上面处于终止状态的POD，并且这些POD在冷却期时间内一直处于终止状态。

3.5、ServiceController

下面介绍controller manager模块中ServiceController结构体，这个结构体负责对用到云提供商负载均衡资源的service进行同步操作。

type ServiceController struct {
    cloud            cloudprovider.Interface
    kubeClient       client.Interface
    clusterName      string
    balancer         cloudprovider.TCPLoadBalancer
    zone             cloudprovider.Zone
    cache            *serviceCache
    eventBroadcaster record.EventBroadcaster
    eventRecorder    record.EventRecorder
    nodeLister       cache.StoreToNodeLister
}

controller manager创建ServiceController控制器，然后监控用到云提供商负载均衡资源的service变化，用来确保这些外部负载均衡被正确的创建和删除。Kubernetes可以对接多种云提供商，包括AWS、GCE、OpenStack、Mesos、rackspace，为了方便测试，kubernetes还提供了仿真云提供商。

3.6、RouteController

controller manager模块中还有一个RouteController结构体，这个结构体负责对云提供商路由规则进行同步操作，并不是所有的云提供商都支持这个功能，如果使用x86逻辑部署kubernetes，其实根本都用不到云提供商，在这里就不详细分析这个结构体的使用了。

3.7、ResourceQuotaController

controller manager模块中还有一个ResourceQuotaController结构体，这个结构体负责跟踪kubernetes中的配额使用状况。

type ResourceQuotaController struct {
    kubeClient client.Interface
    syncTime   <-chan time.Time
    syncHandler func(quota api.ResourceQuota) error
}

在kubernetes中允许对以下资源设置配额：POD数、Service数、ReplicationController数、ResourceQuota数、Secret数、persistent volume数、容器使用的总CPU大小、容器使用的总内存大小。

controller manager创建ResourceQuotaController后，就启动了一个GO程序，负责同步kuberneters中上述资源使用状况。同步过程首先查询上述资源使用状况，当发现现在资源使用情况同上一次资源使用情况不一致的时候，通过与api-server通讯，更新资源使用状况。

时间： 2024-10-27 18:44:37

Kubernetes1.1源代码分析（二）

3、controller-manager模块

3.1、EndpointController

3.2、ReplicationManager

3.3、GCController

3.4、NodeController

3.5、ServiceController

3.6、RouteController

3.7、ResourceQuotaController

Kubernetes1.1源代码分析（二）的相关文章

【原创】Kakfa utils源代码分析(二)

【原创】kafka server源代码分析(二)

【原创】Kafka console consumer源代码分析(二)

[Android]Fragment源代码分析(二) 状态

【原创】kafka controller源代码分析(二)

Android 中View的绘制机制源代码分析三

Spark SQL之External DataSource外部数据源（二）源代码分析

HBase源代码分析之MemStore的flush发起时机、推断条件等详情（二）

"别踩白块儿"游戏源代码分析和下载(二)