Bare Metal K8S集群在美国快餐连锁Chick-fil-A 的大规模使用


美国快餐连锁店Chick-fil-A在其2000多家餐厅的边缘计算中使用着Kubernetes,在规模上看,这意味着有大约6000台设备上同时运行着Kubernetes。其中与此相关的最大的一个挑战是:如何在餐厅的物理机上部署和管理这么多Kubernetes集群。本文由Chick-fil-A的技术团队所写,分享他们在Kubernetes集群管理技术选型、物理机上Kubernetes集群的安装和管理方面的经验。


大多数情况下,Kubernetes都在云中部署,或由熟练Kubernetes的技术人员在物理机上部署(再或者至少配有远程访问)。但对Chick-fil-A而言,我们的Kubernetes部署是由那些仅关注初始硬件安装的安装人员完成的。因为其自启动的特性,它们从不需要直接连接到计算设备——而是连接以太网和电源线,并通过查看应用程序app来检查集群的状态 。整个替换过程由对技术并不太专业的餐厅老板/运营者或他们的团队完成。

最大的挑战是,我们的边缘计算部署并不完全在“数据中心环境”中。

边缘计算硬件及经典的安装方式

集群管理:我们考虑过的选择


为了解决集群管理的挑战,我们做过全面的技术调研,曾考虑过如下几个选项:

  • Kubespray  - 我们最开始调查了基于Ansible的Kubespray,但我们发现它相当脆弱。当事情进展顺利时,我们能得到了一个集群;但当事情进展不太顺利时,我们就会创建一块难以变回计算机的“砖块”。我们还发现使用Kubespray启动集群的过程非常缓慢,通常在我们的硬件栈上花费的时间长达30分钟。我们相信Kubespray能有更长远的发展,但就我们的调研结果而言,我们认为得从别的方向探索别的解决方案。
  • Openshift  - Openshift可以创建Kubernetes集群,但我们不喜欢在至关重要的基础设施部分跟供应商的解决方案捆绑地太过紧密,不想承担未来可能被技术锁定的风险。
  • Kops  - 我们是Kops的忠实粉丝,我们用它来部署我们云的“控制面板”Kubernetes集群。不幸的是,当我们将其使用到我们的边缘计算中时,Kops并不是一个可行的裸机解决方案。我们期待看到它在未来的发展。
  • Kubeadm  - Kubeadm是另一个不错的Kubernetes集群实用程序。Kubeadm项目看起来很有发展前景,但我们认为它比一些替代品 (尤其在其灵活性上)复杂的多,包括...

RKE


就我们目前的选择而言,RKE是最终赢家。RKE是由Rancher Labs提供的开源的Kubernetes集群管理引擎。虽然我们暂时未使用Rancher 2.0来管理我们的集群,但我们确实喜欢使用RKE来初始化和维护集群的简单性。

要使用RKE,你需要确定一个领导节点并为其提供一个配置YAML文件,YAML文件中包含有关该集群的数据,主要是参与集群活动的节点的主机名。

如果集群中的节点发生添加、删除、或死亡,则配置文件需要拥有一个对当前和未来节点的准确描述。如果配置不能保持持续最新,集群就会失败。虽然我们认为缺少节点不应该使群集初始化/更新失败,但目前来看实际情况正是如此。


安装过程


我们在餐厅的安装过程非常简单——将设备拆箱,将其插入电源和标记的交换机端口,就是这样。它们会自动启动电源,并实现自引导和集群创建。RKE让非技术用户能够在不了解Kubernetes甚至整体架构的情况下,通过无比简单的过程执行安装和替换的工作,这一体验非常棒,不过它也确实需要一些更复杂的引导过程。

尚未被纳入集群的节点之间,需要彼此协调以确定谁将被纳入到集群中。他们还需要选出一个主节点来通过RKE执行集群创建。


Highlander


为了解决这个问题,我们开发了Highlander。因为我们只能有一个集群发起者。

Highlander是我们基础边缘镜像的一部分。当每个节点启动时,UDP会广播其存在并询问是否存在已建立的领导者。它也会开始倾听自己。几秒钟后没有回复,它将发送另一个广播,宣布自己成为领导者。有什么异议吗?如果没有反对的讯息,该节点将很快成为集群领导者,并以领导者身份回应未来接收到的所有请求。

如果另一个节点已经声明了自己领导者的角色,新节点将确认该声明。现有的领导者会执行“RKE up”将新节点纳管到现有的集群中。

节点们会定期沟通以确保领导者仍在其中。如果旧领导者已经死亡,一个新的领导者将通过一个使用随机睡眠和领导声明的简单协议来选举而出。虽然这很简单不复杂,容易推理和理解,但它能实现成规模地有效工作。

领导者选举完成后,Highlander还能确保集群被正确得配置。在我们的环境中,这包括:

?        将 KubeDNS切换成CoreDNS

?        创建Istio或其他核心控制面板节点

?        OAuth身份认证

注意:我们的每个节点都有自己的身份和短暂的JWT来访问已验证的资源。Highlander提供此身份,并以Kubernetes秘钥的形式来提供token令牌。


整合过程


尽管我们在本文中主要关注集群初始化,接下来我们也介绍一下在餐厅中实时进行节点初始化的整个流程。



(不可避免的)失败


最后我们想分享一些失败的经验。若基础设施出现故障,我们希望能够灵活应对。节点故障可能由多种原因导致:设备故障,网络交换机故障,电源线意外拔出。在所有这些情况下,我们必须快速诊断什么是导致故障的真正原因,而什么是无关的异常。这个过程很复杂,未来我们会带来另一篇文章来以此为主题展开分享。也就是说,当我们诊断失败时,我们的流程是向餐厅投放一个基本图片替代品(包含可视化安装说明),并让餐厅老板/运营者或他们的团队执行替换工作。

同时,我们的Kubernetes集群将继续在节点数量减少的情况下运行,并随时准备迎接更换节点。

原文地址:http://blog.51cto.com/12462495/2140773

时间: 2024-08-30 09:50:23

Bare Metal K8S集群在美国快餐连锁Chick-fil-A 的大规模使用的相关文章

再探使用kubeadm部署高可用的k8s集群-01引言

再探使用kubeadm部署高可用的k8s集群-01引言 2018/1/26 提示 仅供测试用途前言:高可用一直是重要的话题,需要持续研究.最近关注到 k8s 官网文档有更新,其中一篇部署高可用集群的文章思路不错,简洁给力,希望能分享给有需要的小伙伴一起研究下. 资源 k8s node master0, 10.222.0.100 master1, 10.222.0.101 master2, 10.222.0.102 LB, 10.222.0.88 master0, master1, master2

K8S集群tls证书管理

在前文介绍的k8s master高可用实践方案中,需要对kube-apiserver的证书进行更新,加入VIP和从节点的IP,然后重新下发证书.回顾K8S集群整个搭建过程中,最容易让人懵圈的也就是配置证书环节,因此本文对K8S集群所用到的证书进行梳理一下. 一.根证书 ca.pem 根证书公钥文件ca-key.pem 根证书私钥文件ca.csr 证书签名请求,用于交叉签名或重新签名ca-config.json 使用cfssl工具生成其他类型证书需要引用的配置文件ca.pem用于签发后续其他的证书

k8s集群之kubernetes-dashboard和kube-dns组件部署安装

说明 最好先部署kube-dns,有些组合服务直接主机用hostname解析,例如redis主从,heapster监控组件influxdb.grafana之间等. 参考文档 https://greatbsky.github.io/KubernetesDoc/kubernetes1.5.2/cn.html 安装集群文档见: http://jerrymin.blog.51cto.com/3002256/1898243 安装PODS文档见: http://jerrymin.blog.51cto.com

k8s集群之日志收集EFK架构

参考文档 http://tonybai.com/2017/03/03/implement-kubernetes-cluster-level-logging-with-fluentd-and-elasticsearch-stack/ https://github.com/kubernetes/kubernetes/tree/master/cluster/addons/fluentd-elasticsearch https://t.goodrain.com/t/k8s/242 http://logz

基于prometheus监控k8s集群

本文建立在你已经会安装prometheus服务的基础之上,如果你还不会安装,请参考:prometheus多维度监控容器 如果你还没有安装库k8s集群,情参考: 从零开始搭建基于calico的kubenetes 前言 kubernetes显然已成为各大公司亲睐的容器编排工具,各种私有云公有云平台基于它构建,那么,我们怎么监控集群中的所有容器呢?目前有三套方案: heapster+influxDB heapster为k8s而生,它从apiserver获取节点信息,每个节点kubelet内含了cAdv

使用kubeadm安装k8s集群故障处理三则

最近在作安装k8s集群,测试了几种方法,最终觉得用kubeadm应该最规范. 限于公司特别的网络情况,其安装比网上不能访问google的情况还要艰难. 慢慢积累经验吧. 今天遇到的三则故障记下来作参考. 当然,所有方法都是看了log输出后,从网上搜索的方法. =============== Q,如何让kubeadm在安装过程中不联网? A:记得在kubeadm init过程中增加参数 --kubernetes-version=v1.7.0 Q,kubelet cgroup driver参数不一致

使用kubeadm部署k8s集群08-配置LB指向kube-apiserver

使用kubeadm部署k8s集群08-配置LB指向kube-apiserver 2018/1/4 配置 LB 指向 kube-apiserver 小目标:在 3 个 master 节点前,还需配置一个 LB 来作为 apiserver 的入口 LB -> master x3 直接使用阿里云内网 SLB L4 proxy 资源(本次实例是 4 层而不使用 7 层的原因是:跳过了处理证书的环节) 申请下来资源后,将得到一个 vip 指向上述 3 个 master 节点的 IP 作为后端真实服务器 注

使用kubeadm部署k8s集群05-配置kubectl访问kube-apiserver

使用kubeadm部署k8s集群05-配置kubectl访问kube-apiserver 2018/1/4 配置 kubectl 访问 kube-apiserver 切换 master 节点连接到本节点的 apiserver 确认集群信息 切换 master 节点连接到本节点的 apiserver ### 为了在这 2 个新的节点执行 kubectl 需要配置 admin.yaml [[email protected] ~]# mkdir -p ~/k8s_install/master/admi

使用kubeadm部署k8s集群01-初始化

使用kubeadm部署k8s集群01-初始化 2018/1/3 节点配置 master x3 OS version: centos7 swapoff ### 阿里云默认:off hosts ### 每个节点上配置: [[email protected] ~]# cat /etc/hosts ### k8s master @envDev 10.10.9.67 tvm-00 10.10.9.68 tvm-01 10.10.9.69 tvm-02 Docker version: latest(17.0