应用量化时代 | 微服务架构的服务治理之路

技术随业务而生,业务载技术而行。

近些年来,伴随数字经济的发展,在众多企业的数字化转型之路上,云原生、DevOps、微服务、服务治理等成为行业内不断被探讨的新话题。人们在理解和接受这些新型概念的同时,也不断地思考其可能的落地形态。需求是创造发生的原动力,于是一批代表性的开源技术或者框架涌现而出:Kubernetes,Spring Cloud,Service Mesh,Serverless…… 它们炙手可热,大放异彩。然而在具体落地过程中却步履维艰,磕磕绊绊。

本文试图结合企业业务的核心诉求,以应用形态发展历程为背景,帮助企业梳理应用面向云原生、微服务转型中涉及的各种服务治理问题,以及服务治理的发展趋势。

什么是服务治理?

服务治理(SOA governance),按照Anne Thomas Manes的定义是:企业为了确保事情顺利完成而实施的过程,包括最佳实践、架构原则、治理规程、规律以及其他决定性的因素。服务治理指的是用来管理SOA的采用和实现的过程。

由定义可知,服务治理关键因素在于:应用形态、数据采集、信息分析、管控策略和协议规范五个方面。用户群体只有从这五个层次出发,才能构建出符合企业规范与要求的服务治理平台,从而进一步为企业创造商业价值。

01 “微观”塑形,服务一小再小

世界上唯一不变的是变化本身。----By 斯宾塞.约翰逊

万理同此,纵观应用形态发展历程,从单机到网络、从单体到服务化、到微服务、到Serverless,再到未来,应用的形态随着业务驱动和技术演化,一直在不断变化。随之而来的是业务需求的复杂化与多样化,企业IT面临着大规模、高并发、应用快速创新等新难题,弹性与敏捷成为企业IT的迫切需求。

在IT行业内有两个“不成熟”的理论:第一,每增加一行代码就会带来N种风险;第二,任何问题都可以采取增加一层抽象的方式解决。因此面对企业IT复杂的环境,“小而精”逐渐取代“大而全”,成为构建企业服务的首选方式,这也导致软件设计原则中的“高内聚,低耦合”又开始成为不断被高调吟诵的主角,微服务理念因此大行其道。

微服务架构为业务单元可独立开发和独立部署,使服务具备灵活的动态处理机能,同时依赖高度抽象化的组件工具和多元化的通信机制,向用户屏蔽所有服务之间的通信细节的这种思想提供了最佳落地实践。微服务的出现有效地缩短了服务上线周期,并且允许企业快速响应客户反馈,为客户提供所期望的可靠服务。

然而随着企业业务的发展与扩张与微服务的深入,服务数量向不可控的规模增长,服务数量的爆发式增长,为服务管理以及线上治理带来了极大的挑战。服务治理应运而生,成为构建微服务架构系统的必备“良药”。

02 “量化”管控,服务无可遁形

数字永远不会说谎。

如今,微服务已经成为软件架构的实际指导思想,而以Docker和Kubernetes为代表的容器技术的延伸,也有效解决了微服务架构下多个服务单元的编排部署问题。然而,微服务架构下也隐藏着容易被忽视的风险:面临规模巨大的服务单元,如何对其进行有效合理的管控与治理?

服务治理领域开始被行业与用户所重视,期望能够获得有效的思维方式和技术手段,应对由于不断激增的服务单元带来的服务治理挑战。关于服务治理,我们看到的更多的是其功能集合:服务注册发现、服务配置、服务熔断、网关、负载均衡、服务跟踪、日志采集、监控平台等。但当我们抛开这些名词解释,重新审视服务治理的时候,这些名词并没有完整的解释我们的困惑:如何设置负载均衡策略?采集日志格式是什么?服务配置如何生效?服务跟踪如何进行精确定位?

显然单单通过这些功能名词无法满足我们构建服务治理平台的需求,但从这些功能中我们总结出一些规律与方法,我们将从功能场景的横向切面和技术手段的纵深层次,进行如何构建一个有效的服务治理平台的分析探讨。

首先,我们从服务治理功能场景的横向切面来看,其可以抽象为四个层面:量化,追踪,管控,规范。

量化
量化包括服务数据采集、数据过滤和数据聚合三个层次。数据采集进一步细分为业务数据和性能数据,业务数据主要包括方法响应周期、服务内资源消耗规模、业务异常检测、方法调用次数、服务运行日志等;性能数据包括服务间响应时长、服务整体资源消耗等。

服务本身需要依赖不同的特性,构建不同的agent,来搜集服务运行时产生的数据。数据过滤针对采集的数据按照一定的格式规范进一步加工处理,例如基于kafka对原始的日志数据进行标准化处理后,导入日志系统。

数据聚合需要对独立的服务数据进行聚合操作,例如服务调用链呈现。

通过服务量化能够清晰的记录服务运行时产生的所有数据,为服务跟踪呈现和服务管控策略制定并提供强有力的数据支撑。

追踪
追踪能够有效量化服务调用链路上发生的事情,具体来讲,可以划分为:服务间的链路跟踪和服务内部的方法调用链路跟踪。追踪的本质,不仅仅是为了呈现服务链路及服务路由信息,更重要的是呈现服务间请求,以及服务内部请求的响应延迟,异常反馈,能够快速定位服务以及服务内在代码存在的问题。

管控
管控依赖于量化采集的聚合数据。管控允许运维人员聚焦某个服务单元的运行时状态,为服务设定一定的控制策略,从而保证服务稳定可靠的运行。例如熔断策略,负载策略,流量控制,权限控制等。

规范
规范更多针对服务通信而言,例如通信协议规范,无论针对哪种协议,例如http,tcp,rpc等都能够提供相应的检测手段。与此同时,规范也能够清晰定义服务名称和管控策略,使得服务在不同环境之间进行迁移的时候,依旧平稳可靠。

综上所述,在服务单元遵循一定规范标准的前提下,基于服务单元数据量化、服务调用跟踪以及服务策略管控的方式,才能构建出符合要求的服务治理平台。

接下来,我们从纵深的角度考虑构建服务治理平台过程中涉及的技术理论基础。服务治理之所以困难,原因在于构建业务系统采用的技术栈成多元化的方式存在。从目前行业内采用的技术而言可以划分为三大学派:代码集成、agent探针、流量劫持。

代码集成
代码集成往往需要业务开发人员的支持,在业务系统中嵌入数据采集代码,用来采集服务运行时服务产生的各种业务指标及性能指标,并将数据传输到云端治理平台。平台依据数据信息,通过配置动态下发,从而影响业务响应动态,完成服务治理功能。

优点:治理深入,端到端监控
缺点:维护繁琐,语言版本众多,影响业务性能

Agent探针
Agent探针是对代码集成的进一步提炼。Agent探针将需要集成的监控代码,高度提取、抽象、封装成可以独立集成的SDK,并且以“弱旁路”的方式与代码集成在一起,从而完成数据采集工作。云端治理平台,同样以采集的数据信息作为治理策略制定的依据,下发各种治理策略,从而达到服务治理功能。

优点:治理深入,端到端监控
缺点:语言版本众多,影响业务性能

流量劫持
流量劫持与前两者相比,与代码集成不同。它从网络通信作为切入点,以proxy的方式,代理业务单元所有的IN/OUT流量,并且proxy内部可以对请求数据进行一定的策略控制。从而完成服务通信的治理功能。

优点:无关语言差异性,维护简单
缺点:治理略浅,影响业务性能

综上所述,目前服务治理的技术栈或多或少都存在一些缺陷,在构建服务治理平台时往往需要采用结合的方式,才能做到物尽其才。

03 “百家争鸣”,成就未来

竞争成就未来。

从目前行业发展来看,微服务奠定了服务构建的基础方式,容器引擎以及编排技术解决了服务编排上线的困惑,下一个“兵家必争”的场景必将在服务治理。那目前行业内又有哪些项目聚焦在服务治理领域?

SpringCloud

SpringCloud作为Spring社区的重要布局之一,在微服务落地伊始就逐渐发力,当下已经成为Java体系下微服务框架的代名词,SpringCloud 以 Netfilx 全家桶作为初始化基础,为开发人员提供业务单元服务支撑框架的同时,也开发出一系列的服务治理SDK,供开发人员选用。在微服务发展背景下,SpringCloud可谓如日中天。

Dubbo

Dubbo原为阿里巴巴开源的 rpc 远程调用框架,初始设计初衷在于解决以 rpc 协议为标准的远程服务调用问题,随着阿里巴巴重启Dubbo,其也开始在服务治理领域发力,成为很多以rpc协议作为通信基础系统平台的首选。粗略而言,Dubbo和SpringCloud已成为Java体系下的服务治理“双枪”。

gRPC

gRPC与Dubbo类似,最初是由Google开源的一款远程服务调用框架。gRPC凭借HTTP/2和 RrotoBuf 服务定义方式以及多语言支持的特性,加之其易于定制与开发,能够方面开发人员进行快速扩展和灵活发挥,从而也成为众多用户的选择之一。


Service Mesh

Service Mesh的出现不在于它实现了多少功能,而是它彻底把业务单元与业务支撑体系分离,完整贯彻了“术业有专攻”的思想理念。它允许业务人员聚焦业务实现,不再关心服务治理相关的内容。通过与容器技术结合,下沉至基础设施,从通信协议的角度彻底接管业务通信交互过程,可谓微服务治理领域的后起之秀。

总而言之,服务治理的本质是针对业务与应用产生价值的收敛与反馈,只有不断地反馈和复盘才能构建出稳定、高效的应用形态。

原文地址:https://blog.51cto.com/11976981/2411146

时间: 2024-08-10 14:28:15

应用量化时代 | 微服务架构的服务治理之路的相关文章

微服务架构与服务治理

Spring Cloud是一个基于Spring Boot实现的云应用开发工具,它为基于JVM的云应用开发中涉及的配置管理.服务发现.断路器.智能路由.微代理.控制总线.全局锁.决策竞选.分布式会话和集群状态管理等操作提供了一种简单的开发方式. Spring Cloud包含了多个子项目(针对分布式系统中涉及的多个不同开源产品),比如:Spring Cloud Config.Spring Cloud Netflix.Spring Cloud0 CloudFoundry.Spring Cloud AW

Spring Cloud构建微服务架构-Hystrix服务降级

在微服务架构中,我们将系统拆分成了一个个的服务单元,各单元应用间通过服务注册与订阅的方式互相依赖.由于每个单元都在不同的进程中运行,依赖通过远程调用的方式执行,这样就有可能因为网络原因或是依赖服务自身问题出现调用故障或延迟,而这些问题会直接导致调用方的对外服务也出现延迟,若此时调用方的请求不断增加,最后就会出现因等待出现故障的依赖方响应而形成任务积压,线程资源无法释放,最终导致自身服务的瘫痪,进一步甚至出现故障的蔓延最终导致整个系统的瘫痪.如果这样的架构存在如此严重的隐患,那么相较传统架构就更加

浅谈微服务架构与服务治理的Eureka和Dubbo

前言 本来计划周五+周末三天自驾游,谁知人算不如天算,周六恰逢台风来袭,湖州附近的景点全部关停,不得已只能周五玩完之后,于周六踩着台风的边缘逃回上海.周末过得如此艰难,这次就聊点务虚的话题,一是浅谈微服务的架构设计,二是聊聊微服务中广泛用于服务治理的Eureka与RPC框架Dubbo异同点. 一.微服务的架构设计 之所以想聊一下这个话题,主要有感于最近接触的两个新的微服务项目--两个项目的架构设计出自两个人之手,却不约而同的使用了相同的设计理念,项目结构非常类似.又想到就职于上家公司时接触到的项

Spring Cloud构建微服务架构-创建“服务提供方”

下面我们创建提供服务的客户端,并向服务注册中心注册自己.本文我们主要介绍服务的注册与发现,所以我们不妨在服务提供方中尝试着提供一个接口来获取当前所有的服务信息. 首先,创建一个基本的Spring Boot应用.命名为eureka-client,在pom.xml中,加入如下配置: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 <parent> <groupId>org.spr

Spring Cloud构建微服务架构:服务消费(基础)

使用LoadBalancerClient 在Spring Cloud Commons中提供了大量的与服务治理相关的抽象接口,包括DiscoveryClient.这里我们即将介绍的LoadBalancerClient等.对于这些接口的定义我们在上一篇介绍服务注册与发现时已经说过,Spring Cloud做这一层抽象,很好的解耦了服务治理体系,使得我们可以轻易的替换不同的服务治理设施. 从LoadBalancerClient接口的命名中,我们就知道这是一个负载均衡客户端的抽象定义,下面我们就看看如何

Spring Cloud构建微服务架构 分布式服务跟踪(跟踪原理)【Dalston版】

通过上一篇<分布式服务跟踪(入门)>的例子,我们已经通过Spring Cloud Sleuth往微服务应用中添加了实现分布式跟踪具备的基本要素.下面通过本文来详细说说实现分布式服务跟踪的一些要点. 分布式系统中的服务跟踪在理论上并不复杂,它主要包括下面两个关键点: 为了实现请求跟踪,当请求发送到分布式系统的入口端点时,只需要服务跟踪框架为该请求创建一个唯一的跟踪标识,同时在分布式系统内部流转的时候,框架始终保持传递该唯一标识,直到返回给请求方为止,这个唯一标识就是前文中提到的Trace ID.

Spring Cloud构建微服务架构—创建“服务注册中心”

创建一个基础的Spring Boot工程,命名为eureka-server,并在pom.xml中引入需要的依赖内容: <parent> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-parent</artifactId> <version>1.5.4.RELEASE</version> <relativePath

Spring Cloud构建微服务架构:服务容错保护(Hystrix服务降级)

动手试一试 在开始使用Spring Cloud Hystrix实现断路器之前,我们先拿之前实现的一些内容作为基础,其中包括: eureka-server工程:服务注册中心,端口:1001 eureka-client工程:服务提供者,两个实例启动端口分别为2001 下面我们可以复制一下之前实现的一个服务消费者:eureka-consumer-ribbon,命名为eureka-consumer-ribbon-hystrix.下面我们开始对其进行改在: 第一步:pom.xml的dependencies

Spring Cloud构建微服务架构 分布式服务跟踪(抽样收集)【Dalston版】

通过Trace ID和Span ID已经实现了对分布式系统中的请求跟踪,而这些记录的跟踪信息最终会被分析系统收集起来,并用来实现对分布式系统的监控和分析功能,比如:预警延迟过长的请求链路.查询请求链路的调用明细等.此时,我们在对接分析系统时就会碰到一个问题:分析系统在收集跟踪信息的时候,需要收集多少量的跟踪信息才合适呢? 理论上来说,我们收集的跟踪信息越多就可以更好的反映出系统的实际运行情况,并给出更精准的预警和分析,但是在高并发的分布式系统运行时,大量的请求调用会产生海量的跟踪日志信息,如果我