摘要:
AT&T的Domain 2.0 (D2)计划聚焦于运用云技术(AT&T 集成云,the AT&T Integrated Cloud – AIC)和网络虚拟化技术来提供服务,以降低基本建设与运营费用,显著提升运营的自动化能力。ECOMP软件平台在D2环境下为承载级实时负载提供独立于产品/服务的设计、创建和生命周期管理能力。在实现AT&T D2的主要目标方面,ECOMP具有关键作用。ECOMP通过快速地部署新业务(由AT&T或第三方创建)、创建云消费者业务和企业级业务的新型生态系统、降低基本建设与运营费用、提升运营效率,增强我们的网络为客户提供的价值。
ECOMP通过AT&T业务设计与创建(ASDC)的可视化建模与设计(visual modeling and design)来提升网络的敏捷性和弹性,改进上市时间/收入/规模。在架构的每层,ECOMP采用元数据驱动的重复设计模式,为安全性、性能、可靠性和弹性提供了策略驱动的运营管理框架。在需要的时间或在需要的地点,闭环自动化方法提供动态的容量管理能力和一致的失效管理能力,从而降低了基本建设费用。ECOMP的运营管理框架和应用组件为业务/网络/云部署提供实时的自动化能力和生命周期管理能力,从而有助于提升运营效率。
ECOMP通过组合多个动态的、策略使能的功能来实现组件和负载的整形、安置(placement)、执行和管理,从而可高效地利用网络资源。这些功能使用了AT&T集成云,并内置于AT&T ECOMP平台。当这些功能组合在一起时,可以为运行于生态系统之内的负载提供一种独具特色的运营与管理能力,并且当互操作标准提高后,可以将其中的大部分能力扩展到第三方的云生态系统中去。
ECOMP的核心能力是为多样化的负载提供服务。其业务设计与创建能力、策略菜单等消除了大量的传统OSS需要执行的手工和长耗时操作。对于外部应用(OSS/BSS、客户方app、第三方集成),ECOMP平台通过AT&T网关和安全的RESTful API提供对ECOMP服务、事件和数据的访问控制。在不久的将来, AT&T D2孵化与认证环境(AT&T D2 Incubation & Certification Environment , ICE)可提供ECOMP,从而供应商、云提供商和其他第三方可以在ECOMP平台和AT&T集成云的参考架构(现在和将来的)下通过ECOMP API开发各自的解决方案。
1、ECOMP平台
ECOMP采用两种主要架构框架提供这些能力:
(1)设计时框架:用于平台的设计、定义和编程(统一的部署)
(2)运行时执行框架:用于执行设计时框架编制的逻辑(统一的交付和生命周期管理)。
设计时框架组件是一个集成开发环境,具有相应的工具、技术和存储库来定义/描述AT&T资产。设计时框架有利于模型重用。当可重用模型越来越多时,进一步提升了效率。资产包括D2资源、业务和产品的模型。模型包含不同的流程规范与策略(如规则集),可控制执行行为和流程。ECOMP使用流程规范来实现基于D2的资源、业务、产品和ECOMP组件的实例化、交付、生命周期管理方面的自动序列化执行。设计时框架支持新能力的开发、现有能力的增强和业务全生命周期的运营改进。运营、安全、第三方和其他方专家可采用ECOMP 设计框架门户,运用 ASDC、策略、以及DCAE(数据收集、分析和事件)的SDK,来不断地定义/完善新的收集、分析和策略(包括纠正/矫正动作菜单)。在D2联邦云环境中,特定的流程规范(或叫做菜单,recipes))和策略分布于不同的地理位置,以优化性能和最大化行为的自治。图1展示了ECOMP平台组件的高层视图。这些组件采用微服务来担当其角色。平台提供了必要的公共功能(如数据采集、控制环、元数据菜单创建、策略/菜单分发等)来构建特定的行为。为了创建业务或运营能力,必须采用ECOMP设计框架门户来开发业务/运营相关的采集、分析和策略(包括纠正/矫正措施菜单)。
图 1 ECOMP平台组件
设计时框架的两个主要组件是AT&T业务设计与创建 (AT&T Service Design and Creation,ASDC)组件和策略创建(Policy Creation)组件。ASDC是一个集成开发环境,具有用于定义/仿真/认证D2资产和其他相关流程和策略的工具、技术和存储库。资产分为四个类型:资源、业务、产品和提供物(Resource, Services, Products, or Offers)。策略创建组件负责处理策略相关的工作。策略包括必须提供的、维护的和实施的条件、需求、约束、属性或要求(conditions, requirements, constraints, attributes, or needs)。在更低的层次,策略包含机器可读的规则,从而实现基于触发器或请求的动作。策略通常会考虑特定的、已发生的条件(在条件满足时触发特定的策略,或者选择适合于指定条件的、被评估策略的特定结果)。策略可通过规则的快速更新得到快速更新,因此不需要重新编写软件代码,就可对策略正在使用组件的技术行为进行更新。策略通过抽象简化了复杂的管理和控制机制。
设计和创建环境通过公共服务和应用支持大量多样化的用户。通过设计工作台(design studio),产品和业务(Product and Service)设计人员可加载/扩展/卸载(onboard/extend/retire)资源、业务和产品。运营、工程师、客户体验经理、安全专家可以创建工作流、策略和方法来实现闭环自动化,并提供灵活的扩展性。
运行时执行框架执行由设计和创建环境分发的规则和策略。运行时执行框架支持在不同的ECOMP模块之间分发策略实施和模板,如主业务编排(Master Service Orchestrator,MSO)、控制器、DCAE(数据收集、分析和事件,Data Collection, Analytics and Events)、A&AI(活动与可用清单)和安全框架(Security Framework)。这些组件可方便地使用公共服务,如日志、访问控制和数据管理等。
编排是由流程规范定义的功能。它由编排器组件执行,自动化地按序列执行相关活动、任务、规则和策略,实现对网络、应用、基础设施业务与资源等的按需创建、修改和移除。MSO在更高层次提供编排,具有关于基础设施、网络、应用范围的端到端视图。控制器是与云和网络业务关系密切的应用,它执行配置和实时策略,控制分布式组件和业务的状态。AT&T没有采用统一的控制层,而是选择采用三种不同类型的控制器,在与其被分配的控制域相适应的执行环境中执行,实现资源管理。例如:云技术资源(基础设施控制器,通常位于云层)、网络配置(网络控制器)和应用(应用控制器)。
DCAE和其他ECOMP组件提供FCAPS(故障、配置、计帐、性能和安全)功能特性。DCAE支持为商业与运营活动提供闭环控制和高层纠正,是生态系统中支持分析和事件的组件:它收集性能、使用和配置相关的数据,提供分析计算;辅助排错;发布事件、数据和分析(例如,向策略、编排和数据湖)。
活动与可用清单(Active and Available Inventory,A&AI)是ECOMP中提供D2资源、业务、产品及其关系的实时视图的组件。A&AI将管理ECOMP平台、业务支撑系统(Business Support System)、运营支撑系统(Operation Support System)和网络应用等的数据关联起来,形成一个自顶向下的视图,涵盖了从产品客户购买(Products customers buy)到创建产品所需原材料的资源等范围。活动与可用清单不仅形成了一个产品、业务和资源的存储库,更维护了一个这些清单项之间关系的最新视图。为保证D2的动态性,A&AI实时管理这些多维的关系。
D2环境下,当活动与可用清单(A&AI)发生变化时,控制器实时更新A&AI。A&AI是元数据驱动的,通过ASDC目录定义功能,可动态、快速地添加新的清单项类型,因此,不再需要长的开发周期。
ECOMP平台的OA&M(Operations, Administration & Management)实例提供实时仪表盘、控制器和维护工具,对全部ECOMP组件进行监督与管理。并可允许设计工作台加载ECOMP组件、创建菜单,并允许策略框架定义ECOMP的自动化。
ECOMP基于用户角色提供一致的用户体验,允许在单一生态系统中配置D2角色的变更。用户体验通过ECOMP门户进行管理。ECOMP门户采用基于公共角色的菜单或仪表盘功能,提供了对设计、分析和运营控制/维护功能的访问。门户架构提供基于WEB的能力,包括应用加载和管理、中心化的访问控制、仪表盘和基于主机的应用widget。门户提供SDK来驱动不同的开发团队充分利用内置的能力(Services/ API/ UI controls)、工具和技术,从而遵从一致的UI开发要求。
ECOMP为所有的ECOMP组件提供公共的操作服务,包括活动日志、报告、公共数据层、访问控制、弹性和软件生命周期管理。这些服务提供了接入管理、安全实施、数据备份复原和恢复能力。他们支持标准化的VNF接口和指南。
D2虚拟操作环境带来了新的安全机遇和挑战。ECOMP平台在每个组件中嵌入了访问控制,因此具有更好的安全;而特别为检测和减少安全违规的分析与策略组件提供了进一步的安全增强。
ECOMP为增强的控制、编排、管理与策略,为设计、创建和生命周期管理提供独立于产品/业务的能力。ECOMP必须满足多种需求以支持D2/ECOMP的愿景,有以下要求:
- 架构是元数据驱动的
- 策略驱动,保证在使用能力时和交付能力时具备灵活性
- 架构支持采购一流的组件
- 公共能力应一次开发、多次使用
- 核心能力应支持众多的AT&T业务
- 架构应支持按需缩放的弹性扩展
2、ECOMP中的策略
2.1 策略创建
ECOMP策略平台在支持基础设施、产品/业务、运营自动化、安全相关的策略规则等方面大有用武之地。这些策略规则由不同的干系人(stakeholders)(网络/业务设计人员、运营人员、安全人员和客户等)定义。另外,应收集来自不同数据源的输入,并对这些数据进行合理解释。因此,采用了一个中心化的策略创建环境,在需要时,可验证策略规则、辨识和解决交叉与冲突、推导策略等。作为公共资产, 创建环境可以被广泛地访问、开发和管理。创建环境为用户提供编辑工具,用户可轻松地创建或变更策略规则。通过对性能/故障/闭环操作的数据进行离线分析,可以辨别出相关机会:发现新的识别标志(signatures)、完善现有识别标志和闭环操作。ECOMP策略平台还具有策略翻译/推导功能特性,可从高层策略推导出低层策略。平台采用了冲突检测和消除技术,在策略分发前检测并完善可能导致潜在冲突的策略。策略经过验证后,如果不存在冲突,将保存在合适的存储库中。
2.2 策略分发
在完成了策略的初始创建或完成了现有策略的修改后,在策略需要使用前,策略分发框架(Policy Distribution Framework)将策略(如,从存储库)发送到其使用点。策略分发是智能的和精确的,因此,每个被分发到的、策略使能的功能只需要自动地接收满足其要求和范围的特定策略。
策略分发框架通过通知或事件将策略的连接/URL(links/URLs)发送给需要策略的组件,因此,在需要使用策略时,组件可以通过这些连接获取特定的策略或策略组。某些情况下,组件也可以发布事件以表明它们需要新的策略;另外在需要最新的连接/URL时,组件也可以发布事件以请求一个响应。另外一些情况下,策略也可以发送给组件,以表明它们应该订阅一个或多个策略,这样,当策略被更新后,它们可以自动地接收到最新的策略。
2.3 策略决策和实施
运行时策略决策和实施功能是一个分布式系统,大多数情况下可用于不同的ECOMP模块(也存在一些例外)。例如,DCAE数据采集功能负责实施用于数据采集及采集频率的策略规则。DCAE分析应用负责实施分析策略规则、识别异常条件、激活异常条件检测事件的发布。控制环(MSO, Controller, DCAE等)中合适的执行者/参与者负责实施相关的策略规则,以执行补救或其他动作(如进一步的诊断)。
通常情况下,策略决策/实施(Policy Decision/Enforcement)功能通过策略分发(Policy Distribution)功能提前接收策略。如前面章节所述,某些情况下,需要向特定的实时策略引擎查询策略/指南。另外,策略决策/实施功能具有统一的机制、方法和属性,帮助管理复杂性,并保证策略不会成为孤岛并导致效率降低。属性值(Attribute values)可在创建时定义。策略范围属性(Policy Scope attributes)是属性值的一个例子,将在后面的章节(“策略联合与组织”)中讨论。需要注意的是,策略对象和属性需要包含在正确的治理流程中,已保证在商业上能获得所期望的正确结果。
策略相关的API(Policy related APIs)提供如下能力:1.从组件中根据需要获得(读取)策略,2.将一个或多个策略设置到(写入)组件,例如,立即推送/更新,3.向与策略范围匹配的多个组件分发一组策略,供这些组件立即使用(强制的)或将来使用(根据需要,例如,由时间确定的)。
下图的左侧展示了策略创建(Policy Creation),下部展示了策略存储库和分发(Repository & Distribution),右侧展示了策略(Policy)(如,在控制环中,或在VNF中)。如图9所示,策略创建与ASDC关系密切。在和产品&业务(Products & Services)完全集成后,策略既可以连同产品&业务一起创建(对于与它们相关的策略范围),也可对正交于这些产品&服务的策略范围(例如,与特定的产品&业务无关)单独创建。正交策略可包含各种用于运营、安全和基础设施优化的策略。
图2 D2策略架构框架
需要注意的是,图示的架构是一个逻辑架构,可采用不同的方法实现。某些功能可以在独立的虚拟化网元中或在其它(非策略)功能内,部分或完整地实现。
2.4 策略联合与组织
策略框架是可扩展的、多用途的,可使用不同类型的策略。为了加速D2.0中框架的工作(the workings of the Framework within D2.0),策略可以采用各种便捷的维度来组织。术语“策略范围”(Policy Scope)是一种灵活的组织原则,采用一组属性来详细描述(所期望的程度/精度、使用所期望维度的组合)策略及策略使能的功能/组件的精确“范围”。对于策略范围,有价值的组织维度(dimensions)包括:
- 策略类型或分类
- 策略拥有者/管理域
- 地理区域或位置
- 技术类型与/或规范
- 策略语言、版本等
- 安全级别或其他与安全相关的值/分类符/限制器
- 特殊定义的分组
- 其它认为有帮助的维度/属性,如运营(Operations)需要的。
注意:每个维度都可以定义属性。
利用为这些属性设定的值,策略范围(Policy Scope)可用于详细描述精确的策略范围:(A)策略事件或请求/触发器,确保每个事件/请求可以自标示(self-indicate)其范围,例如,为满足路由/交付的要求细节,相关功能应检查哪些内容,(B)策略决策/实施功能或其它功能,确保每个策略功能能自标示其决策的、实施的或其它能力的范围,(C)自动附加到相关策略框架和分发机制实例的各种虚拟功能,最重要的是(D)单独的辅助策略管理和分发的策略。
2.5 策略技术
D2策略采用而不是替换各种技术,下表展示了策略技术方面的有关样例。通过翻译能力,使用这些技术可获得尽可能最佳的方案,可充分利用这些有帮助的技术的优势,并保证在单个D2.0策略“大脑”内仍然有效。
图3 策略技术有关样例
2.6 策略使用
在运行时,策略提前分发给策略使能的组件。这些组件利用分发给的策略执行相应的动作,控制或影响其功能或行为。
DCAE驱动的反馈/控制环模式是这种方法的一个很好的例子。可以定义多个特定的控制环。在特定的控制环内,每个参与者将接收策略,以确定该参与者如何作为控制环的一部分执行相关动作。该控制的所有策略将一起提前创建,以保证执行的闭环动作是正确的、协调一致的。DCAE可为数据采集(如采集什么数据,怎么采集,采集频率)、数据分析(如分析的类型和深度)、识别特征和事件发送(如寻找什么样的分析结果、为检测到这些结果需要发布什么样的事件)接收特定的策略。其余的控制环组件(例如编排器、控制器等)可接收特定的策略,以确定当接收到来自DCAE的特定事件时采取何种动作。环中每个参与者还可以接收特定的策略,以确定其订阅的相关事件。