阿里妹导读:2018天猫双11物流订单量创新高,突破10亿件,这是一次史无前例的物流洪峰。天猫双11十年来,见证了物流业从手写地址、人工分拣,到电子面单、机器人分拣。无论是物流园区、干线运输,还是秒级通关、末端配送,都通过技术高效连接,智能物流骨干网正在加快实现行业数字化、智能化升级。
因此,阿里技术推出《菜鸟智慧新物流》专题,邀请菜鸟技术人,为你揭秘物流核心技术。今天第二期,我们将了解到“仓储体系的大脑”:智能波次,全面了解它在过去一年时间里算法友好型的系统架构建设和演进过程。
一. 前言
仓储管理体系从粗放向精细化经营、柔性自动化管理转变是大的趋势,2018年双11国内物流订单首次突破10亿,对整个物流行业都是巨大的挑战,菜鸟的AGV小车、PTL、立体存储等自动化设备发挥了强大的作用。在智能化方面,菜鸟仓储技术团队同样在进行多维度的探索,覆盖从接单、分拣、交接等关键链路,并取得显著效果。
在仓储系统中,波次汇总是将系统单据(信息流)转化为可作业单据(实物流)的关键节点,传统方式有诸多缺点,本文主要介绍了菜鸟仓储系统的智能化波次在过去一年时间里算法友好型的系统架构建设和演进过程,以期为其他业务平台的智能化提供借鉴,进而构建覆盖整个仓储领域的智能化系统架构。
二. 背景介绍
什么是波次汇总?
交易订单承载着物流契约信息,仓储系统根据货品的属性将订单切分成可作业的包裹单元。波次汇总是以包裹为单位,按照一定的策略(波次策略)进行筛选,并将不同包裹按照策略内指定的规则聚合成拣选单,来指导拣货。在这个过程中,波次汇总的准确性、平衡性、可控性、高效性都尤为重要。
面临的挑战
1. 技术挑战:
波次汇总(菜鸟内部称之为中枢平台,寓意就像大脑一样是整个仓储体系的大脑,调度仓库的作业节奏)是大数据计算密集型的系统,对数据量、效率、数据一致性、计算资源等因素极为敏感。系统上需要重点解决的是在分布式架构下的最优化生产计算问题。
2. 实操挑战:
在智能波次诞生前,波次汇总主要有两种方式——波次查询汇总和波次导航汇总,它们都是人为的根据一定的条件查询包裹并应用波次策略来生成拣选单,查询设置都是制单员根据仓库现场进行决策。
在实操方面,问题主要集中在以下几点:
- 汇单生成优质拣选单的要求极高
要考虑订单时效性、实操的拣选效率、现场劳动力等因素,控制汇波节奏;
汇单人员能力良莠不齐、无法掌控全局数据,一旦产生路径依赖,很难再去思考如何优化波次策略;
- 拣选单生成后未进入作业的积压,拣选无法精细化
每次汇总单量大,打印的拣选单长时间未进入生成,造成拣选单积压;而这部分订单hold单后可以提高优化空间,提升秒杀率;
已经确认的拣选单无法回滚和拦截,只能到质检时拦截,拣选作业浪费;
综合来看人工波次汇总的方式无法达到最优,要做到满足时效前提下提供柔性服务,这种关键节点必须交由系统来决策。
三. 构建算法友好型的智能化波次架构历程
智能波次由来
2017年双11结束后复盘,我们着手解决人工决策来进行波次汇总情况下出现的问题,思考用智能化系统手段来提升——由系统根据全局的数据来判断何时汇单、用什么条件汇单、汇哪些单,以便更柔性的控制生产节奏。
优化思路聚焦如下三点:
- 不是思考如何设置最优的波次策略参数,而是从拣选单的角度出发,现场有多少的作业能力,就从“所有的”包裹里选出“最好的”进行聚合组单;
- 在对包裹进行聚合组单,充分考虑仓内巷道、库位的布局,将拣选距离、SKU动碰次数作为优化目标,进而提高人效;
- 控制波次汇总节奏,对仓库现场和仓内数据进行详细的采集,交由人工智能的算法决策是否波次,再由业务系统来进行执行。
详细的系统流程可以用下图来理解:
在前期的可行性验证中,我们选取一个单量适中的仓库作为样本,对该仓单日出库包裹进行仿真汇总,和当日实际的人工汇总结果进行对照。下图是几个对照组的结果:系统生产方式与第一列的实际作业情况进行对比,拣选单数量明显下降,单包裹平均库位数的下降趋势也很明显。经过核算间接人效提升达到两位数的百分比:
为了和传统的人工决策方式进行区分,我们称之为智能化波次,下图是一个形象化的展示:
我要着重强调的是,很多同学在比较智能波次和人工波次时往往把注意力集中在各种feature上(比如包材的优化、比如容量的劳动力控制、比如动态的组单参数、比如自适应的参数配置等等),但更重要的是理念上的转变:人工波次的着眼点是包裹——关注的是如何根据规则来组合包裹、生成拣选单,进而来优化规则;智能波次的着眼点是拣选单——需要拣选单来进行生产,然后是怎么根据现场的状态来挑选包裹生成最好的拣选单。
方向上的差别不可小觑,智能波次是真正尝试实现仓内“按需生产”(JIT,Just In Time——只在需要的时候,按需要的量,生产所需的产品),让仓库拣选作业从对包裹的需求转变成拣选单的需求,向精益管理、柔性服务迈出第一步。正如曾鸣教授《智能商业》一书中提到的,我们要从“数据提供支持”向“数据智能进行决策”进化。
样本仓库试点
在几个月的时间内,全国范围的样本仓开始使用智能波次来进行波次汇总,期间完整经历了几次大促的考验。
对于样本仓库,我们进一步明确了主要指标并进行效果跟进:
- 拣选单数:count(pickBill),日均拣选单数表达所有包裹出库需要拣选作业的人次;该指标与单量正相关;在相同包裹量下,越低越好;
- 单个包裹平均拣选时长:sum(pickBill.time)/sum(packageCount),拣选每个包裹需要的时间;该指标与单量负相关;在相同包裹量下,越低越好;
- 包裹平均库区/巷道/库位数:sum(pickBill.position)/packageCount,拣选每个包裹需要走过的库区/巷道/库位数;该指标与单量正相关;该指标越低越好;
智能波次上线后几个主要指标呈现下降趋势,与此同时仓库所需的拣选人员数也同时减少,切实降低了成本。下图是“单个包裹平均拣选时长”指标的变化趋势:
架构探索期
从完整的可行性仿真到样本仓库落地,是智能波次的架构探索期。当时菜鸟内部业务系统和算法的系统设计和交互比较简单,L1级别的交互图如下表示:
在这样的方式下,算法蜕化为业务系统的依赖,业务系统像普通的二方包/HSF服务一样来进行调用,那这是否是算法友好型的设计呢?简单做下比较:
构建算法友好型的业务系统
在试点仓库进行智能波次可行性的验证后,我们开始考虑如何升级当前的系统,进一步构建算法友好型的业务系统,以应对双11海量的订单。
阿里巴巴从电商、金融、仓储物流、云计算等领域有不少智能化应用的场景,在调研预演阶段,我们对广告、搜索、推荐等集团内业务平台和算法协同的典型场景进行分析对比,看看我们这样的生产型业务平台怎么做智能化,通过下列的对比,可以看到菜鸟仓储系统是既有着与互联网级别的高并发,又有企业级复杂特性、金融级安全稳定的特点,所以在系统形态上既有共性,又具备独特的要求。最终我们演化出了基于TPP(阿里个性化平台)的实现仓内智能化架构方式:
与之前相比,新系统架构和特点还是比较明显的:
- 数据资源层+计算容器层+业务层三层;数据层来解耦业务系统和算法技术;
- 基于集团的算法个性化平台TPP做计算+灵动做存储的架构来进行设计,blink来进行订单预处理;算法场景配置化,降低开发工作量;
- 稳定性设施齐全,算法方案的变更、分桶更加灵活高效,快速打造多个行业的方案;
- OnLine运算+NearLine预测+OffLine分析,为智能算法提供更完备的输入,具备一定的预测机制;
- 一套行之有效的业务平台+智能化算法协同的架构模式,具备可复制性;
上线后系统表现:在业务数据量级提升2倍的情况下RT降低5倍以上;代码行数缩减到之前的1/3;应用数降低2/3,机器数缩减6台。另外在这套架构之上,可以进行仓储智能化系统的进一步构建和完善,比如丰富的劳动力数据、实时的作业状态、自动化设备的运行态的获取和使用。
仓库的部署速度也越来越快,双11期间智能波次覆盖了华东、华中、华南、西南、西北等全国范围的猫超仓库,帮助仓库降本提效,充分验证系统的可靠性。
新架构下的开发协同方式
在TPP平台上进行方案的开发,一般来说是算法同学来进行的,但由于波次计算的复杂性,里面不可避免的掺杂了业务规则(如某些场景下对库存的筛选,很难通过数据来进行解耦),如果TPP代码中掺杂算法计算和业务逻辑,日后绝对难以维护。我们创新性的基于TPP的插件机制来进行业务和算法模块的解耦。具体来说,算法和业务的代码封装成插件,方案的代码蜕化成简单的胶水代码,用方案对插件的调用来隔离两方的内部逻辑。
在这样的方式下,我们采用“总-分-分-总”的方式进行项目开发,后期各领域内独立迭代。
快速的系统功能支持能力
在未进行架构升级之前,我们经常面临算法的快速迭代能力和业务系统稳健要求的矛盾。基于TPP的新架构下我们要充分利用平台能力,以参数预估模块为例说一下我们的快速支持方式。
在前期的智能波次中,由于上游的交易订单是源源不断流入的,临近出库时间等部分场景下需要用户来进行少量的参数配置,校准系统行为。为进一步降低人为干涉,我们提供预估模块来进行系统参数自动判断,在不违反时效约束的前提下做到所有拣选单的总fitness最优。
在新架构下,算法和工程同学在前期仿真完成后,很短时间内开始开发、分桶测试,充分体现了新架构下功能特性快速上线的能力。从下图上看,系统效果和实际运行的曲线拟合度很高。
双11大考表现
每一个新架构上线后都要面临双11大促的考验,对此我们确立智能波次业务的专项保障,从前期的影子链路改造、底层存储优化、网络请求合并、异步查询优化到后期的全链路压测,整体保障准确有力,面对老板们提出智能波次实现千万级别订单的自动化智能化汇单的目标大家都很有信心。
经过充分准备我们在双11交出答卷——整个大促期间仓库自动化汇单,而且各个仓库拣选时效均有不同程度的提升,体现了菜鸟数据化、智能化的决策能力。下图是各个大区随机选取共计9个仓的效果跟踪(形象化展示,恕不披露详细数据)
四. 出库智能化
从去年12月份到今天经历双11大促,我们在中枢智能化迈出的这一小步,已经激起了片片涟漪。未来我们还有更长的路要走,4PL仓库怎么去支持?自动化场景下怎么更好的协同?订单的波次和补货怎么线上化?波次如何更具有计划性?如何实现产品化、平台化的跨越?
技术驱动的社会化物流协同,是菜鸟技术人坚持的方向。延伸到仓储智能化方面,多环节协同、应对复杂场景的不确定性、时效性与可预测性、国际化,这些问题都还未有答案,需要我们更多的思考和落地,半年甚至一年后再来看现在,希望能有更大的突破。
原文链接
本文为云栖社区原创内容,未经允许不得转载。
原文地址:https://www.cnblogs.com/yunqishequ/p/10063437.html