揭秘丨7分钟看懂华为云鲲鹏Redis背后的自研技术【华为云技术分享】

2019年5月,华为云发布全球首个基于自研ARM架构的分布式缓存鲲鹏Redis,搭载华为LibOS+华为编译器+安全容器引擎三项黑科技,在保证Redis强劲高性能外,还降低客户30%的使用成本,真正实现了好用不贵的普惠型分布式缓存Redis产品。

本文从技术视角解读华为云鲲鹏Redis是如何通过数据中心基础设施、芯片、硬件、软件等全栈创新优化,达成以上效果。

一、为什么ARM架构适合Redis

众所周知,Redis是一款风靡全球的高性能、高灵活性、数据结构类型丰富的key-value内存数据库,拥有毫秒级的响应时延。因此Redis对服务器内存、网络带宽时延要求极高,即:Redis的高性能能否发挥出来取决于服务器内存、网络性能。

2019年3月, Redis之父Salvatore Sanfilippo(网名:antirez)就Redis ARM架构发展趋势发表观点,他表示把ARM作为Redis运行架构,并且通过了所有测试与验证、性能稳定性非常好,Antirez列举了很多测试数据,得到了广大网友的支持。

由于Redis在设计上就采用单线程架构,所有IO和数据处理都是在同一个线程中完成的,所以单节点的Redis最多只能使用一颗CPU核心,单节点Redis的性能基本达到10万QPS的量级后就没法再向上扩展了。

在现实的业务系统中,对Redis性能往往都要求达到100万QPS以上,甚至1000万以上,这种场景下需要通过Redis集群的方式来扩展Redis性能,而集群性能的瓶颈成为了Redis架构性能优化关键的的因素。

1 Redis Proxy集群架构性能关键点

Proxy集群作为业界广为流行的Redis集群,其架构如下:

在这个架构中,Redis集群由负载均衡器、Redis Proxy和Redis Server这三类节点组成。在此Redis集群架构中,Proxy节点和Redis Server都可以水平扩展,通过增加节点数量就可不断提升Redis集群的整体性能。根据不同的业务诉求,集群性能可弹性扩展到100万至1000万QPS。也正是由于可通过增加节点数来提升集群整体性能,所以Redis单节点虽只用一颗CPU核心,CPU最高主频限制Redis单节点性能,但在集群水平扩展模式下cpu主频限制已经不太重要了。

在整个集群架构中,业务系统发出的Redis请求需要经过负载均衡器和Redis Proxy的两次转发后,才能到达Redis Server被真正处理,端到端的链路性能才是整个集群的最大性能瓶颈。实测结果也表明,Redis集群的端到端链路时延每减少1毫秒,集群整体性能可提升10%+。

2 Redis Cluster集群架构性能关键点

Cluster集群作为Redis官方标准的集群,逐步成为客户的集群首选架构,并实际应用到线上业务中。其架构如下:

Cluster集群相比Proxy集群减少了网络跳数,性能更高、灵活性很强。该架构和Proxy集群一样,突破了Redis集群对于CPU单核性能的依赖性,而端到端的链路性能才是整个集群的最大性能瓶颈。

从上述架构剖析可以了解到,Redis单核性能的关键在于CPU的处理能力,但Redis真实在CPU中操作的时间在纳秒级别,不超过端到端时延的10%,因此Redis横向扩展核心靠链路性能优化。

二、华为云鲲鹏Redis:三项黑科技助力Redis性能

1.华为自研LibOS构建高性能云服务基础设施,助力Redis性能2倍提升

LibOS兼顾资源利用率和隔离性,同时满足公有云资源利用率和多租户隔离的诉求,成为公有云runtime的重要发展方向。创新的LibOS技术将Redis的软件栈由10层压缩到4层,实现了超低延时。

1) SOCKET标准接口,实现从内核态网络栈平滑切换到用户态。
2) 轻量级协议栈,支持每个Redis实例有独立的协议栈,避免协议栈共享导致的锁竞争问题。
3) 业务线程和用户态协议栈共线程,零调度开销。
4) 发挥网卡极限性能,避免了中断和调度导致时延增加。

2.华为编译器通过智能动态编译优化,提升热点代码性能15+%

华为自研编译器针对公有云业务应用场景特征,通过智能动态编译优化,提升热点代码性能15+%:

1) 由部署在云服务环境内的轻量级性能特征采集Agent,保存程序动态运行时的关键性能特征信息;

2) 通过智能编译调优工具,以动态性能特征作为输入,结合静态代码分析,产生更优的编译策略;

3) 自研ARM64编译器使用新的编译策略重新编译生成优化后的应用程序,热点代码性能提升明显。

3.华为iSula自研安全容器引擎技术,以更少的系统资源占用,实现秒级实例分发与迁移

iSulad是华为自主研发的高性能、低开销的容器引擎,通过镜像下载加速技术和最小化启动调用链条,实现容器的秒级启动和迁移。配合LibOS,可实现可媲美虚拟机级别的安全隔离性,确保租户只能使用它们可用的资源。

三、强悍性能支撑客户业务成功

在某电商大客户中,客户业务数据量大、读写请求量大、峰值明显且扩容频繁、需求变化快等特点,对Redis依赖很重、性能要求很高,现网同时维护200+个Redis实例,疲于应付 容量扩容、性能下降、链接无响应、持久化失败等各种现网问题,给研发团队带来巨大挑战。

为了应对业务增长带来的大数据并发,解决系统瓶颈问题,客户决定考察华为云鲲鹏Redis。在多次的技术场景交流、PoC验证后,客户果断决策将自建的Redis实例全部迁移到鲲鹏Redis上,主要收益:

1) 性能收益。华为云基于全栈整合之后单实例性能达到10万QPS以上,Cluster集群支持性能的线性扩展至千万级别,足够应付2019年的业务增长目标。

2) 价格收益。鲲鹏Redis降低客户30%使用成本后,在做到同等规格实例比自建Redis更省钱的同时,资源使用率提升了20%。用花更少的钱,享受更大的容量。

3) 技术收益。鲲鹏Redis提供专业的技术支持,具备从硬件链路到软件优化的能力,可以提供更优的系统级优化方案。

迁移是有开销的,包括割接的稳定性测试与保障等,都需要人力投入。但客户CTO表示,华为云提供了很好的迁移保障,大大提升迁移的效率减少了对现网业务的影响。相比长期合作所带来的收益,这个开销基本忽略不计。

华为云鲲鹏Redis,业界首个基于自研ARM-Based全栈整合的Redis云服务,支持双机热备的HA架构,提供单机、主备、Proxy集群、Cluster集群实例类型,满足高读写性能场景及弹性变配的业务需求。

原文地址:https://www.cnblogs.com/huaweicloud/p/12017487.html

时间: 2024-10-10 02:56:45

揭秘丨7分钟看懂华为云鲲鹏Redis背后的自研技术【华为云技术分享】的相关文章

三分钟看懂上证50ETF期权,基础学习

三分钟看懂上证50ETF期权,基础学习 最近50RETF期权投资,广受投资者朋友的欢迎,但也有一些朋友对此不是非常了解,今天 optioncc期权小编 我们就来给大家介绍一下50ETF期权! 首先我们先来了解一下什么是50ETF期权? 50ETF期权是经过上海证券交易所的三个衍生产品,从上证50指数到50ETF指数基金再到50ETF期权,我们先来了解一下上证50指数. 他是由上海证券交易所编制的,是从众多股票中选择了最具代表性的50只股票,像中国平安.民生银行.伊利股份.贵州茅台等,而他们的行情

3分钟看懂各种建筑结构优劣

不同的建筑结构,对房子的直接影响是耐久.抗震.安全和空间使用性能都不相同,以下图解建筑结构的类型及其优缺点,3分钟让你看懂.

LS1012A丨一文看懂何谓“低耗高速佼佼者”

小编一眼就被OK1012A-C小巧精致的外观吸引了,优先烧录上了Ubuntu系统,来感受一下它强悍的接口能力和Ubuntu系统带来的便利. 0 1 CoreMark跑分在嵌入式处理器领域最为知名和常见的Benchmarks 为Dhrystone 和CoreMark ,CoreMark是一个综合基准,用于测量嵌入式系统中使用的中央处理器(CPU)的性能.它是在2009 由eembc 的shay gal-on 开发的,旨在成为一个行业标准,取代过时的dehrystone 基准. OK1012A-C平

云计算与大数据系列:1分钟看懂弹性计算云EC2的关键技术

一.地理区域和可用区域 EC2系统中包含多个地理区域,而每个地理区域中又包含多个可用区域.为了确保系统的稳定性,用户最好将自己的多个实例分布在不同的可用区域和地理区域中. 二.EC2的通信机制 EC2的实例一旦被创建就会动态地分配公共IP地址和私有IP地址 私有IP地址由动态主机配置协议(DHCP)分配产生 三.弹性负载平衡 弹性负载平衡功能允许EC2实例自动分发应用流量,从而保证工作负载不会超过现有能力,并且在一定程度上支持容错. 弹性负载平衡功能可以识别出应用实例的状态,当一个应用运行不佳时

[智能硬件] 1、三分钟看懂智能硬件原理——蓝牙防丢器制作教程(包括手机应用)

1 什么是智能蓝牙防丢器 所谓智能蓝牙(Smart Bluetooth)防丢器,是采用蓝牙技术专门为智能手机设计的防丢器.其工作原理主要是通过距离变化来判断物品是否还控制在你的安全范围.主要适用于手机.钱包.钥匙.行李等贵重物品的防丢,也可用于防止儿童或宠物的走失 .[请看正版请百度:beautifulzzzz(看楼主博客园官方博客,享高质量生活)嘻嘻!!!] 图 1-1 蓝牙防丢器应用领域 2 蓝牙防丢器的主要构造 目前比较成熟的产品一般是采用蓝牙4.0技术,具有低功耗.双向防丢.自动报警等优

十分钟看懂云计算概念

亚马逊AWS.微软Azure.阿里Aliyun组成的3A团队连续多季度保持高速增长.AWS通过光环新网实现商用,IBM Bluemix则由世纪互联提供运营,国际云服务商陆续来了.Openstack发布Newton版本,看上去就没有不能支持的东西,私有云的春天真的来了吗?Docker红得发紫,与之对应的DevOps和NoOps持续高温.但是对于不少企业尤其是传统企业,云仍在天边,对于云仍感觉云里雾里.上云还是不上云,上什么云,这是个问题.我们试着用最通俗的比喻,理清云服务中最基本的那些事儿. 什么

[智能硬件] 3、三分钟看懂智能硬件原理——简易智能手环制作教程(包括炫酷手机客户端开发)

首先恭喜大家挺过了测试二!为什么说“挺”呢?因为测试二的难度和测试一相比有一个比较大的跳跃:首先测试一仅仅利用现有硬件模块稍加改造而DIY一个蓝牙防丢器,而测试二则要求大家具有从脑袋里的一个想法到一个全新的小设备的实现的全部能力,显然该过程不是连几根线那么简单:其次测试一对蓝牙的使用仅限于信号搜索层面,而测试二一下子深入到可靠通信的层面了,其难度可想而知:最后在测试二中客户端的设计中复杂的状态转换过程,以及嵌入式编程时需要对所使用的硬件作细致的分析,都构成了对前期基础没打牢的同学一种挑战.不过好

10分钟看懂Docker和K8S

https://blog.csdn.net/duanbeibei/article/details/85614938 2010年,几个搞IT的年轻人,在美国旧金山成立了一家名叫“dotCloud”的公司. 这家公司主要提供基于PaaS的云计算技术服务.具体来说,是和LXC有关的容器技术. LXC,就是Linux容器虚拟技术(Linux container) 后来,dotCloud公司将自己的容器技术进行了简化和标准化,并命名为——Docker. Docker技术诞生之后,并没有引起行业的关注.而d

干货满满!10分钟看懂Docker和K8S(转)

2010年,几个搞IT的年轻人,在美国旧金山成立了一家名叫“dotCloud”的公司. 这家公司主要提供基于PaaS的云计算技术服务.具体来说,是和LXC有关的容器技术. LXC,就是Linux容器虚拟技术(Linux container) 后来,dotCloud公司将自己的容器技术进行了简化和标准化,并命名为——Docker. Docker技术诞生之后,并没有引起行业的关注.而dotCloud公司,作为一家小型创业企业,在激烈的竞争之下,也步履维艰. 正当他们快要坚持不下去的时候,脑子里蹦出了