[转帖]Marvell第二代ARM处理器ThunderX2解析

Marvell第二代ARM处理器ThunderX2解析

https://www.cnbeta.com/articles/tech/853137.htm

长久以来,服务器数据中心市场一直被x86 CPU架构所垄断,而在近些年,ARM架构不断吹响进军服务器领域的号角,虽然始终算不上成功,但巨头们从未放弃。台北电脑展上,Marvell(美满电子)就详细介绍了第二代基于ARM架构的服务器处理器“ThunderX2 CN99XX”,号称多项性能指标都可以媲美乃至碾压Intel Xeon至强、AMD EPYC霄龙。

Marvell公司成立于1995年,总部位于美国加州圣克拉拉,在美国、以色列、印度、德国、中国都设有研发中心,员工总数超过5000,全球专利超过1万件,2019财年收入29亿美元,是最受尊敬的半导体企业之一,核心业务覆盖存储、网络、计算三大领域,特别是拥有超过15年的高性能多核心CPU研发经验,累计出货几十亿颗,而且在ARM服务器处理器上也已耕耘数代。

2017年,Marvell以约60亿美元的价格收购了美国无工厂半导体企业Cavium(凯为半导体),从而获得了后者的ARM/MIPS产品线,包括这款ThunderX2。

ARM架构处理器拥有高能效、低成本、开放架构、广泛生态等独特优势,1990年以来累计出货量超过1300亿颗,而且不断加速,1991-2013年花了22年出货500亿颗,2013-2017年只用了4年就出货500亿颗,预计2017-2021年可出货1000亿颗。

它采用台积电16nm工艺制造,可选BGA整合封装、LGA独立封装,基于64位ARMv8.1全面定制的乱序执行核心,最多32个物理核心、128个逻辑核心(每核心4线程),频率常规模式2.5GHz、加速模式可达3.0GHz,每核心32KB数据和指令缓存、256KB二级缓存,共享32MB三级缓存。

技术方面支持ARM虚拟化扩展、RAS特性、ARM TrustZone安全保护,扩展方面可提供最多56条PCIe 3.0(14个控制器)、两个SATA 6Gbps、两个USB 3.0。

支持双路并行,通过CCPI2一致性总线互连,带宽高达600Gbps,可实现跨处理器的缓存一致性。

内存方面,每路支持最多八条DDR4,频率最高2666MHz,双路最大容量4TB。

ThunderX2将提供40多种不同配置的型号,但暂未公布具体功耗。

Marvell强调,ThunderX2在核心数量、内存带宽、IO通道、性价比方面完胜Intel至强,同时在内存带宽、应用吞吐方面远超AMD霄龙,而在多项云基准测试中,性能相比20核心40线程的Intel至强金牌6148可高出10-100%。

官方还给出了部分权威媒体的部分测试项目,Java、整数性能、内存带宽方面都非常抢眼。

Marvell表示,ThunderX2可应用于高性能计算、云计算、边缘计算等诸多领域,满足计算、存储、联网工作负载的最高要求,并通过提供更高级别的计算性能和生态系统,加速ARM服务器在主流云、高性能计算数据中心内的采用和部署。

同时,ThunderX2也已经有了诸多应用实例,比如美国能源部旗下桑迪亚国家实验室的超级计算机“Stra”,就配备了145152个ThunderX2核心,是目前最强大的ARM超算,主要用于美国核武器研究。

美国洛斯阿莫斯国家实验室采用ThunderX2核心提高了超算可用性,而不是一味追求峰值性能。

法国原子能机构CEA的超算系统也基于ThunderX2,用于核能源、国防相关。

生态方面,Marvell ARM服务器平台也已经得到了诸多OEM厂商和平台、IHV硬件厂商、操作系统和固件、中间件、应用和工具的支持。

Marvell副总裁及服务器处理器部总经理Gopal Hegde在台北电脑展期间接受采访时表示,ARM服务器在云端有着独特的优势,在现有庞大安卓手机生态的基础上,可以借助平台、架构的一致性,顺利实现ARM云端的计算和渲染,同时随着软硬件生态系统的完善,企业数据从x86服务器转向ARM服务器也越来越顺利,Marvell也会提供全心全意的帮助。

同时,Marvell计划每两年推出一代新的ARM服务器平台,每次都可以实现2倍甚至更高的性能提升。

他还透露,ARM两年前就预测未来五年,全球20%的服务器都会基于ARM架构,在中国市场的比例或许还会高一些,因为中国敢于尝试新鲜事物。

原文地址:https://www.cnblogs.com/jinanxiaolaohu/p/10964498.html

时间: 2024-08-01 11:54:23

[转帖]Marvell第二代ARM处理器ThunderX2解析的相关文章

ARM处理器工作模式

++++++++++++++++++++++++++++++++++++++++++ 本文转载自mr_raptor的专栏,感谢mr_raptor大神. http://blog.csdn.net/mr_raptor/article/details/6556157 ++++++++++++++++++++++++++++++++++++++++++ 1.1 ARM处理器工作模式 CPU的模式可以简单的理解为当前CPU的工作状态,比如:当前操作系统正在执行用户程序,那么当前CPU工作在用户模式,这时网

ARM处理器寄存器

参考:ARM Architecture Reference Manual的39页 1.ARM处理器寄存器纵览 ARM微处理器共有37个32位寄存器,其中31个为通用寄存器(R13和R13_svc不是同一个寄存器),6个为状态寄存器.但是这些寄存器不能被同时访问,具体哪些寄存器是可以访问的,取决ARM处理器的工作状态及具体的运行模式.但在任何时候,通用寄存器R14-R0.程序计数器PC.一个状态寄存器都是可访问的. 1.1.通用寄存器     R0-R15     R13_svc.R14_svc

基于ARM处理器的反汇编器软件简单设计及实现

写在前面 2012年写的,仅供参考 反汇编的目的 缺乏某些必要的说明资料的情况下, 想获得某些软件系统的源代码.设计思想及理念, 以便复制, 改造.移植和发展: 从源码上对软件的可靠性和安全性进行验证,对那些直接与CPU 相关的目标代码进行安全性分析: 涉及的主要内容 分析ARM处理器指令的特点,以及编译以后可执行的二进制文件代码的特征: 将二进制机器代码经过指令和数据分开模块的加工处理: 分解标识出指令代码和数据代码: 然后将指令代码反汇编并加工成易于阅读的汇编指令形式的文件: 下面给出个示例

ARM处理器的7种处理器模式

ARM处理器和51单片机不同,arm处理器有不同的模式,而单片机只有一种模式,这也说明了arm处理器的功能要比51单片机的功能要强大的多. arm处理器的7种模式分别是: 用户模式(usr).系统模式(sys).快速中断模式(fiq).中断模式(irq).中止模式(abt).未定义指令模式(und).管理模式(svc) 上述的7中处理器模式中,还可分类为特权模式,异常模式. 特权模式:除了用户模式之外的所有模式都是特权模式.在其他模式下都可以修改模式位来切换至不同的模式,而用户模式下不允许修改模

DSP处理器和ARM处理器的区别以及各自应用在那些领域

由于工作经常接触到各种多核的处理器,如TI的达芬奇系列芯片拥有1个DSP核3个ARM核.那么DSP处理器和ARM处理器各自有什么区别,各自适合那些领域? DSP:digital signal processor数字信号处理器,也指digital signal process数字信号处理,有自己指令集.DSP处理器的特点如下: 有专门的的硬件乘法器,能进行大量的乘法操作,与通用的MCU处理器不同,通用的MCU在执行乘法操作时是通过软件编程的方式的来实现的,通常需要几十甚至上百个时钟周期,而DSP处

7.ARM处理器的工作模式

7.ARM处理器的工作模式 ARM七种工作模式:图1-1: 图1-1 上面的七种工作模式可以在cpsr设置:如下的M[4:0]=Mode number. 图1-2 之所以要有这么多种模式,是为了避免致命的错误.例如我们写的应用程序运行在User模式,操作系统的运作在比较高的模式. User模式:普通程序运行的模式. FIQ:快速中断运行的模式 RIQ:普通中断运行的模式 Supervisor:特权模式 Abort:访问内存异常等 Undefined:未定义模式,数据未定义. System:系统模

15.ARM处理器的启动流程

15.ARM处理器的启动流程 ARM处理器启动流程涉及三方面的知识: 启动方式 地址布局 启动流程 S3c2440的ARM处理器的启动流程: 2440支持 Nor Flash启动,Nor Flash的大小2MB ????Nand Flash启动,Nand Flash的大小256MB 所以2440把uboot和kernel.FileSystem放到Nand Flash来启动的 地址布局:

[国嵌笔记][021-022][ARM处理器工作模式]

[ARM处理器工作模式] 处理器工作模式 1.User(urs):用户模式,linux应用程序运行在用户模式 2.FIQ(fiq):快速中断模式 3.IRQ(irq):中断模式 4.Supervisor(svc):系统保护模式,linux内核运行在系统保护模式 5.Abort(abt):异常模式 6.Undefined(und):未定义指令模式 7.System(sys):系统模式 [ARM寄存器详解] ARM寄存器(37个) 通用寄存器(31个) 1.未分组通用寄存器(R0-R7) 2.分组通

arm处理器的历史及现状

1 arm处理器的发展历史 arm1 arm2 arm3 arm6 arm7 arm9 arm11 arm cortex 2 arm处理器现状 arm cortex A a即application,即应用处理器,主要用在智能手机.平板电脑和服务器上. arm cortex M m即mcu,即单片机上的处理器,它的特点就是成本低,功耗低. arm cortex R r即real time,用于实时性要求高的领域,比如汽车.