ARM计算架构迈一小步,却是人工智能产业的一大步

2017年3月21日,ARM在北京召开了新闻发布会,推了针对其Cortex A系列CPU芯片的新计算架构DynamIQ技术。本质上说,DynamIQ并不是新的芯片技术,而是一种新的多计算核集群方式。这种新的集群方式,让ARM的Cortex A系列能够更好的适应多种人工智能计算任务。尽管这只是ARM芯片技术的一小步,但对于推动人工智能产业来说却是一大步。

在理解DynamIQ的意义之前,先了解一些基础知识。ARM的芯片设计产品目前分为Cortex A、Cortex R和Cortex M三大系列,这是自ARM第7代处理器版本ARMv7才开始的产品划分方式。其中Cortex A主要是面向具有复杂操作系统的软件环境(需要虚拟内存),而Cortex R主要面向实时嵌入式计算环境,Cortex M主要面向工业控制系统、家用电器等需要低成本和低功耗的计算环境。

现在ARM芯片设计已经到了第8代即ARMv8。Cortex A/R/M三大系列也都陆续升级到v8版本,ARMv8的主要特点是支持64位指令集同时兼容32位指令集。基于ARMv8的Cortex A被广泛用于智能手机、移动计算平台、数字电视、服务器等复杂计算环境。

2016年5月,ARM推出了Cortex A73芯片,这是迄今为止最高性能的v8处理器,还在设计上针对移动设备和消费设备进行了优化。Cortex-A73是专门为下一代智能手机而设计的高性能处理器,采用了目前最先进的10nm技术制造,提供比上一代Cortex-A72高出30%的持续处理能力,同时芯片面积降低了40%。

除了ARM自己最底层最基础的芯片设计外,CPU设计还有一个路线就是单核(SMP)与多核(CMP),基于SMP架构的设备又称为单片机,而基于CMP架构的设备就是大家所熟知的PC、智能手机等可执行复杂计算的机器。现在大家所熟知的大多数CPU都是多核CPU,也就是在一块基板上集成多个单核CPU形成集群。

所以在过去若干年内,有多种架构实现了对多核CPU集群的调度与管理,其中也包括ARM的大小内核big.Little。ARM big.Little设计允许把高性能与低功耗的计算内核组织在一起,根据工作任务用软件来调度计算高峰与计算低谷里对计算内核的需求,从而达到总体高性能、低功耗、良好散热等综合性能。

这一次ARM推出的DynamIQ其实就是针对big.Little多核集群管理技术的改进。自2011年推出以来,ARM big.LITTLE技术为主要计算设备的多核特性带来了革新。DynamIQ big.LITTLE将通过“根据不同的任务选择最合适的处理器”的方式来推动高效、智能的多核计算创新,DynamIQ big.LITTLE能够允许对单一计算集群上的大小核进行配置,而这在过去是不可能的。

简单理解,DynamIQ big.LITTLE就是增强了多核CPU的管理细粒度,可更为精细化的调用和分析计算内核资源,这样的设计对异构计算和人工智能设备来说非常有价值。ARM称第一代采用DynamIQ技术的Cortex-A系列处理器在优化应用后,可实现比基于Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。

此外,DynamIQ技术让SoC设计者可以在单个群集中最多部署8个核,每一个核都可以有各自不同的性能特性,这会为机器学习和人工智能应用带来更快的响应速度,而全新设计的内存子系统也将实现更快的数据读取和全新的节能特性。

DynamIQ的其它好处还包括在严苛的热限制下实现更高的性能,通过对每一个处理器进行独立的频率控制,高效地在不同任务间切换最合适的处理器,以及更安全的自动控制系统,为ADAS解决方案带来更快的响应速度,并能增强安全性。

这样看来,DynamIQ并不是革命性的技术,也不是ARM的第9代芯片设计。准确的说,DynamIQ是用今天的技术来解决明天的问题——人工智能,由于DynamIQ能够更好的调配最底层的计算内核资源,这就为需要低功耗的人工智能设备带来了更好的性能与良好的散热等。

ARM计算产品事业部总经理Nandan Nayampally表示,在已经出货的1000亿颗基于ARM的芯片中,有500亿颗是由ARM的合作伙伴从2013年到2017年出货,ARM预计合作伙伴将在2021年完成下一个1000亿颗基于ARM芯片的出货,而这些芯片都将有可能基于DynamIQ技术。这样一来,这下1000亿颗芯片显然将带来更好的处理人工智能技术的能力,这无疑是人工智能产业的一大步。

然而,在另一方面,ARM是否在暗示其下一代芯片设计v9将无望在2021年推出?如果说到真正的下一代计算革命,可能v9才是能够带来颠覆性变革的“核武器”,或许有可能是真正意义上的人工智能芯片。而这一天的到来,或许要等到2021年以后了。(文/宁川)

时间: 2024-10-25 04:47:44

ARM计算架构迈一小步,却是人工智能产业的一大步的相关文章

ARM 处理器架构【转】

ARM 处理器架构 转自:http://www.arm.com/zh/products/processors/instruction-set-architectures/index.php ARM 架构是构建每个 ARM 处理器的基础.ARM 架构随着时间的推移不断发展,其中包含的架构功能可满足不断增长的新功能.高性能需求以及新兴市场的需要.有关最新公布版本的信息,请参阅 ARMv8 架构. ARM 架构支持跨跃多个性能点的实现,并已在许多细分市场中成为主导的架构.ARM 架构支持非常广泛的性能

如何在linux主机上运行/调试 arm/mips架构的binary

如何在linux主机上运行/调试 arm/mips架构的binary 原文链接[email protected]0.0.0.55 本文中用于展示的binary分别来自Jarvis OJ上pwn的add,typo两道题 写这篇教程的主要目的是因为最近想搞其他系统架构的pwn,因此第一步就是搭建环境了,网上搜索了一波,发现很多教程都是需要树莓派,芯片等硬件,然后自己编译gdb,后来实践的过程中发现可以很简单地使用qemu实现运行和调试异架构binary,因此在这里分享一下我的方法. 主机信息: 以一

从函数计算架构看 Serverless 的演进与思考

作者?|?杨皓然? 阿里巴巴高级技术专家 导读:云计算之所以能够成为 DT 时代颠覆性力量,是因为其本质是打破传统架构模式.降低成本并简化体系结构,用全新的思维更好的满足了用户需求.而无服务器计算(Serverless Computing)作为这个巨大市场的下一个阶段的进化产物,将真正帮助企业实现只专注于业务和构建应用程序,而不必担心 IT 基础设施,这也将成为云服务商未来竞争的关键. 什么是无服务器计算 云原生计算基金会(Cloud Native Computing Foundation, C

ARM Cortex-A7架构,高通210系列-MSM8909

核心板特性 A7架构 4核(4*1.1GHz(A7)) 产品尺寸小,便于客户集成,减少产品体积: 支持4G LTE超高速上网,单板兼容移动/联通/电信2G/3G/4G: 支持2+32存储器,Micro SD支持32G: 尺寸小.集成度高.大板布板灵活; 支持全网通.wifi.蓝牙.GPS; 支持 HD(1280*720) 接口丰富,可扩展性强 Sim 卡*2/MicroSD 卡*1/IIC*4/串口*2/USB(OTG)*1/3.5mm 耳机*1/GPIO *20/ADC*2/PWM*1 高通骁

ARM处理器架构的Thumb指令集中关于IT指令的使用

在ARMv6T2以及ARMv7架构扩展了Thumb指令集,其中加入了IT指令,进一步增强了代码的紧凑性. Thumb中有一个比较有意思的指令--IT,这条指令用于根据指定的条件来执行后面相继的四条指令.当然,Thumb-2中大部分算术逻辑指令都含有带条件执行的特征,不过Thumb-2是32位的.如果你需要更紧凑的指令,那么使用Thumb结合ThumbEE来做带条件的指令执行还是不错的选择.Thumb本身不具备带条件指令执行的特性. IT指令的描述为:IT{<x>{<y>{<z

ARM GPU 架构简介

1. 架构 2. 开发流程 3. Mali GPU Linux 内核设备驱动程序 Mali GPU DDK 的 Linux 版本包含在内核中运行的以下三个组件: 1)设备驱动程序: 它是最重要的组件,提供对 Mali-200 或 Mali-400 GPU 的低级访问.其主要功能如下: ?对 Mali GPU 硬件的访问 ?中断处理 ?低级内存管理 2) 统一内存提供程序 (UMP): 它是重要的辅助组件为,可以各种不同方式使用以实现驱动程序堆栈中的零拷贝操作. ?通过安全 ID 访问分配的 UM

ARM总线架构

S3C2440集成了丰富了外设控制器(LCD控制器.USB Device控制器.USB Host控制器.NAND FLASH控制器.I2C控制器.SPI控制器等).要控制这些外设就要设置相应控制器的寄存器以产生相应的驱动时序.学习S3C2440,主要是如何配置寄存器.下面是S3C2440特殊功能寄存器地址: #define rBANKCON0 (*(volatileunsigned *)0x48000004) //Boot ROM control #define rBANKCON1 (*(vol

架构的“一小步”,业务的一大步

前言:谈到"架构"这两个字,会有好多的名词闪现,比如:分层架构.事件驱动架构.DDD.CQRS等.亦或者一堆的软件设计原则,如:KISS原则(Keep it Simple and Stupid).SOLID原则(单一责任原则.开放封闭原则.里氏替换原则.接口分离原则.依赖导致原则)等.甚至如状态图.用例图.时序图.活动图等UML建模,GOF设计模式等.本文不会讨论这些架构概念,而是从闲鱼详情页这个业务场景出发,分析出当前的业务问题和痛点,然后通过一步步的架构推导设计,解决这些痛点.随着

ARM处理器架构理论知识

** ARM处理器的寄存器,ARM与Thumb状态,7中运行模式:http://blog.chinaunix.net/uid-28458801-id-3494646.html 原文地址:https://www.cnblogs.com/freyluo/p/11286987.html