160413.神经网络处理器

陈云霁

http://novel.ict.ac.cn/ychen/

陈云霁,男,1983年生,江西南昌人,中国科学院计算技术研究所研究员,博士生导师。同时,他担任了中国科学院脑科学卓越中心特聘研究员,以及中国科学院大学岗位教授。目前他带领其实验室,研制寒武纪系列深度学习处理器。在此之前,他从事国产处理器的研发工作十余年,先后负责或参与了多款龙芯处理器的设计。他在包括ISCA、HPCA、MICRO、ASPLOS、ICSE、ISSCC、Hot Chips、IJCAI、FPGA、SPAA、IEEE Micro以及8种IEEE/ACM Trans.在内的学术会议及期刊上发表论文60余篇。陈云霁获得了首届国家自然科学基金“优秀青年基金”、首届国家万人计划“青年拔尖人才”、中国计算机学会青年科学家奖以及中科院青年人才奖。他还作为负责人带领科研团队获得了全国“青年文明号”和中央国家机关“青年文明号”的称号。

智能应用

  • 智能处理是核心的问题
  • 20w人脑功耗
  • 多层大规模神经网络 ≈ 卷积神经网络 + LRM(不同的feature map提取不同的特征,来完成归一化) + Pooling(降采样) + Classifier(全联通,2-3层)
  • DeepMind:深度学校+增强学习 => 49个小游戏

神经网络处理器的需求

  • Google Cat:1.6万CPU × 7天 = 猫脸识别任务
  • 1000亿突触(Google Brain) => 100万亿突触

专门的神经网络处理器

  • 每个计算机需要一个专用神经网络处理器

寒武纪2008-2016

  • 体系结构的方法来完成神经网络的计算
  • 2012:成果

    可以用CPU(Xeon E5-4620)和GPU(K20M)十分之一的面积,分别达到CPU-117倍,GPU-1.1倍的性能。

  • 2013:首个深度学习处理器 - DianNao

    传统的神经网络芯片的做法是把硬件运算单元和算法神经元一一对应起来,这样一来只能对一个固定的神经网络进行计算。他们采用了对小尺度神经网络分时复用的方法来支持任意规模的神经网络,这个做法很厉害,极大地提高了芯片对于不同算法的能力。

  • 2014:多核深度学习处理器 - DaDianNao
  • 2015:通用机器学习处理器 - PuDianNao - (人工神经网络,k-NN,SVM,Bayes等)
  • 2016:摄像头上的智能识别IP - ShiDianNao
  • 2016:神经网络通用指令集 - DianNaoYu

方法革新

  • 固化小尺度硬件 => 任意大可变神经网络
  • 优化存储层次尽量减少访问内存的次数
  • 提高访存带宽

硬件运算单元的分时复用

  • DianNao:小范围神经元的依次解算

  • DaDianNao:
    • EDRAM技术
    • 神经网络计算规整,因此可以通过调度来提高效率
    • 相比于K20,速度提升21倍
    • 在28nm工艺下,DaDianNao的主频为606MHz,面积67.7mm^2,功耗约16W。单芯片性能超过了主流GPU的21倍,而能耗仅为主流GPU的1/330。64芯片组成的高效能计算系统较主流GPU的性能提升甚至可达450倍,但总能耗仅为1/150。
    • 缺点:1. EDRAM在28nm留片成功,但7nm工艺出现困难。(晶体管漏电) 2. 全连接网络,意味着芯片之间也需要数据之间的全沟通。因此设计方面有些缺陷。
  • PuDianNao
    • 小样本学习方法 -Bayes方法(大样本的学习方法不是万能药)
    • 经济学方面也无法使用大样本
    • 算法自身的演进,意味着硬件芯片具有很强的通用性
    • 向量内积(SVM)、向量距离、计数、非线性函数、排序 => 95%机器学习算法涉及到的运算 => 设计了MLU(机器学习功能部件)

  • ShiDianNao
    • 输入输出和系统模型都在芯片上而不需要范围内存
    • 本质上还是冯 诺依曼结构

    • 手机里的超级计算机

类脑计算机与风诺依曼结构

  • 硬件的通用性架构,类脑计算机并不是本质上的突破
时间: 2024-11-11 00:18:00

160413.神经网络处理器的相关文章

中国首款嵌入式神经网络处理器发布

中国首款嵌入式神经网络处理器(NPU)芯片在北京正式发布,该芯片颠覆传统计算机架构,是由中星微“数字多媒体芯片技术”国家重点实验室研发,已于今年3月6日实现量产. 据介绍,有别于传统的冯诺依曼计算机架构,NPU采用了“数据驱动并行计算”架构,其具有低功耗的特点,擅长视频.图像类的多媒体数据处理,有助于人工智能在嵌入式机器视觉应用中稳定发挥. 中星微日前展示了型号为VC0758的国内首款NPU芯片产品,其内部集成了四个NPU内核,同时其还集成了[email protected]的SVAC国家标准音

神经网络浅讲:从神经元到深度学习

神经网络是一门重要的机器学习技术.它是目前最为火热的研究方向--深度学习的基础.学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术. 本文以一种简单的,循序的方式讲解神经网络.适合对神经网络了解不多的同学.本文对阅读没有一定的前提要求,但是懂一些机器学习基础会更好地帮助理解本文. 神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术.人脑中的神经网络是一个非常复杂的组织.成人的大脑中估计有1000亿个神经元之多. 图1 人脑神经网络 那么机

人工神经网络--ANN

神经网络是一门重要的机器学习技术.它是目前最为火热的研究方向--深度学习的基础.学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术. 本文以一种简单的,循序的方式讲解神经网络.适合对神经网络了解不多的同学.本文对阅读没有一定的前提要求,但是懂一些机器学习基础会更好地帮助理解本文. 神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术.人脑中的神经网络是一个非常复杂的组织.成人的大脑中估计有1000亿个神经元之多. 图1 人脑神经网络 那么机

神经网络从被人忽悠到忽悠人(二)

引子 Minsky说过神经网络无法解决异或问题.60年代关于神经网络的研究还取得了一定的进展,但是都没有取得重大的突破.70年代,神经网络的研究进入了萧条期,人工智能里产生了许多不同的方向,神经网络,好像被人们所忘记. 直到1986年,David Rumelhar和Geoffery Hinton等人提出了反向传播(Backpropagation,BP)算法,解决了两层神经网络所需要的复杂计算量问题,克服了Minsky说过神经网络无法解决异或问题,该算法是对神经网络受到批判的一个有力的回答. 其中

【人工智能】NCC S1 5.6Tops高算力神经网络计算卡

基于AI专用的APiM架构,无需外部缓存的模块化深度神经网络学习加速器,用于高性能边缘计算领域,可作为基于视觉的深度学习运算和AI算法加速.外形小巧,极低功耗,拥有着强劲算力,配套完整易用的模型训练工具.网络训练模型实例,搭配专业硬件平台,可快速应用于人工智能行业中. 5.6Tops强劲算力 NCC S1基于AI嵌入式神经网络处理器(NPU),拥有28000个并行神经计算核,支持芯片上并行与原位计算,峰值运算能力高达5.6Tops,是市面上其他方案的数十倍.其强劲的算力,能进行复杂的高密度计算,

解读《新一代人工智能发展规划》,企业如何才能迎来产业高潮

新一代人工智能发展规划的通知国发[2017]35号 各省.自治区.直辖市人民政府,国务院各部委.各直属机构: 现将<新一代人工智能发展规划>印发给你们,请认真贯彻执行. 国务院 2017年7月8日 (此件公开发布) 新一代人工智能发展规划 人工智能的迅速发展将深刻改变人类社会生活.改变世界.为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,按照党中央.国务院部署要求,制定本规划. 一.战略态势 人工智能发展进入新阶段.经过60多年的演进,特别是

视频编码未来简史

转自:http://blog.csdn.net/agora_cloud/article/details/78136259 首先我们回顾一下视频编码的历史,视频编码起源于广播电视,在很长一段时间里视频编解码的变革主要推动力是来自于广播电视.当然,今天我们看互联网的视频编码是速度越来越快,昨天在ICET2017年世界大会上,ICET的主席还说到以前一个编码是十年更新一版,但是现在从H.265最新进展的来看,可能不到十年. 我们看到这个图,大家可能在小的时候见到过,电视上一个圆盘,这是最主要的电视测试

为什么台湾人工智能可能抢输大陆?(XPU时代来临)

到了 2020 年,每 3 支手机,就会有一支内建有 AI 芯片. 但目前浮出水面的 AI 芯片新创,几乎都是大陆公司. 为什么台湾这回选择缺席? 「我听说 CPU.GPU,没有听过 NPU? 」11 月底,谐星.主持人阿 Ken 在华为最新旗舰手机 Mate 10 的台湾发表会上,说着事先安排好的台词. 这个在大直美福饭店举办的手机发表会,充满着微妙的不协调感. 阿 Ken 以及穿著时尚的影星郭书瑶与修杰楷站台,现场讲的却是艰涩的科技名词. ▲ 华为旗舰机 Mate 10 发表会,左起修杰楷.

算力、真伪、万物:在华为北研所探秘荣耀10的新物种可能

不久之前,新华社公众号在愚人节那天发布了一条<发现手机摄影新物种>的推送,并将地点标注在华为北研所. 当天就有读者留言,问我们这到底是什么意思,是不是手机AI摄影又要搞个大新闻? 很巧的是,很快脑极体就有幸受邀前往华为北研所,对手机摄影新物种这件事进行了探访,并与华为海思芯片产品市场总监周晨与荣耀产品副总裁熊军民交流,获得了不少"猛料". 我们知道,手机AI摄影最近被炒得火热,甚至很多专家认为AI在手机上的出现正在改写单反确立的摄影规则.即手机拍照的目标并不一定是肉眼还原,