neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

上周看到韩松毕业论文,扯出神经网络加速器EIE,刚好这周调研了一下neuFlow,扯出09年的一篇做卷积加速的文章,大牛Lecun Yan的学生做的,一晃眼,快十年了。也记录之。

这一套还没研究透,又被换了方向,只好抽出一个晚饭时间,把看懂的记下来,不懂的暂时不研究了,如果以后再被拎回来搞这个方向再看吧。

1. neuFlow的整体思想:

CNP是09年的一个卷积加速器,newFlow是12年的一个神经计算芯片,并加上了luaFlow编译器做成了一个嵌入式系统,可以实现人脸识别、场景分割等等。

大概思想如图,先训练好一个卷积神经网络模型,用luaFlow编译成neuFlow能跑的机器码,跟硬件代码一起下载到FPGA或者流片成ASIC,运行。

2.CNP架构

CPU使用32位的Power PC,VALU是计算加速单元,作者为这个模块设计了四种微指令:2D卷积、2D空间池化与下采样、点积、非线性(sigmoid或者tanh之类)

根据微指令功能,CNP赤裸裸的面向卷积神经网路计算。(Lecun的学生做的)

3. 2D卷积加速器设计

3*3卷积加速器设计方案:

计算流程如下:

时间: 2024-08-02 21:58:56

neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统的相关文章

[转帖]RISC-V 加速芯片,496核!RTL开源!

RISC-V 加速芯片,496核!RTL开源! https://news.cnblogs.com/n/653553/ 来源:wikichip Celerity 是在多家大学共同努力下,而创造的一个开源多核 RISC-V 分层(tiered)加速器芯片.该项目是 DARPA 快速电路实现(Circuit Realization At Faster Timescales:CRAFT)计划的一部分,该计划希望将定制集成电路的设计周期从几年缩短到几个月甚至几周.Celerity 团队首先在 Hot Ch

卷积计算

向量$a = (a_0, a_1, ..., a_{n-1})$和$b = (b_0, b_1, ..., b_{n-1})$ $A(x) = a_0 + a1_x + a_2x^2 + ... + a_{n-1}x^{n-1} $    $B(x) = b_0 + b_1x + b_2x^2 + .. + b_{n-1}x^{n-1}   $    $C(x) = A(x)B(x)  = a_0b_0 + (a_0b_1 + a_1b_0)x + ... + a_{n-1}b_{n-1}x^{

腾讯云推出物联网边缘计算平台,加速物联网走进“边云协同”时代

8月28日,腾讯云重磅推出物联网边缘计算平台,该平台的推出将彻底打通物联网应用落地的最后一公里,让云端强大的计算能力快速延伸到用户的边缘,数以亿计的物联网设备将可以随时随地畅享云计算带来的海量数据处理能力和前沿AI技术. 这是腾讯云基于丰富的技术经验和案例实战,对物联网解决方案布局的又一次跨越. 作为一种边缘计算解决方案,腾讯云物联网边缘计算平台要解决的是物联网落地“远水救不了近火”的难题. 腾讯云物联网边缘计算产品负责人戴国超指出,边缘计算可以把云中心的计算,快速交付到离用户或者是离数据离物最

卷积计算的物理意义

1,信号处理 在信号处理里,卷积用于描述一个系统过去响应信号累加结果 更多介绍 http://blog.csdn.net/tiandijun/article/details/40080823 2,图片处理 图片的卷积,更多作为权值表,进行边缘锐化或者模糊处理 更多介绍 http://blog.csdn.net/zouxy09/article/details/49080029 原文地址:https://www.cnblogs.com/liuyihai/p/9310954.html

连载6:利用卷积计算两个信号的乘积

神经网络加速与模型压缩

https://github.com/handong1587/handong1587.github.io/blob/master/_posts/deep_learning/2015-10-09-acceleration-model-compression.md

HUAWEI HiAI亮相华为开发者生态大会 助力应用AI开发实现加速度

6月23日,在2018华为终端·全球合作伙伴及开发者大会AI分论坛体验区的一角,被层层叠叠的人群围得水泄不通.站在最前面的一名体验者,正跟随着"快手短视频"APP上不断出现的小人左右扭动,每完成一个动作,就能自动加分!一名来自另一家短视频应用的体验者不禁感叹:没想到快手的动态肢体分割能力这么好,准确度这么高. 而另一侧,体验者将手机里的照片一一选中,通过金山WPS的应用客户端,在几秒中内一键将图片生成了PPT,处理之迅速.功能之强大,让人眼花缭乱. 细究这些应用的"神操作&q

Fully Convolutional Networks for semantic Segmentation(深度学习经典论文翻译)

摘要 卷积网络在特征分层领域是非常强大的视觉模型.我们证明了经过端到端.像素到像素训练的卷积网络超过语义分割中最先进的技术.我们的核心观点是建立"全卷积"网络,输入任意尺寸,经过有效的推理和学习产生相应尺寸的输出.我们定义并指定全卷积网络的空间,解释它们在空间范围内dense prediction任务(预测每个像素所属的类别)和获取与先验模型联系的应用.我们改编当前的分类网络(AlexNet [22] ,the VGG net [34] , and GoogLeNet [35] )到完

AI佳作解读系列(五) - 目标检测二十年技术综述

计算机视觉中的目标检测,因其在真实世界的大量应用需求,比如自动驾驶.视频监控.机器人视觉等,而被研究学者广泛关注. 上周四,arXiv新出一篇目标检测文献<Object Detection in 20 Years: A Survey>,其对该领域20年来出现的技术进行了综述,这是一篇投向PAMI的论文,作者们review了400+篇论文,总结了目标检测发展的里程碑算法和state-of-the-art,并且难能可贵的对算法流程各个技术模块的演进也进行了说明,还深入到目标检测的特定领域,如人脸检