Rocket - util - PrefixSum

https://mp.weixin.qq.com/s/G2vLP-ncoJzSOgxGGEJkfA

简单介绍PrefixSum的实现。

??

1. 基本介绍

??

把一个序列从前向后逐个执行迭代(assocOp),每针对一个元素执行一遍迭代,针对一整行执行一次迭代(layerOp)。

2. PrefixSum

??

a. layers:抽象方法,返回层数,等于layerOp执行的次数;

b. idLayer: 默认的layerOp,即没有动作,把输入原样返回;

3. RipplePrefixSum

每次只使用前一个元素对当前元素执行一次迭代,其他元素不进行迭代动作。

??

apply重构之后为:

??

a. offset只当前针对第几个元素进行迭代,当迭代到最后一个元素后停止:

??

b. 只针对当前元素执行assocOp:

??

offset每次递增1,当offset与当前元素序号相等时,才执行assocOp;

c. 当针对当前元素执行完assocOp后,执行一次layerOp:

??

d. 把layerOp的结果,带入下一次迭代:

??

一个迭代过程的例子如下:

??

实际执行的例子如下:

??

4. DensePrefixSum

提升迭代效率,每次迭代一半。

??

迭代过程如下:

??

执行过程如下:

??

5. SparsePrefixSum

6. 附录

原文地址:https://www.cnblogs.com/wjcdx/p/10992216.html

时间: 2024-10-24 10:37:25

Rocket - util - PrefixSum的相关文章

Rocket - util - AsyncQueue

https://mp.weixin.qq.com/s/6McbqOKM4fu4J5vdpZvxKw 简单介绍异步队列(AsyncQueue)的实现. ?? 0. 异步队列 异步队列的两端分属不同的时钟域,拥有各自的复位逻辑. 异步队列用于存值的一端为上游端(source),用于取值的一端为下游端(sink). 1. AsyncQueueParams ?? 异步队列的参数,包含如下几项: a. depth 队列深度,表示队列可以存储几个元素: b. sync 表示流水线的级数. c. safe 使

Rocket - util - ECC

https://mp.weixin.qq.com/s/yato1PrnHe517J8twgZFOg 介绍ECC(Error Correcting Code/Error Checking and Correcting)的实现框架.不涉及编码的具体实现细节. ?? 1. 码:Code ?? 所有编码(如奇偶校验码.海明码)的抽象父类. 包含如下几个方面: a. 能否检错:canDetect: b. 能否纠错:canCorrect: c. width():输入为数据的宽度,输出为编码后码文的宽度,一般

Rocket - util - MaskGen

https://mp.weixin.qq.com/s/_aJqf1cFJDK5RVRBhxTWOw 介绍MaskGen的实现. ?? 1. 基本介绍 给定总线宽度beatBytes,根据访问的地址(address)和访问的字节数(bytes = 2^lgSize),生成访问字节的掩码. 2. 实现 思路不复杂,写法很难懂.重构一下,提高可读性. 1) 首先忽略groupBy,清爽很多: ?? 2) 把addr_lo重命名为address,把lgSize重命名为size,这样可以很明显的看出来ad

Rocket - util - MultiWidthFifo

https://mp.weixin.qq.com/s/CUnrpyQN5LRBR5bxC5u86A 简单介绍MultiWidthFifo的实现. ?? 1. 基本介绍 实现一个输入宽度为inW,输出宽度为outW,可存n个outW宽度元素的FIFO. a. 如果inW == outW,直接使用队列(Queue)实现: b. 如果inW > outW,则相当于每次输入多个元素,而输出只能有一个元素: c. 如果inW < outW,则相当于每次输出多个元素,而输入只能有一个元素: 需要注意的是,

Rocket - util - Repeater

https://mp.weixin.qq.com/s/xyEq3DgYuf2QuNjssv8pkA 简单介绍Repeater的实现. ?? 1. 基本功能 A Repeater passes it's input to it's output, unless repeat is asserted. When repeat is asserted, the Repeater copies the input and repeats it next cycle. 2. 实现 1) io ?? a.

Rocket - util - Replacement

https://mp.weixin.qq.com/s/zCP7wPuxgQ-r94Tr6BV5iw 简单介绍Replacement的实现. ?? 1. 基本介绍 用于实现Cache替换相关的功能. ?? From: Cache Replacement Policies, Prof. Mikko H. Lipasti, University of Wisconsin-Madison, ECE/CS 752 Spring 2016 2. ReplacementPolicy 代表替换策略的抽象类. ?

Rocket - util - ReduceOthers

https://mp.weixin.qq.com/s/gbR5fuDbE_nUFVxw-p4rsA 简单介绍ReduceOthers的实现. ?? 1. 基本介绍 输入一组Bool元素,把其他位置元素逐个相与的结果,作为当前位置的值输出. 2. helper helper实现ReduceOthers的核心功能: ?? 1) 输入参数 x是输入的一组Bool类型的元素. 2) 返回值 返回一个元组:(Seq[Bool], Bool) a. Seq[Bool]:每个位置上返回其他位置上元素逐个相与的

Rocket - util - Timer

https://mp.weixin.qq.com/s/Z4JJhZ_jL1lqF1nf_orq9A 简单介绍Timer的实现. ?? 1. 基本功能 实现定时器的功能. 2. Timer 实现一个静态装入的定时器: ?? 1) initCount 定时器的初始值,静态配置,不可动态改变. 2) maxInfligh 定时器事件的种类. 3) io ?? a. start:某个定时器事件需要启动定时器,io.start.bits为这个定时器事件的ID: b. stop:某个定时器事件需要停止定时器

64位开源处理器Rocket的源代码简单介绍

最近大概阅读了一下UCB发布的Rocket处理器的源码,对源代码各个文件的功能有了一些大致的了解,Mark一下. Rocket是一款64bit的标量处理器,5级流水线,采用的是risc-v指令集,集成FPU,并有许多or1200没有的特性,比如:无阻塞缓存.分支预测.返回地址堆栈.硬件页表填充.cache支持ECC.支持多核等. Rocket的源代码是使用Chisel编写的,Chisel是UCB发布的基于Scala的领域特定语言.可以在https://github.com/ucb-bar/roc