张冬:OpenPOWER CAPI为什么这么快?(二)



张冬:OpenPOWER CAPI为什么这么快?(二)

PMC公司数据中心存储架构师张冬

有了CAPI的FPGA是怎么做的?

首先认识一下这个体系里的三个角色:

AFU(Acceleration Function Unit),主加速逻辑部分就是FPAG的加速芯片。用户能够把自己的加速逻辑和Firmware写进去。

PSL—Power Service Layer,提供接口给AFU用于读写主存和V2P地址翻译(与CPU側使用同一个页表,并包括TLB),同一时候负责Probe
CAPP实现全局cc,并提供Cache。PSL由IBM作为硬核IP提供给FPGA开发人员。

CAPP—Coherent Attached Processor Proxy,相当于FPGA側的ccAgent,可是被放在了CPU側,其维护一个filter文件夹并接受来自其它CPU的Probe。未过滤掉的Probe转发PSL。

操作要点能够简要的概括为下面6点:

  • 针对专用场景、PCIE专用加速卡进行优化;
  • FPGA直接訪问当前进程的所有虚拟地址空间。无需转成PCIE地址。
  • 加速卡上能够使用Cache并通过CAPP的Probe操作自己主动与主存cc;
  • 加速卡与CPU看到相同的地址空间而且cc;
  • 提供API,包含打开设备、传递任务描写叙述信息等。相当于驱动程序;
  • PSL由IBM提供,硬核IP。

    AFU通过opcode及地址控制PSL收发数据。

在此过程中,CAPI致力于把FPGA当成CPU的对等端,但这是一个特殊的CPU,对计算加速很快的,很高效的一个CPU。

优势在于:两边看到了一样的地址空间,FPGA看到的不再是PCIe空间了。所以就省去了映射地址这一环节。再就是FPGA一側能够有Cache,能够缓存主存里的数据,并且Cache是与主存一致的。

如今FPGA可直接訪问主存空间,但它不会訪问全部的物理空间,由于CAPI 1.0每一个时刻仅仅能给一个进程来用。CAPI会为进程会提供一个接口,打开FPGA之后发数据和指令。CAPI
2.0会让FPGA有一个分时复用机制,比方。每10毫秒跳一个线程,可是当前的FPGA不具备这个功能,仅仅能是谁用谁打开。

谁打开了FPGA就看到谁的虚拟空间。有了这样的机制以后就不须要映射了,再就是能够直接訪问内存地址了。还有Cache,基本就融入了全部的CPU了。就是一个对等、对称的关系。

性能能提高多少?

硬件配置是这种:

IBM Power8 Server, S822L

Ubuntu, kernel 3.18.0-14-generic

Nallatech 385 CAPI card

Samsung SM1715 1.6TB NVM ExpressSSD

測试时,?PMCproject师用FPGA制作了一个文本搜索引擎,如上图。

測试过程中,Host端主程序从NVMe SSD读入数据,并生成任务描写叙述链表,?AFU採用pooling的方式訪问主存获取任务描写叙述链表并运行搜索任务。Snooper用来debug和性能监控。

性能 – P8<->AFU

当队列深度60时的时候,获得一个极限吞吐量,接近6GB/s的带宽,带宽很大。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvcG1j/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center">

延时也非常小。仅仅有1.5微秒。平均90%读写在1.5微秒完毕。

CAPI1.0临时做不到的事情

如今CPU的线程看不到AFU上的地址空间(MMIO控制寄存器地址除外)。并且。AFU仅仅能给一个进程使用。

假设未来能够把FPGA直接接入CPU的FSB,是不是会更快?



时间: 2024-10-14 05:07:09

张冬:OpenPOWER CAPI为什么这么快?(二)的相关文章

张小二求职记之 单例模式(二)

z:大侠,我又回来了. M: 内部类懂了,其实设计模式很多考察的都是基础知识,一个学生能有什么项目工程经验呢?你很上进.咱们聊聊内部类,特别是单例模式中的静态内部类.我们开始吧: M.什么时内部类? 简单来说就是类中有类. M:静态内部类和普通内部类有什么区别? 普通内部类可以理解为外部类的普通方法,需要创建外部对象,说白了普通类是属于某个对象 OutClass.InnerClass obj = outClassInstance.new InnerClass(); 静态内部类可以理解为静态方法,

张萍萍 计科高职13-1 201303014010 实践二个人项目

实践二个人实践   学号: 201303014010   姓名:张萍萍    班级:计科(高职)13-1 一.题目简介 这次实践是创建一个加减乘除的简单的小程序,主要利用加减乘除四种方法来实现简单的数字计算. 二.源码的github链接: https://github.com/elinesping/project2/blob/master/张萍萍-201303014010-计科高职13-1-实践二个人项目代码 三.所设计的模块测试用例.测试结果截图 模块测试用例代码: import static

Java已五年1—二本物理到前端实习生到Java程序员「回忆贴」

关键词:郑州 二本 物理专业 先前端实习生 后Java程序员 更多文章收录在码云仓库:https://gitee.com/bingqilinpeishenme/Java-Tutorials 前言 没有正式复工,就一直在老家待着,已经很长时间没有在三月份时候待在老家了,好久好久,从08年去县城上高中开始,在外多,在家少,一直没有机会好好停下来看看家乡. 坐的时间越长,回忆越多,想的越多,就想要整理一下这些年的经历,尤其是从事Java至今,算是一种回忆,也算是一种复盘. 分享给朋友们一张杨花. 大学

二维码扫描与生成

为了方便下载挂一个百度盘链接,包含: 1.ZBarSDK .a文件(armv7 arm64和armv7 arm64 i386两种,如有其他需求请自行生成) 2.ZBarSDK 3.libqrencode 4.ZBar相机扫描 相册扫描 iOS原生相机扫描 和 libqrencode生成二维码示例程序 (一)二维码扫描之ZBarSDK的使用 1.1 生成.a文件 (1)打开ZBar-master/iphone/zbar.xcodeproj (2)更改Architectures (3)如果弹出警告,

【转】Android手机客户端关于二维码扫描的源码--不错

原文网址:https://github.com/SkillCollege/QrCodeScan QrCodeScan 这是Android手机客户端关于二维码扫描的源码,使用了高效的ZBar解码库,并修复了中文乱码. 融合了ZXing代码(使用其中的相机管理功能). 一. 使用开源ZXing扫描的缺点 1.原始代码是横屏模式,尽管可以改成竖屏,但是扫描界面的自定义和多屏幕适配不好做 2.有效扫描区域不好控制,可能是我自己技术不成熟,没找到好方法 3.ZXing是Java写的,对二维码的解析效率没有

用二项逻辑斯蒂回归解决二分类问题

逻辑斯蒂回归: 逻辑斯蒂回归是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的, 也可以是多分类的 基本原理 logistic 分布 折X是连续的随机变量,X服从logistic分布是指X具有下列分布函数和密度函数: 其中为位置参数,为形状参数.与图像如下,其中分布函数是以为中心对阵,越小曲线变化越快 二项logistic回归模型: 二项logistic回归模型如下: 其中是输入,输出,W称为权值向量,b称为偏置, 是w和x的内积 参数估计 ? 假设: ?

Django基础五之django模型层(二)多表操作

目录 一 创建模型 关于db_column和verbose_name 二 添加表记录 三 基于对象的跨表查询 四 基于双下划线的跨表查询(基于join实现的) 进阶练习(连续跨表) 五 聚合查询.分组查询.F查询和Q查询 查询练习 F查询与Q查询 F查询 Q查询 六 ORM执行原生sql语句(了解) 执行原生查询 直接执行自定义SQL 七 Python脚本中调用Django环境(django外部脚本使用models) 八 补充多个app配置models 本节目录 一 创建模型 表和表之间的关系

10 二维数组

排序算法: 1.存储介质 可靠,稳定,海量,稳定 2.数据结构 3.样本分布 随机访问:访问每处的代价成本均等 RAM Random Access Memory ROM Random Read Only Memory 选择法需要支持随机访问,在这个场合下,选择由于冒泡 冒泡是在顺序访问场合的时候,此时冒泡由于选择 对抗中想要四两拨千斤: 1.对手犯了致命错误 2.自己水平远高于对方 要做到: 设计思路清晰,写代码快 分析思路清晰,读代码快 二维数组和多维数组本质上还是一维数组 若数组type a

《上古天真论》第七讲文字版

上古天真论篇第七讲 主讲:徐文兵  主持:梁  冬 播出时间:2009-01-17  23:00—24:00 经文:四七,胫骨坚,发长极,身体盛壮,五七,阳明脉衰,面始焦,发始堕,六七,三阳脉衰于上,面皆焦,发始白,七七,任脉虚,太冲脉衰少,天癸竭,地道不通. 梁冬:是的,重新发现中医太美.重新发现<黄帝内经>的智慧.欢迎大家收听今天的国学堂,我是梁冬,而对面的仍然是厚朴中医学堂堂主徐文兵老师. 徐文兵:梁冬好!听众朋友们大家好! 梁冬:好,徐老师好!在上一周的时候呢我们讲到了这个女性的每七年