GPU高性能计算之CUDA-第一章

1. GPU在处理能力和存储带宽上比CPU更优势，这是由于GPU芯片更多的面积（也就是更多的晶体管）用于计算和存储，而不是控制（复杂控制单元和缓存）。

2. 指令级并行-->线程级并行-->处理器级并行-->节点级并行

3. 指令级并行办法：超标量，乱序执行，超流水，超长指令字，SIMD,分支预测。超长指令字可以减少访存。

4. 超长流水线会带来效率问题，需要更精准的预测功能和更大规模的缓存。

5. CPU的多核架构的新挑战：存储器壁垒，芯片，板级，系统级的均衡设计以及可移植性问题。（OpenMP，TBB）

6. CPU和GPU一般经过北桥通过AGP或者PCI-E总线连接。有各自独立的外部存储器。

7. GPU是轻量级线程。切换代价小。

8. 主流CPU有2~8个核心，每个核心有3~6条流水线。

9. CUDA是利用多个流处理器之间的粗粒度任务并行和数据级并行，以及流处理器内部的细粒度数据并行。

10. 显存的工作频率比内存的工作频率更高，这是因为GDDR是直接焊接在PCB板上的，而内存是通过插槽和主板连接的，信号的完整性相对来说更差点。

11. 显存中存在多套存储器控制单元，而内存控制器通常采用双通道或者三通道技术。GPU同时可访问的存储颗粒比CPU更多。

12. GPU中没有复杂的缓存体系和替换机制。GPU缓存只读，所以不用考虑一致性问题。

13. GPU缓存的目标不是降低访存延迟，而是节约显存带宽。

14. GPU的目标是以大量的线程面向吞吐量高的数据并行计算，适合计算密度高，逻辑分支简单的大规模数据并行任务。

时间： 2024-11-03 21:09:43

GPU高性能计算之CUDA-第一章的相关文章

2017.06.29 数据挖掘概念知识第一章

第一章1.数据仓库技术:1.数据清理 2.数据集成 3.联机分析处理2.数据挖掘(知识发现)过程P5详见图 1.数据清理 2.数据集成 3.数据选择 4.数据变换 5.数据挖掘 6.模式评估 7.知识表示3.大数据的特点: 1.量大 2.种类多 3.处理速度快 4价值密度低 5.复杂性4.类与概念描述方法过程: 1.数据特征化 2.数据区分 3.数据特征化和区分5.分类如何提供导出的模型: 导出的模型可以多种形式表示:分类规则.决策树.数学公式或神经网络6.一个模型是有趣的: 1.易于被人理解

《GPU高性能编程CUDA实战》中代码整理

CUDA架构专门为GPU计算设计了一种全新的模块,目的是减轻早期GPU计算中存在的一些限制,而正是这些限制使得之前的GPU在通用计算中没有得到广泛的应用. 使用CUDA C来编写代码的前提条件包括:(1).支持CUDA的图形处理器,即由NVIDIA推出的GPU显卡,要求显存超过256MB:(2).NVIDIA设备驱动程序,用于实现应用程序与支持CUDA的硬件之间的通信,确保安装最新的驱动程序,注意选择与开发环境相符的图形卡和操作系统:(3).CUDA开发工具箱即CUDA Toolkit,此工具箱

[OpenGL红宝书]第一章 OpenGL概述

第一章 OpenGL概述标签(空格分隔): OpenGL 第一章 OpenGL概述 1 什么是OpenGL 2 初识OpenGL程序 3 OpenGL语法 4 OpenGL渲染管线 41 准备向OpenGL传输数据 42 将传输数据到OpenGL 43 顶点着色 44 细分着色 45 几何着色 46 图元装配 47 剪切 48 光栅化 49 片元着色 410 逐片元的操作 5 第一个程序深入分析 51 进入main函数 52 OpenGL的初始化过程初始化顶点数组对象分配顶点缓存对象将数

(连载)边喝咖啡边学Unity——第一章 Unity概述

作为本书的第一句正文,在这个醒目的位置再次想告诉大家,我的想法是大家把这本书当做一本闲书来读,同时也希望启发读者,因此目录结构只保留章节,不会再细分.重要的概念会特殊地提出来. 本章其实应该是枯燥无味的,对于Unity已经有所了解的读者可以自行跳过.鉴于本书的完整性不得不废话一章. Unity是什么? 首先读者需要清楚地知道,Unity是一种工具或者说软件,至目前成书之时已退出5.0版本.也可以说Unity是一款优秀的3D游戏引擎,其对于底层图形接口的封装为开发者省了不少事,极大

C#认证第一章1 题 11题

C#第一章第一题 C#认证第一章 11题

计算机网络安全第一章

计算机网络不安全因素:偶发因素.自然因素.认为因素(被动攻击.主动攻击.邻近攻击.内部人员攻击.分发攻击) 不安全的主要原因: 1.互联网具有不安全性:开放的网络,国际性的网络,自由性的网络 2.操作系统存在的安全问题:操作系统软件自身的不安全性,留下"后门".操作系统体系结构造成的不安全隐患.操作系统可以创建进程.操作系统的无口令入口及隐蔽通道 3.数据安全问题 4.传输线路安全问题 5.网络应用存在的安全问题 6.网络安全管理问题计算机网络安全是一门涉及计算机科学.网络技术.通

第一章读后感

第一章主要讲述了安卓系统的一些基本知识,安卓系统的架构以及如何查看Linux内核版本和其定义的规则. Android的体系结构主要由Linux内核.C/C++代码库.Android SDK API和应用程序四层构成,因此,Android和linux的核心部分差异非常的小:而且Android SDK API 是由Java语言编写的. 安卓移植在很大程度上是Linux内核移植主要就是移植驱动程序. 怎样学习Linux驱动开发呢,由于Linux的内核版本更新较快,每一次内核的变化就意味着Linux驱动

《大道至简》第一章读后感

经常听见有人抱怨编程太难,说自己不是学软件的料,那么他们真该好好看看<大道至简>这本书,相信他们看完这本书后会有很大收获. <大道至简>第一章引用了一个很简单的故事“愚公移山”,用这个故事很好的概述了我们在完成一个项目时所要进行的步骤.听上去“愚公移山”和编程简直是风马牛不相及,但是看过作者的叙述又有原来如此的感觉.其实编程并没有什么难懂的,就和我们日常生活一样,发现问题,分析问题,提出解决问题的方案,实施,和后续的验收.例如某天我们突然发现家里放不出水了,这就是发现问题,我们会观

读《大道至简》第一章有感

近期老师为我们推荐了一本书,叫做<大道至简>,书很薄,却精辟的讲述了软件工程专业对于编程这一实践过程的重要思想,我们总以为编程是怎样的有难度,却从来没有考虑过编程为什么难,他到底难在哪.事实是我们错了,我们不是不会技术,而是不会方法. 第一章主要讲述了编程的精义,作者利用愚公移山的故事,简洁明了的讲解了编程的实质含义,从愚公移山实施的各个方面与编程联系在一起,讲解了编程的过程.从开始的原因,到编程实现的目标,然后小组团队对这个编程项目的讨论,以及各个人员在不同项目上的安排,并且还有项目之外的协