gpu和cpu区别

GPU的功耗远远超过CPU
Cache, local memory： CPU > GPU
Threads(线程数): GPU > CPU
Registers: GPU > CPU 多寄存器可以支持非常多的Thread,thread需要用到register,thread数目大，register也必须得跟着很大才行。
SIMD Unit(单指令多数据流,以同步方式，在同一时间内执行同一条指令): GPU > CPU。

在计算机上运行的程序从性能的角度来说大致可分为三类：
(1) I/O intensive;
(2) Memory intensive
(3) Compute-intensive。
　　(1)I/O intensive的程序其性能瓶颈是I/O，也就是说程序运行的大部分时间花在了硬盘读写/网络通信上，而I/O处在计算机体系结构金字塔的最底层，速度非常慢。最近炒的很火的big data 讨论的就是这一类应用程序。几百TB 甚至到PB级别的数据往哪搁，只能放在硬盘上。一台机器容量太小CPU太少怎么办，搞几百台甚至上千台机器用网线连起来分布处理。所以这块全是I/O，现在大的互联网公司不多搞几个上千节点的集群肯定撑不住。
　　(2)Memory intensive的程序其性能瓶颈在内存访问，程序中有大量的随机访问内存的操作，但是基本没有I/O, 这类程序已经比第一类程序快一个数量级了，但是和寄存器的速度还是没法比。目前大部分应用程序都属于这类。个人电脑里装的的各种软件基本就是这类，如果有点I/O, 立刻就会非常得卡。
以上提到的这两类程序的应用最广泛，涵盖了大部分有用的计算机软件，但遗憾的是GPU在这两块毫无用处， GPU只有在计算密集型的程序有些作用。I/O是瓶颈的程序，花在计算的时间可以忽略不计，再怎么用GPU加速也没用。含有大量内存随机访问的程序也不适合在GPU上执行，大量的随机访问甚至可以使GPU的行为由并行变为串行。
什么类型的程序适合在GPU上运行？
　　（1）计算密集型的程序。所谓计算密集型(Compute-intensive)的程序，就是其大部分运行时间花在了寄存器运算上，寄存器的速度和处理器的速度相当，从寄存器读写数据几乎没有延时。可以做一下对比，读内存的延迟大概是几百个时钟周期；读硬盘的速度就不说了，即便是SSD, 也实在是太慢了。
　　（2）易于并行的程序。GPU其实是一种SIMD(Single Instruction Multiple Data)架构，他有成百上千个核，每一个核在同一时间最好能做同样的事情。
　　满足以上两点，就可以用GPU做运算了。不过你还得先用CUDA或者Open CL 把能在GPU上运行的程序写出来，这也是很麻烦的，写一下就知道了。而且GPU的架构比较特殊，要想写出高效率的程序，要花很多很多时间。笔者想说写GPU程序是一件很蛋疼的事情。
　　GPU在某些地方很有用，但应用面比较窄，远远没有某公司声称的那么有用。当今还是Intel的天下，现在计算机的速度已经很快了，计算其实已经不是什么大问题。I/O才是最需要解决的问题。记得曾经看过N家的GTC峰会，黄某人吹得神乎其神，连笔者都被感动了，多少多少T FLOPS的计算速度。程序运行时间从100 秒变成 1秒其实没多重要，你倒杯水的功夫就100秒了。运行时间从100天缩短到1天才是大贡献。前者就是GPU做的事情，后者才是我们真正需要的。

gpu:数量大，计算简单，重复多次
cpu :数量不那么大，计算复杂，重复性低

原文地址：https://www.cnblogs.com/timxgb/p/9578169.html

时间： 2024-11-09 23:36:17

gpu和cpu区别

gpu和cpu区别的相关文章

[linuxeden] 程序员的野心：让GPU像CPU一样运行

GPU 与CPU的作用协调，工作流程、GPU整合到CPU得好处

[深度学习] Pytorch（三）—— 多/单GPU、CPU，训练保存、加载模型参数问题

[科普] CPU, GPU, TPU的区别

1.2CPU和GPU的设计区别

GPU和CPU耗时统计方法

Unity运用GPU代替CPU处理和计算简单测试

iOS GPU、cpu、显示器的协作

[深度学习] Pytorch学习（二）—— torch.nn 实践：训练分类器（含多GPU训练CPU加载预测的使用方法）