CUDA入门(一)

  1. 介绍

    CUDA 是由NVIDIA(英伟达)公司开发的一个并行计算平台,并行编程模型。它通过控制GPU(图形计算单元,graphics processing unit)的计算能力,可以戏剧性地提高计算性能。

    CUDA的设计思想是:提供一个比如C之类的标准语言的小的扩展集,来直接实现并行算法。

    有了CUDA C/C++,程序员就可以专注于并行算法的实现,而不是去担心他们写出来的程序的加速时间不够好。

    CUDA支持异构编程,也就是支持在CPU和GPU上的运行的混合程序。线性的程序将在CPU上运行,而并行的部分将被发送到GPU中运行。因此,CUDA可以加到现有的应用中。CPU和GPU有独立的内存空间。这个设置使得可以在CPU和GPU上同时计算,而不需要内存资源间的关联。支持CUDA的GPU有成百上千个核,总共可以运行成千上万个进程。这些核有共享的资源,包括寄存器组和共享内存。片(指的是支持CUDA编程的GPU板)上的共享内存允许在核上并行的作业直接共享数据,而不需要用系统内存总线去传输数据。

    以下的指导章节将告诉你如何安装,检查是否正确安装CUDA的开发工具。

原文地址:

http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html#axzz3XwW8vgDF

时间: 2024-10-18 16:35:06

CUDA入门(一)的相关文章

CUDA编程->CUDA入门了解(一)

安装好CUDA6.5+VS2012,操作系统为Win8.1版本,首先下个GPU-Z检测了一下: 看出本显卡属于中低端配置,关键看两个: Shaders=384,也称作SM,或者说core/流处理器数量,数量越大,执行并行线程越多,单位时间计算量也就越大. BusWidth=64Bit,这个越大,数据的处理速度也就越快 接下来看看CUDA的布局: 看到这个布局,也就知道了如何配置到VS2012中去,跟OpenCV差不多,只是中文资料较少,所以需要关注下一个文件夹里的东东. 看到这个,就Happy了

CUDA入门1

1GPUs can handle thousands of concurrent threads. 2The pieces of code running on the gpu are called kernels 3A kernel is executed by a set of threads. 4All threads execute the same code (SPMD) 5Each thread has an index that is used to calculate memor

在Windows上安装PyCUDA和Theano

最近几个月在学习Deep Learning,刚开始的时候什么条件都不具备.自己从淘宝上面买了一个GT 240,搭建一个GPU环境用于程序的调试.折腾了几个月,以前PyCUDA总是搭建失败,最近几天才尝试成功.为了学习Deep Learning的源代码,自己又搭建了Theano环境.由于时间紧张,自己概略总结如下,以备忘记. 一. 在Windows上安装PyCUDA 1. 安装条件 (1) pytools库 安装PyCUDA还需要pytools库,而pytools库又需要six,appdirs,d

在ubuntu中安装theano

1. 安装Theano 1.装好Ubuntu后,先让电脑能上网. (校园网inode的同学别折腾,系统设置-网络-801.2x认证,设定好用户密码和IP就能上网) 2.能上网之后,打开软件中心,在编辑-软件源,换一个好点的源(163或教育网(如果你是教育网的话)) ctrl+alt+T打开控制端,输入 : sudo apt-get update  ,让源能工作. 3.输入密码,等一会,好了之后依次输入 1.sudo apt-get install python-numpy python-scip

转:ubuntu 下GPU版的 tensorflow / keras的环境搭建

http://blog.csdn.net/jerr__y/article/details/53695567 前言:本文主要介绍如何在 ubuntu 系统中配置 GPU 版本的 tensorflow 环境.主要包括: - cuda 安装 - cudnn 安装 - tensorflow 安装 - keras 安装 其中,cuda 安装这部分是最重要的,cuda 安装好了以后,不管是 tensorflow 还是其他的深度学习框架都可以轻松地进行配置. 我的环境: Ubuntu14.04 + TITAN

CUDA从入门到精通

CUDA从入门到精通(零):写在前面 在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择.还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个CUDA专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能给学习CUDA的童鞋提供一定指导.个人能力所及,错误难免,欢迎讨论. PS:申请专栏好像需要先发原创帖超过15篇...

CUDA C编程入门-介绍

CUDA C编程入门-介绍 1.1.从图形处理到通用并行计算 在实时.高清3D图形的巨大市场需求的驱动下,可编程的图形处理单元或者GPU发展成拥有巨大计算能力的和非常高的内存带宽的高度并行的.多线程的.多核处理器.如图1和图2所示. 图 1 CPU和GPU每秒的浮点计算次数 图 2 CPU和GPU的内存带宽 在CPU和GPU之间在浮点计算能力上的差异的原因是GPU专做密集型计算和高度并行计算-恰好是图形渲染做的-因此设计成这样,更多的晶体管用于数据处理而不是数据缓存和流控制,如图3所示. 图 3

CUDA C编程入门

CUDA C编程入门系列文章是CUDA C Programming guide的翻译,同时也会加入一些个人的理解.由于刚刚接触CUDA编程,对此领域不是很熟悉,翻译的质量和正确与否不能保证,不过如果读者发现哪里有误,欢迎指正. CUDA C编程入门文档结构: 第一章:介绍-关于CUDA的总体介绍. 第二章:编程模型-概括CUDA编程模型. 第三章:编程接口-描述CUDA编程的C语言的接口. 第四章:硬件实现-描述GPU的硬件实现. 第五章:编程指引-给出一些指导,怎样才能发挥CPU最大的性能.

CUDA C编程入门-编程模型

这章节介绍CUDA编程模型的主要的概念. 2.1.kernels(核函数) CUDA C扩展了C语言,允许程序员定义C函数,称为kernels(核函数).并行地在N个CUDA线程中执行N次. 使用__global__说明符声明一个核函数,调用使用<<<...>>>,并且指定执行的CUDA线程数目.执行的每个线程都有一个独一的ID,在核函数中可以通过变量threadIdx获取. 例子,两个向量的加,A加B,并把结果存入C,A.B和C的长度为N. __global__ vo