1. 查看本机配置,查看显卡类型是否支持NVIDIA GPU,选中计算机--> 右键属性 --> 设备管理器 --> 显示适配器:NVIDIA GeForce GT 610,从https://developer.nvidia.com/cuda-gpus可以查到相应显卡的compute capability;
2. 从http://www.nvidia.cn/Download/index.aspx?lang=cn下载合适驱动347.88-desktop-win8-win7-winvista-64bit-international-whql.exe 并安装;
3. 从https://developer.nvidia.com/cuda-toolkit 根据本机类型下载相应的最新版本CUDA7.0安装;
4. 按照http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-microsoft-windows/index.html#axzz3W8BU10Ol 步骤,验证是否安装正确:
(1)、打开C:\ProgramData\NVIDIACorporation\CUDA Samples\v7.0目录下的Samples_vs2010.sln工程,分别在Debug、Release x64下编译整个工程;
(2)、编译过程中,会提示找不到”d3dx9.h”、”d3dx10.h”、”d3dx11.h”头文件,可以从http://www.microsoft.com/en-us/download/details.aspx?id=6812下载DXSDK_Jun10.exe,然后安装到默认目录下;再编译工程即可;
(3)、打开C:\ProgramData\NVIDIACorporation\CUDA Samples\v7.0\bin\win64\Release目录,打开cmd命令行,将deviceQuery.exe直接拖到cmd中,回车,会显示GPU显卡、CUDA版本等相关信息,最后一行显示:Result = PASS;
(4)、将bandwidthTest.exe拖到cmd中,回车,会显示Device0: GeForce GT 610等相关信息,后面也会有一行显示:Result = PASS;
5. 新建一个控制台工程testCUDA:NVIDIA --> CUDA7.0, Name:testCUDA, 会自动生成一个kernel.cu文件,直接运行即可;
6. 让VS2010中CUDA文件高亮显示:
(1)、使.cu、.cuh文件里的C/C++语法高亮:VS2010 -->Tools --> Options --> Text Editor --> File Extension--> 在Extension中写入.cu、,在Editor中选中MicrosoftVisual C++,点击Add,.cuh同样操作,点击OK;
(2)、使CUDA关键字高亮:把C:\ProgramData\NVIDIACorporation\CUDA Samples\v5.0\doc\syntax_highlighting\visual_studio_8目录下的usertype.dat文件复制到C:\ProgramFiles (x86)\Microsoft Visual Studio 10.0\Common7\IDE目录下(说明:本机是win7 64位系统,如果是win732位系统则把usertype.dat文件复制到C:\Program Files\Microsoft Visual Studio 10.0\Common7\IDE目录下),CUDA 7.0中并没有usertype.dat文件,我用的是老版本5.0中的usertype.dat文件;
(3)、使CUDA函数高亮、CUDA函数输入代码提示:首先,选中VAssistX --> Visual Assist X Options --> Projects --> C/C++Directories: Platform项选择Custom,Show Directories for项选择Other include files,选中New,将C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.0\include目录加入进来,点击应用、确定即可;然后,使用regedit打开注册表,HKEY_CURRENT_USER\Software\Whole Tomato\Visual Assist X\VANet10,在右边找到ExtSource项目,鼠标右键选修改,在原有内容后添加.cu; .cuh;确定后,关闭注册表,重新打开VS2010工程即可;
7. 对testCUDA工程进行修改,移除kernel.cu文件,添加testCUDA.cu文件,将/CUDA Samples/v7.0/1_Utilities/bandwidthTest/下的bandwidthTest.cu文件内容拷贝到testCUDA.cu中实现bandwidthTest功能,对工程配置的修改包括:
(1)、CUDA C/C++--> Common --> Additional Include Directories: ../../../src/common/inc ;
(2)、CUDA C/C++--> Host --> Runtime Library: Multi-Threaded Debug(/MTd) 或 Multi-Threaded(/MT)。