《转载》 cpp文件调用CUDA .cu文件实现显卡加速相关编程

转自:   http://m.blog.csdn.net/blog/oHanTanYanYing/39855829

本篇文章谈的是cpp文件如何调用CUDA的.cu文件实现显卡加速的相关编程。当然,这是在默认已经配置好CUDA的情况下进行的,如果对于如何配置CUDA还有疑问可以看之前写的这一篇文章。另外,现在CUDA已经放出了支持VS2013的6.5版本,所以还是建议用最新的,毕竟VS2013好用太多,配置起来也没什么区别。关于那篇配置文章,并没有解决CUDA相关函数偶有错误提示的问题,虽然对于编译没有影响,但是对于有强迫症的人来说还是比较纠结的,本人研究过后会更新,望周知。

关于如何通过cpp文件调用CUDA的.cu文件实现显卡加速相关编程的问题,有两种方法。本篇先谈的是根据VS2013模板创建CUDA工程(安装6.5版本CUDA后可看到)然后再加入cpp文件的这一种方法。至于另外的在MFC或者win32工程等添加.cu文件再进行调用这种其实本质上是差不多的,会比较麻烦,本人后面有时间再更新。

在主题开始之前,先说下如何调用CUDA进行显卡加速,其实大的方向是十分简单的。流程大致如下:

初始化显卡内存->将主机待处理的内存数据拷贝到显卡内存中->利用显卡处理相关的数据->将处理完成的显卡内存数据拷回主机内存

OK,下面进入主题

首先创建CUDA工程,工程创建完成之后会有一个.cu文件,将文件的内容替换成如下内容

 1 #include "cuda_runtime.h"
 2 #include "device_launch_parameters.h"
 3 #include "main.h"
 4
 5  inline void checkCudaErrors(cudaError err)//错误处理函数
 6  {
 7        if (cudaSuccess != err)
 8         {
 9             fprintf(stderr, "CUDA Runtime API error: %s.\n", cudaGetErrorString(err));
10             return;
11         }
12  }
13
14 __global__ void add(int *a,int *b,int *c)//处理核函数
15 {
16     int tid = blockIdx.x*blockDim.x+threadIdx.x;
17     for (size_t k = 0; k < 50000; k++)
18     {
19         c[tid] = a[tid] + b[tid];
20     }
21 }
22
23 extern "C" int runtest(int *host_a, int *host_b, int *host_c)
24 {
25     int *dev_a, *dev_b, *dev_c;
26
27     checkCudaErrors(cudaMalloc((void**)&dev_a, sizeof(int)* datasize));//分配显卡内存
28     checkCudaErrors(cudaMalloc((void**)&dev_b, sizeof(int)* datasize));
29     checkCudaErrors(cudaMalloc((void**)&dev_c, sizeof(int)* datasize));
30
31     checkCudaErrors(cudaMemcpy(dev_a, host_a, sizeof(int)* datasize, cudaMemcpyHostToDevice));//将主机待处理数据内存块复制到显卡内存中
32     checkCudaErrors(cudaMemcpy(dev_b, host_b, sizeof(int)* datasize, cudaMemcpyHostToDevice));
33
34     add << <datasize / 100, 100 >> >(dev_a, dev_b, dev_c);//调用显卡处理数据
35     checkCudaErrors(cudaMemcpy(host_c, dev_c, sizeof(int)* datasize, cudaMemcpyDeviceToHost));//将显卡处理完数据拷回来
36
37     cudaFree(dev_a);//清理显卡内存
38     cudaFree(dev_b);
39     cudaFree(dev_c);
40     return 0;
41 }

然后在工程中添加main.h文件,添加如下内容

1 #include<time.h>//时间相关头文件,可用其中函数计算图像处理速度
2 #include <iostream>
3 #define datasize 50000

下面添加main的实现文件cpp,在cpp中实现对于CUDA的.cu文件的调用。内容如下

#include "main.h"
extern "C" int runtest(int *host_a, int *host_b, int *host_c);//显卡处理函数

int main()
{
    int a[datasize], b[datasize], c[datasize];
    for (size_t i = 0; i < datasize; i++)
    {
        a[i] = i;
        b[i] = i*i;
    }

    long now1 = clock();//存储图像处理开始时间
    runtest(a,b,c);//调用显卡加速
    printf("GPU运行时间为:%dms\n", int(((double)(clock() - now1)) / CLOCKS_PER_SEC * 1000));//输出GPU处理时间

    long now2 = clock();//存储图像处理开始时间
    for (size_t i = 0; i < datasize; i++)
    {
        for (size_t k = 0; k < 50000; k++)
        {
            c[i] = (a[i] + b[i]);
        }
    }
    printf("CPU运行时间为:%dms\n", int(((double)(clock() - now2)) / CLOCKS_PER_SEC * 1000));//输出GPU处理时间

    /*for (size_t i = 0; i < 100; i++)//查看计算结果
    {
        printf("%d+%d=%d\n", a[i], b[i], c[i]);
    }*/

    getchar();
    return 0;
}

需要注意的是,在用来被调用的CUDA函数中要加上extern "C" 的声明,并在cpp文件中进行声明(extern "C" int runtest(int *host_a, int *host_b, int *host_c);)后再调用。

到此本篇的第一大部分就做完了,编译运行可以看到GPU在处理复杂并行计算的时候的确比CPU快的多。关于前面提到的另外一种方法下次再谈吧,假期要结束了,额。。。

好吧,距上面文章完成已经半年之久,来填坑了,另一种方法的博客地址在这里

【本博主】注:我试验过了,我的情况可用:visual studio2010  +  cuda 6.0

时间: 2024-12-25 20:24:51

《转载》 cpp文件调用CUDA .cu文件实现显卡加速相关编程的相关文章

cpp文件调用CUDA .cu文件实现显卡加速相关编程

本篇文章谈的是cpp文件如何调用CUDA的.cu文件实现显卡加速的相关编程.当然,这是在默认已经配置好CUDA的情况下进行的,如果对于如何配置CUDA还有疑问可以看之前写的这一篇文章.另外,现在CUDA已经放出了支持VS2013的6.5版本,所以还是建议用最新的,毕竟VS2013好用太多,配置起来也没什么区别.关于那篇配置文章,并没有解决CUDA相关函数偶有错误提示的问题,虽然对于编译没有影响,但是对于有强迫症的人来说还是比较纠结的,本人研究过后会更新,望周知. 关于如何通过cpp文件调用CUD

VS2013 VC++的.cpp文件调用CUDA的.cu文件中的函数

CUDA 8.0在函数的调用中方便的让人感动.以下是从网上学到的VC++的.cpp文件调用CUDA的.cu文件中的函数方法,和一般的VC++函数调用的方法基本没差别. 使用的CUDA版本为CUDA 8.0 ,默认安装. 1.VS2013新建CUDA 8.0项目 2.修改工程 .cpp调用.cu文件的基础是  函数的定义和函数的实现可以在不同的文件,而且.cu文件也支持这一特点,所以就可以修改成以下情况,即新建kernel.h和main.cpp,把头文件和函数声明写在头文件里面,kernel.cu

C/C++语言中,如何在main.c或main.cpp中调用另一个.c文件

C/C++语言中,如何在main.c或main.cpp中调用另一个.c文件主要有两种思路: 1.在VS2012 IDE中,将被引用的.c文件后缀名全部修改为.h,然后通过IDE的解决方案资源管理器中鼠标右键单击"头文件"-"添加"-"现有项",选中修改后缀名后的.h文件-"添加",将带引用的文件添加到IDE中. 添加到"头文件"的作用主要是不要使头文件的项属性为"C/C++ 标头",而不

Android 开发--CMakeList调用本地so文件

这里写代码片Android开发常常遇到Java调用so文件的情况,本文介绍一下Google最近新推出的应用在android studio中的方法–cmakelist.txt格式调用. so文件分为jni格式的和非jni格式的,java只能调用jni格式的so文件.本文介绍的是针对ndk生成的非jni格式的so文件调用. 首先是对非jni格式的so文件进行处理,声明一个.h文件,将so文件中的方法包进去,之后将.h文件和so文件放在一个目录下(之后需要对目录进行设置),在系统生成的native-l

vs2013 调用只有dll文件的动态库(三)

当dll内包含多个算法时,我们的动态库dll项目创建与编译还可以简洁化如下: 源文件Windll.cpp: 1 #include"Windll.h" 2 int add(int x, int y) 3 { 4 return x + y; 5 } 6 int mult(int x, int y) 7 { 8 return x*y; 9 } 头文件Windll.h: 1 #ifndef LIB_H 2 #define LIB_H 3 #define DLL_API extern "

Jquery调用从ashx文件返回的jsonp格式的数据处理实例

开发环境:vs2010+jquery-1.4.min.js 解决问题:网上代码比较少,好多调试不通,返回数据不用json而用jsonp主要考虑解决跨域问题 开发步骤:打开VS2010,新建一web站点,保存位置选择D:\Website1;添加新项,选择一般处理程序,命名cmdHandler.ashx;添加新项,选择HTML页,命名为testAshx.htm;网上下载jquery-1.4.min.js拷贝到web站点中 项目相关网站源码和运行截图如下: 1.testAshx.htm代码如下: <!

webBrowser调用外部js文件和js函数(转载)

原文链接:http://fy5388.blog.163.com/blog/static/56499537201012594314130/ webBrowser调用外部js文件和js函数 '第一种方法:webbrowser动态调用html和js代码,都是动态的:代码示例: webBrowser1.Navigate("about:blank");webBrowser1.Document.OpenNew(True);webBrowser1.Document.Write("<H

cocos2d-x 调用第三方so文件

一:假设.so文件名称 : libhi.so 1.jni文件下创建一个prebuilt 2.android.mk文件中找到  include $(CLEAR_VARS), 在这句后面添加如下代码 LOCAL_MODULE := libhi LOCAL_SRC_FILES := prebuilt/libhi.so include $(PREBUILT_SHARED_LIBRARY) LOCAL_SHARED_LIBRARIES := libhi 3.java中调用 static { System.

黄聪:wordpress源码解析-目录结构-文件调用关系(转)

Wordpress是一个单入口的文件,所有的前端处理都必须经过index.php,这是通过修改web服务器的rewrite规则来实现的.这种做法的好处是显而易见的,这样URL更好看,不必为每一个url新建一个文件. 我们看看wp大致的文件调用是什么样子的. wordpress可以分为3个阶段,一是初始化阶段,即初始化常量.环境.加载核心文件等等:二是内容处理阶段,即根据用户的请求调用相关函数获取和处理数据,为前端展示准备数据:三是主题应用阶段,在这个阶段,需要展示的数据已经准备完毕,需要根据用户