CUDA8.0+VS2013的安装和配置

  首先声明,本文借鉴自:http://blog.csdn.net/u011314529/article/details/51505029

所以,可参考链接的博文。但原文有个瑕疵就是,cublas.lib错写成了cudlas.lib。

  其次,我还是记下我的CUDA8.0的安装和测试过程,是为备忘。

  步骤如下:

1.下载安装CUDA:

1.1  下载。请到 cuda官网,选择合适的版本。如果版本不合适,安装的时候会提示的,但还是下载最新的比较好;

1.2  安装。双击cuda_7.5.18_win10.exe,一步步来就好。

2.VS2013配置和测试

2.1 重启计算机。关于是否添加环境变量,笔者安装的时候系统已自动添加好对应的环境变量,如果没有,请查看上文链接的博文;

2.2 配置VS。也请参考上述博文,不再赘述。

3.测试

上两个测试文件。

3.1

 1 #include< stdio.h>
 2     #include "cuda_runtime.h"
 3     #include "device_launch_parameters.h"
 4     bool InitCUDA()
 5     {
 6         int count;
 7         cudaGetDeviceCount(&count);
 8         if(count == 0)
 9         {
10             fprintf(stderr, "There is no device.\n");
11             return false;
12         }
13         int i;
14         for(i = 0; i < count; i++)
15         {
16             cudaDeviceProp prop;
17             if(cudaGetDeviceProperties(&prop, i) == cudaSuccess)
18             {
19                 if(prop.major >= 1)
20                 {
21                     break;
22                 }
23             }
24         }
25         if(i == count)
26         {
27             fprintf(stderr, "There is no device supporting CUDA 1.x.\n");
28             return false;
29         }
30         cudaSetDevice(i);
31         return true;
32     }
33
34     int main()
35     {
36         if(!InitCUDA())
37         {
38             return 0;
39         }
40         printf("HelloWorld, CUDA has been initialized.\n");
41         return 0;
42     } 

3.2

  1 // CUDA runtime 库 + CUBLAS 库
  2 #include "cuda_runtime.h"
  3 #include "cublas_v2.h"
  4
  5 #include <time.h>
  6 #include <iostream>
  7
  8 using namespace std;
  9
 10 // 定义测试矩阵的维度
 11 int const M = 5;
 12 int const N = 10;
 13
 14 int main()
 15 {
 16     // 定义状态变量
 17     cublasStatus_t status;
 18
 19     // 在 内存 中为将要计算的矩阵开辟空间
 20     float *h_A = (float*)malloc (N*M*sizeof(float));
 21     float *h_B = (float*)malloc (N*M*sizeof(float));
 22
 23     // 在 内存 中为将要存放运算结果的矩阵开辟空间
 24     float *h_C = (float*)malloc (M*M*sizeof(float));
 25
 26     // 为待运算矩阵的元素赋予 0-10 范围内的随机数
 27     for (int i=0; i<N*M; i++) {
 28         h_A[i] = (float)(rand()%10+1);
 29         h_B[i] = (float)(rand()%10+1);
 30
 31     }
 32
 33     // 打印待测试的矩阵
 34     cout << "矩阵 A :" << endl;
 35     for (int i=0; i<N*M; i++){
 36         cout << h_A[i] << " ";
 37         if ((i+1)%N == 0) cout << endl;
 38     }
 39     cout << endl;
 40     cout << "矩阵 B :" << endl;
 41     for (int i=0; i<N*M; i++){
 42         cout << h_B[i] << " ";
 43         if ((i+1)%M == 0) cout << endl;
 44     }
 45     cout << endl;
 46
 47     /*
 48     ** GPU 计算矩阵相乘
 49     */
 50
 51     // 创建并初始化 CUBLAS 库对象
 52     cublasHandle_t handle;
 53     status = cublasCreate(&handle);
 54
 55     if (status != CUBLAS_STATUS_SUCCESS)
 56     {
 57         if (status == CUBLAS_STATUS_NOT_INITIALIZED) {
 58             cout << "CUBLAS 对象实例化出错" << endl;
 59         }
 60         getchar ();
 61         return EXIT_FAILURE;
 62     }
 63
 64     float *d_A, *d_B, *d_C;
 65     // 在 显存 中为将要计算的矩阵开辟空间
 66     cudaMalloc (
 67         (void**)&d_A,    // 指向开辟的空间的指针
 68         N*M * sizeof(float)    // 需要开辟空间的字节数
 69     );
 70     cudaMalloc (
 71         (void**)&d_B,
 72         N*M * sizeof(float)
 73     );
 74
 75     // 在 显存 中为将要存放运算结果的矩阵开辟空间
 76     cudaMalloc (
 77         (void**)&d_C,
 78         M*M * sizeof(float)
 79     );
 80
 81     // 将矩阵数据传递进 显存 中已经开辟好了的空间
 82     cublasSetVector (
 83         N*M,    // 要存入显存的元素个数
 84         sizeof(float),    // 每个元素大小
 85         h_A,    // 主机端起始地址
 86         1,    // 连续元素之间的存储间隔
 87         d_A,    // GPU 端起始地址
 88         1    // 连续元素之间的存储间隔
 89     );
 90     cublasSetVector (
 91         N*M,
 92         sizeof(float),
 93         h_B,
 94         1,
 95         d_B,
 96         1
 97     );
 98
 99     // 同步函数
100     cudaThreadSynchronize();
101
102     // 传递进矩阵相乘函数中的参数,具体含义请参考函数手册。
103     float a=1; float b=0;
104     // 矩阵相乘。该函数必然将数组解析成列优先数组
105     cublasSgemm (
106         handle,    // blas 库对象
107         CUBLAS_OP_T,    // 矩阵 A 属性参数
108         CUBLAS_OP_T,    // 矩阵 B 属性参数
109         M,    // A, C 的行数
110         M,    // B, C 的列数
111         N,    // A 的列数和 B 的行数
112         &a,    // 运算式的 α 值
113         d_A,    // A 在显存中的地址
114         N,    // lda
115         d_B,    // B 在显存中的地址
116         M,    // ldb
117         &b,    // 运算式的 β 值
118         d_C,    // C 在显存中的地址(结果矩阵)
119         M    // ldc
120     );
121
122     // 同步函数
123     cudaThreadSynchronize();
124
125     // 从 显存 中取出运算结果至 内存中去
126     cublasGetVector (
127         M*M,    //  要取出元素的个数
128         sizeof(float),    // 每个元素大小
129         d_C,    // GPU 端起始地址
130         1,    // 连续元素之间的存储间隔
131         h_C,    // 主机端起始地址
132         1    // 连续元素之间的存储间隔
133     );
134
135     // 打印运算结果
136     cout << "计算结果的转置 ( (A*B)的转置 ):" << endl;
137
138     for (int i=0;i<M*M; i++){
139             cout << h_C[i] << " ";
140             if ((i+1)%M == 0) cout << endl;
141     }
142
143     // 清理掉使用过的内存
144     free (h_A);
145     free (h_B);
146     free (h_C);
147     cudaFree (d_A);
148     cudaFree (d_B);
149     cudaFree (d_C);
150
151     // 释放 CUBLAS 库对象
152     cublasDestroy (handle);
153
154     getchar();
155
156     return 0;
157 }

特别注意,是cublas.lib,不是cudlas.lib

祝好运。

时间: 2024-08-09 19:35:21

CUDA8.0+VS2013的安装和配置的相关文章

.Net 转战 Android 4.4 日常笔记(5)--新软件Android Studio 0.5.8安装与配置及问题解决

原文:.Net 转战 Android 4.4 日常笔记(5)--新软件Android Studio 0.5.8安装与配置及问题解决 说真心话,Eclipse跟我们.net的VS比起来就是屌丝比高富帅,一切都是那么的难用,速度慢得我无法忍受 于是想试试Google钦点的Android Studio IDE工具,这跟ADT一样也是一套集成工具,也需要安装java JDK 1.下载最新的JDKhttp://developers.sun.com/downloads/ 我是下载JDK1.7版本,安装过程可

Ubuntu16.04 +cuda8.0+cudnn+caffe+theano+tensorflow配置明细

本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hit2015spring和http://www.cnblogs.com/xujianqing 本文主要是介绍在ubuntu16.04下,怎么配置当下流行的深度学习框架,cuda8.0+cudnn+caffe+theano+tensorflow 安装英伟达显卡驱动 首先去官网上查看适合你GPU的驱动 (http://www.nvidia.com/Do

caffe windows10 vs2015 cuda8.0 -&gt;vs2013

http://blog.csdn.net/xjz18298268521/article/details/52190184 http://www.cnblogs.com/xuanyuyt/p/5726926.html http://m.blog.csdn.net/article/details?id=51355143 http://blog.csdn.net/u011185952/article/details/52577620 http://www.cnblogs.com/xiaoxiangdi

cuda8.0环境下安装py-faster-rcnn问题总结

首先声明,由于之前安装的cuda8.0,在实践中出现各种问题,这里不是指安装环境问题,而是在训练模型是会阻止内核启动,因此让我不得不转战8.0,说出来都是泪啊,配个环境都配了一个礼拜了,所以,请不要轻易重装一个ubuntu系统,尤其当你安装了各种环境后,因为,你根本不知道后面会遇到什么可怕的事情.... 在安装py-faster-rcnn是,当然前提是到了运行demo.py的时候了,前面工作都做好了,与到了以下问题: 1.libcudart.so.8.0: cannot open shared

CentOS-7.0的核心安装与配置续

我们CentOS-7.0的核心安装后,很开心,但还没等兴奋劲过去就发现问题了,yum怎么用不了?ifconfig怎么也用不了?pvcreate呢?......之后大家可能就开始骂我坑爹了,怎么这么多的基础命令用不了,这个人写的核心安装怎么这么坑. 我错了,不要急,下面的这篇文字就是帮你们解决这个问题的. 我们安装时的文件是依照/root/anaconda-ks.cfg这个回答文件(回答文件不懂的话自行百度)安装的,cat查看它 [[email protected] ~]# cat/root/an

Kafka_2.10-0.10.0.0集群安装与配置

kafka_2.10-0.10 集群安装 上文已经讲过如何安装Zookeeper集群,因为Kafka集群需要依赖Zookeeper服务,虽然Kafka有内置Zookeeper,但是还是建议独立安装Zookeeper集群服务,此处不再赘述 kafka集群还是安装在192.168.20.178  . 192.168.20.179  .192.168.20.174三台机器上面 zookeeper集群 192.168.20.178 kafka1192.168.20.179 kafka2192.168.2

CentOS-7.0的核心安装与配置

之前在贴吧看到有人安装CentOS-7.0各种出错,我就写这一篇CentOS 7的安装教程供新手们参考. 我们安装CentOS有两种方法一种是通过光盘引导,一种通过U盘引导. 如果用光盘需将CD-ROM Drive的优先级调至最高, U盘则将Removable Devices优先级调至最高. 注意事项:在安装完毕后记得将Hard Drive调至最高.因为若依旧选择启动优先读取移动设备的话,在你连接移动硬盘或U盘重启机器时系统会优先读取它们从而导致电脑无法正常启动. 我之前安装Windows出现过

MYSQL-8.0.11-WINX64(免安装版)配置

1. 解压zip包到安装目录 首先,将mysql-8.0.11-winx64.zip 解压缩到 安装D:/mysql-8.0.11-winx64 目录下, 2.配置文件 在安装根目录下添加 my.ini 基本配置文件(my) [mysqld] basedir = D:\mysql-8.0.11-winx64 datadir = D:\mysql-8.0.11-winx64\data port = 3306 lower_case_table_names = 2 default_authentica

Win10下免安装版MySQL8.0.16的安装和配置

1.MySQL8.0.16解压 其中dada文件夹和my.ini配置文件是解压后手动加入的,如下图所示 2.新建配置文件my.ini放在D:\Free\mysql-8.0.16-winx64目录下 [mysql] # 设置mysql客户端默认字符集 default-character-set=utf8 [mysqld] #设置3306端口 port = 3306 # 设置mysql的安装目录 basedir=D:\Free\mysql-8.0.16-winx64 # 设置mysql数据库的数据的