Makefile for CUDA

 1 CUDA_PATH ?=/usr/local/cuda-7.0
 2 NVCC      :=$(CUDA_PATH)/bin/nvcc -ccbin g++
 3 INCLUDE   :=-I/usr/local/cuda-7.0/include/ 4            -I/usr/local/cuda/samples/common/inc 5         -I/usr/include/c++ 6         -I./
 7
 8 LIBRARIES :=-L/usr/local/cuda/lib64 -lcudart -lcufft
 9 TARGETS   :=kernel
10 OBJECTS   :=kernel.o IML_PrecisionTimer.o stimer.o
11
12 .SUFFIXES:.o .cu .cpp
13 .cu.o:
14     $(NVCC) -arch=sm_20  $(INCLUDE) -c -g -o [email protected]  $< $(LIBRARIES)
15 .cpp.o:
16     $(CXX) $(INCLUDE) -c -g -o [email protected] $< $(LIBRARIES)
17
18 all: $(TARGETS)
19
20 $(TARGETS): $(OBJECTS)
21     #sudo cp /usr/local/cuda/lib64/libcufft.so.7.0 /usr/lib
22     ln -s libcudart.so.7.0  libcudart.so
23     ln -s libcudart.so.7.0  libcudart.so.7
24     ln -s libcufft.so.7.0 libcufft.so
25     ln -s libcufft.so.7.0 libcufft.so.7
26     g++    $(INCLUDE) -g -o [email protected] $^ $(LIBRARIES)
27 run:
28     ./$(TARGETS)
29
30 clean:
31     rm -rf *.o kernel libcudart.so libcudart.so.732         libcufft.so libcufft.so.7 h_hatCH1.txt

时间： 2024-12-16 18:01:31

Makefile for CUDA的相关文章

Linux平台CUDA+OpenCV3.4配置

前段时间,在TX2上装了OpenCV3.4,TX2更新源失败的问题,OpenCV内部很多函数都已经实现了GPU加速,但是我们手动写的函数,想要通过GPU加速就需要手动调用CUDA进行加速.下面介绍Linux平台的环境配置以及与OpenCV混合编译. Linux平台CUDA+OpenCV3.4配置 1 环境安装首先需要安装OpenCV及CUDA环境安装,有TX2平台下OpenCV和CUDA参考百度.注意TX2自带了OpenCV2.14,如果需要安装高版本的OpenCV话需要注意多版本管理的问题.

【CUDA并行编程之四】矩阵相乘

前面介绍了基本的Cuda编程的相关知识,那么这一篇在此基础之上来看看GPU在处理数据计算上的高效能,我们拿矩阵相乘来作为例子. 1.CPU上执行矩阵相乘以及性能. 在CPU上进行矩阵相乘运算的代码: mat_mul.cc: <span style="font-family:Microsoft YaHei;font-size:18px;">//a[i]*b[i] + c[i] = d[i] #include<iostream> #include<vector

NVIDIA DIGITS 学习笔记（NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0）

转自:http://blog.csdn.net/enjoyyl/article/details/47397505?from=timeline&isappinstalled=0#10006-weixin-1-52626-6b3bffd01fdde4900130bc5a2751b6d1 NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0环境配置引言 DIGITS简介 DIGITS特性资源信息说明 DIGI

CUDA与Linux系统

CUDA与Linux系统目录 CUDA与Linux平台 1 目录 2 1 CUDA安装 3 1.1 安装toolkit 3 1.2 安装显卡驱动 3 2 调式工具:CUDA GDB 3 3 分析工具:CUDA Profile 5 3.1 Visual Profiler:图形化 5 3.2 nvprof Profiler:命令行 6 4 集成工具:nsight Eclipse 8 4.1 CUDA编辑器 8 4.2 CUDA调试器

Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置说明2

1. 安装build-essentials 安装开发所需要的一些基本包 sudo apt-get install build-essential 2. 安装NVIDIA驱动 (3.4.0) 2.1 准备工作(2014-12-03更新) 在关闭桌面管理 lightdm 的情况下安装驱动似乎可以实现Intel 核芯显卡来显示 + NVIDIA 显卡来计算.具体步骤如下: 1. 首先在BIOS设置里选择用Intel显卡来显示或作为主要显示设备 2. 进入Ubuntu, 按 ctrl+alt+F1 进

Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置说明

笔者花了很长时间才装完,主要是cuda安装和opencv安装比较费劲,cuda找不到32位的安装包只好重装64位的ubuntu系统,opencv 也是尝试了很久才解决,这里建议用2.4.9版本.其实如果没用GPU的话不需要安装cuda,不过为了后续兼容性的考虑,系统强烈建议64位的.下面是对自己的安装过程记录备忘,有些主要参考网上的文章,所以有些过程就直接用了原来文章中的内容. caffe在git上的源码:https://github.com/BVLC/caffe 环境: ubuntu

【CUDA并行编程之七】数组元素之和

现在需要求得一个数组的所有元素之和,之前感觉似乎不太可能,因为每个线程只处理一个元素,无法将所有元素联系起来,但是最近学习了一段代码可以实现,同时也对shared memory有了进一步的理解. 一.C++串行实现串行实现的方法非常之简单,只要将所有元素依次相加就能够得到相应的结果,实际上我们注重的不是结果,而是运行的效率.那么代码如下: array_sum.cc: #include<iostream> #include<stdio.h> #include "kmean

ubuntu16.04 安装 caffe cuda 相关流程

不多说了,经历了很多莫名其妙的错误最后终于安装好了,直接放安装脚本: #!/bin/bash #安装时要注意有些库可能安装失败以及安装caffe有和protobuf相关错误时可能需要重新对protobuf进行make install cd /home/zw/softwares #需要事先下载对应版本的cuda sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb sudo apt-get update sudo ap

【CUDA并行编程之八】Cuda实现Kmeans算法

本文主要介绍如何使用CUDA并行计算框架编程实现机器学习中的Kmeans算法,Kmeans算法的详细介绍在这里,本文重点在并行实现的过程. 当然还是简单的回顾一下kmeans算法的串行过程: 伪代码: 创建k个点作为起始质心(经常是随机选择) 当任意一个点的簇分配结果发生改变时对数据集中的每个数据点对每个质心计算质心与数据点之间的距离将数据点分配到距其最近的簇对每一个簇,计算簇中所有点的均值并将均值作为质心我们可以观察到有两个部分可以并行优化: ①line03-04:将每个数据点到多