Makefile for CUDA

 1 CUDA_PATH ?=/usr/local/cuda-7.0
 2 NVCC      :=$(CUDA_PATH)/bin/nvcc -ccbin g++
 3 INCLUDE   :=-I/usr/local/cuda-7.0/include/ 4            -I/usr/local/cuda/samples/common/inc 5         -I/usr/include/c++ 6         -I./
 7
 8 LIBRARIES :=-L/usr/local/cuda/lib64 -lcudart -lcufft
 9 TARGETS   :=kernel
10 OBJECTS   :=kernel.o IML_PrecisionTimer.o stimer.o
11
12 .SUFFIXES:.o .cu .cpp
13 .cu.o:
14     $(NVCC) -arch=sm_20  $(INCLUDE) -c -g -o [email protected]  $< $(LIBRARIES)
15 .cpp.o:
16     $(CXX) $(INCLUDE) -c -g -o [email protected] $< $(LIBRARIES)
17
18 all: $(TARGETS)
19
20 $(TARGETS): $(OBJECTS)
21     #sudo cp /usr/local/cuda/lib64/libcufft.so.7.0 /usr/lib
22     ln -s libcudart.so.7.0  libcudart.so
23     ln -s libcudart.so.7.0  libcudart.so.7
24     ln -s libcufft.so.7.0 libcufft.so
25     ln -s libcufft.so.7.0 libcufft.so.7
26     g++    $(INCLUDE) -g -o [email protected] $^ $(LIBRARIES)
27 run:
28     ./$(TARGETS)
29
30 clean:
31     rm -rf *.o kernel libcudart.so libcudart.so.732         libcufft.so libcufft.so.7 h_hatCH1.txt
时间: 2024-08-07 12:09:07

Makefile for CUDA的相关文章

Linux平台CUDA+OpenCV3.4配置

前段时间,在TX2上装了OpenCV3.4,TX2更新源失败的问题,OpenCV内部很多函数都已经实现了GPU加速,但是我们手动写的函数,想要通过GPU加速就需要手动调用CUDA进行加速.下面介绍Linux平台的环境配置以及与OpenCV混合编译. Linux平台CUDA+OpenCV3.4配置 1 环境安装 首先需要安装OpenCV及CUDA环境安装,有TX2平台下OpenCV和CUDA参考百度.注意TX2自带了OpenCV2.14,如果需要安装高版本的OpenCV话需要注意多版本管理的问题.

【CUDA并行编程之四】矩阵相乘

前面介绍了基本的Cuda编程的相关知识,那么这一篇在此基础之上来看看GPU在处理数据计算上的高效能,我们拿矩阵相乘来作为例子. 1.CPU上执行矩阵相乘以及性能. 在CPU上进行矩阵相乘运算的代码: mat_mul.cc: <span style="font-family:Microsoft YaHei;font-size:18px;">//a[i]*b[i] + c[i] = d[i] #include<iostream> #include<vector

NVIDIA DIGITS 学习笔记(NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0)

转自:http://blog.csdn.net/enjoyyl/article/details/47397505?from=timeline&isappinstalled=0#10006-weixin-1-52626-6b3bffd01fdde4900130bc5a2751b6d1 NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0环境配置 引言 DIGITS简介 DIGITS特性 资源信息 说明 DIGI

CUDA与Linux系统

CUDA与Linux系统 目录 CUDA与Linux平台    1 目录    2 1 CUDA安装    3 1.1 安装toolkit    3 1.2 安装显卡驱动    3 2 调式工具:CUDA GDB    3 3 分析工具:CUDA Profile    5 3.1 Visual Profiler:图形化    5 3.2 nvprof Profiler:命令行    6 4 集成工具:nsight Eclipse    8 4.1 CUDA编辑器    8 4.2 CUDA调试器

Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置说明2

1. 安装build-essentials 安装开发所需要的一些基本包 sudo apt-get install build-essential 2. 安装NVIDIA驱动 (3.4.0) 2.1 准备工作(2014-12-03更新) 在关闭桌面管理 lightdm 的情况下安装驱动似乎可以实现Intel 核芯显卡 来显示 + NVIDIA 显卡来计算.具体步骤如下: 1. 首先在BIOS设置里选择用Intel显卡来显示或作为主要显示设备 2. 进入Ubuntu, 按 ctrl+alt+F1 进

Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置说明

笔者花了很长时间才装完,主要是cuda安装和opencv安装比较费劲,cuda找不到32位的安装包只好重装64位的ubuntu系统,opencv 也是尝试了很久才解决,这里建议用2.4.9版本.其实如果没用GPU的话不需要安装cuda,不过为了后续兼容性的考虑,系统强烈建议64位的.下面是 对自己的安装过程记录备忘,有些主要参考网上的文章,所以有些过程就直接用了原来文章中的内容. caffe在git上的源码:https://github.com/BVLC/caffe 环境:    ubuntu

【CUDA并行编程之七】数组元素之和

现在需要求得一个数组的所有元素之和,之前感觉似乎不太可能,因为每个线程只处理一个元素,无法将所有元素联系起来,但是最近学习了一段代码可以实现,同时也对shared memory有了进一步的理解. 一.C++串行实现 串行实现的方法非常之简单,只要将所有元素依次相加就能够得到相应的结果,实际上我们注重的不是结果,而是运行的效率.那么代码如下: array_sum.cc: #include<iostream> #include<stdio.h> #include "kmean

ubuntu16.04 安装 caffe cuda 相关流程

不多说了,经历了很多莫名其妙的错误最后终于安装好了,直接放安装脚本: #!/bin/bash #安装时要注意有些库可能安装失败以及安装caffe有和protobuf相关错误时可能需要重新对protobuf进行make install cd /home/zw/softwares #需要事先下载对应版本的cuda sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb sudo apt-get update sudo ap

【CUDA并行编程之八】Cuda实现Kmeans算法

本文主要介绍如何使用CUDA并行计算框架编程实现机器学习中的Kmeans算法,Kmeans算法的详细介绍在这里,本文重点在并行实现的过程. 当然还是简单的回顾一下kmeans算法的串行过程: 伪代码: 创建k个点作为起始质心(经常是随机选择) 当任意一个点的簇分配结果发生改变时 对数据集中的每个数据点 对每个质心 计算质心与数据点之间的距离 将数据点分配到距其最近的簇 对每一个簇,计算簇中所有点的均值并将均值作为质心 我们可以观察到有两个部分可以并行优化: ①line03-04:将每个数据点到多