C++AMP介绍(一)

C++AMP介绍(一)

最后更新日期:2014-05-02

阅读前提

环境:Windows 8.1 64bit英文版,Visual Studio 2013 Professional Update1英文版,Nvidia QuadroK600 显卡

内容简介

介绍C++ AMP如何使用加速器(GPU)的并发执行能力。通过两个尽可能简洁的程序,让用户了解到如何把AMP应用到自己的程序开发当中。

正文

C++AMP (C++ Accelerated Massive Parallelism)利用并行硬件(例如独立图形加速卡)的性能,加速你C++程序的执行速度,C++ AMP编程模型包括支持多维数组,索引,内存传输和平铺,包括数学函数库。你可以使用C++ AMP更广泛的控制CPU同GPU之间数据的传递。

C++ AMP要求你的显卡完整支持DirectX11硬件特性。

在Visual Studio上建立Win32 控制台项目,下面是我第一个C++AMP应用程序源代码

#include "stdafx.h"

#include <amp.h>
#include <iostream>
using namespace concurrency;

const int size = 5;

void CppAmpMethod() {
	int aCPP[] = { 1, 2, 3, 4, 5 };
	int bCPP[] = { 6, 7, 8, 9, 10 };
	int sumCPP[size];

	//concurrency::array_view是AMP的数据包装器,可作为智能指针使用,代表了一维或多维数组。
	//第一个模板参数是数据类型,第二个模板参数是维度。
	//第一个构造参数是数组中元素的数量,第二个构造参数是数组
	array_view<const int, 1> a(size, aCPP);
	array_view<const int, 1> b(size, bCPP);
	array_view<int, 1> sum(size, sumCPP);

	//调用dsicard_data方法,是为了避免sum包装器中的数据复制到GPU
	//此方法的调用不能出现在有restrict(amp)约束的上下文(代码段)中
	sum.discard_data();

	parallel_for_each(
		//sum.extent代表计算域,在这上面将会建立线程集合
		//因为数组中有5个元素,所以会建立5根线程分别运行
		sum.extent,
		//Lambda表达式定义在加速器上各个线程将会运行的代码
		//restrict(amp)是Microsoft AMP引入的约束符号,要求Lambda运行在GPU上
		//默认值是restrict(cpu)约束在CPU上运行,所以不加约束可以在任何标准C++编译器中正确编译
		//约束还可以是restrict(cpu,amp),没有其它。
		//index类用来索引array_view中的元素,index模板参数表示idx的维度
		[=](index<1> idx) restrict(amp)
	{
		//restrict(amp)约束使lambda表达式无法捕获到外面的引用型和指针型变量
		//只能使用concurrency::array_view容器,输入输出数据
		sum[idx] = a[idx] + b[idx];
	}
	);

	// 打印输出结果. 正确的输出应该是 "7, 9, 11, 13, 15".
	for (int i = 0; i < size; i++) {
		std::cout << sum[i] << "\n";
	}

	//更新sum包装器指向的数据源,即sumCPP中的数据(元素)
	sum.synchronize();

	// 打印输出结果. 正确的输出应该是 "7, 9, 11, 13, 15".
	for (int i = 0; i < size; i++) {
		std::cout << sumCPP[i] << "\n";
	}
}
int _tmain(int argc, _TCHAR* argv[])
{
	CppAmpMethod();

	system("pause");

	return 0;
}

第二个C++ AMP程序演示如何自己编写带restrict(amp)修饰的函数,以及如何调用它。

#include "stdafx.h"

#include <amp.h>
#include <amp_math.h>
#include <iostream>
using namespace concurrency;

const int size = 5;

//带restrict(amp)约束的函数只能使用C++标准的子集,称为kernel函数,
//在GPU上运行,只能被带有restrict(amp)约束的上下文(代码段)调用
void AddElementsWithRestrictedFunction(
	index<1> idx, array_view<int, 1> sum, array_view<int, 1> a, array_view<int, 1> b) restrict(amp)
{
	sum[idx] = a[idx] + b[idx];
}

void AddArraysWithFunction() {

	int aCPP[] = { 1, 2, 3, 4, 5 };
	int bCPP[] = { 6, 7, 8, 9, 10 };
	int sumCPP[5];

	array_view<int, 1> a(5, aCPP);
	array_view<int, 1> b(5, bCPP);
	array_view<int, 1> sum(5, sumCPP);
	sum.discard_data();

	parallel_for_each(
		sum.extent,
		[=](index<1> idx) restrict(amp)
	{
		//调用restrict(amp)约束的函数
		AddElementsWithRestrictedFunction(idx, sum, a, b);
	}
	);

	for (int i = 0; i < 5; i++) {
		std::cout << sum[i] << "\n";
	}
}

/*
C++ AMP 带了两个数学库, 在名字空间Concurrency::precise_math的双精度库,也提供单精度数学函数。
在Concurrency::fast_math名字空间的单精度库,只提供单精度数学函数。
可以使用accelerator::supports_double_precision属性判断GPU是否支持双精度库。
这些带restrict(amp)约束的数学函数在<amp_math.h>头文件中声明。
标准C++库<cmath>头文件中声明的数学函数在fast_math和precise_math空间中都能找到。
*/
void MathExample() {

	double numbers[] = { 1.0, 10.0, 60.0, 100.0, 600.0, 1000.0 };
	array_view<double, 1> logs(6, numbers);

	parallel_for_each(
		logs.extent,
		[=](index<1> idx) restrict(amp) {
		logs[idx] = concurrency::fast_math::log10(logs[idx]);
	}
	);

	for (int i = 0; i < 6; i++) {
		std::cout << logs[i] << "\n";
	}
}

int _tmain(int argc, _TCHAR* argv[])
{
	//测试这里写的带restrict(amp)约束的函数
	AddArraysWithFunction();

	//测试C++ AMP提供的带restrict(amp)约束的数学函数
	MathExample();

	system("pause");

	return 0;
}

现在你应该已经学会了C++AMP的编程方式,下一篇介绍C++ AMP关于性能优化方面的基本知识。

参考资料

http://msdn.microsoft.com/zh-cn/library/vstudio/hh265136(v=vs.120).aspx

http://blogs.msdn.com/b/nativeconcurrency/archive/2011/09/13/c-amp-in-a-nutshell.aspx

C++ AMP (C++ Accelerated MassiveParallelism)

http://msdn.microsoft.com/zh-cn/library/hh265137.aspx

时间: 2024-08-27 10:39:13

C++AMP介绍(一)的相关文章

数据库介绍与分类

目录 数据库介绍与分类... 1 1.1 数据库介绍... 2 1.1.1什么是数据库... 2 1.2数据库的种类... 2 1.2.1关系型数据库介绍... 2 1.2.2非关系型数据库介绍... 3 1.3 常用关系型数据库产品介绍... 4 1.3.1 Oracle数据库... 4 1.3.2 MySQL数据库... 5 1.3.3 MariaDB数据库... 5 1.3.4 SqlServer数据库... 6 1.3.5 Access数据库... 6 1.3.6 其他不常用数据库...

基于位置信息的聚类算法介绍及模型选择

百度百科 聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类.由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异."物以类聚,人以群分",在自然科学和社会科学中,存在着大量的分类问题.聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法.聚类分析起源于分类学,但是聚类不等于分类.聚类与分类的不同在于,聚类所要求划分的类是未知的. 分类和聚类算法一直以来都是数据挖掘,机器学习领域的热门课题,因此产生了众多的

Centos 7.3下 Linux For SQL Server安装及配置介绍

Centos 7.3下Linux For SQL Server安装及配置介绍 说到SQL Server服务,我们大家都知道是Microsoft公司的数据库服务,当然说到数据库,现在主要分为三大商:1:Oracle.2:Msql Server.3:Mysql:三种数据库在当下环境受到不了不同程度的关注:比如oracle主要应用到大型的商业比较多,比如银行:SQL Server主要在常见的互联网公司使用:mysql主要应用于小型的企业或者服务商使用:当然从费用上来说,Oracle是最贵的,也是最为稳

苹果高管斯洛基介绍A11仿生芯片背后的秘密!

9月13日凌晨,苹果在秋季发布会上正式推出了全新一代iPhone智能手机:iPhone 8.iPhone 8 Plus和iPhone X(发音为iPhone 10).这三款新设备的都搭载了全新的移动芯片,苹果称之为A11仿生(不是"Fusion"),并表示这是iPhone上有史以来最强大.最智能的芯片. 通过发布会介绍的A11仿生芯片细节,不难发现苹果自主定制芯片野心非常大,可谓雄心勃勃.并且随着时间的推移,针对半导体芯片的定制设计越来越多,A11达到了前所未有的高度.苹果在发布会中的

10.23 linux任务计划cron10.24chkconfig工具10.25 systemd管理服务10.26 unit介绍 10.27 target介绍

- 10.23 linux任务计划cron - 10.24 chkconfig工具 - 10.25 systemd管理服务 - 10.26 unit介绍 - 10.27 target介绍 - 扩展 1. anacron http://blog.csdn.net/strikers1982/article/details/4787226  2. xinetd服(默认机器没有安装这个服务,需要yum install xinetd安装) http://blog.sina.com.cn/s/blog_46

20.1 Shell脚本介绍;20.2 Shell脚本结构和执行;20.3 date命令用法;20.4 Shell脚本中的变量

20.1 Shell脚本介绍 1. shell是一种脚本语言 aming_linux blog.lishiming.net 2. 可以使用逻辑判断.循环等语法 3. 可以自定义函数 4. shell是系统命令的集合 5. shell脚本可以实现自动化运维,能大大增加我们的运维效率 20.2 Shell脚本结构和执行 1. 开头(首行)需要加: #!/bin/bash 2. 以#开头的行作为解释说明: 3. 脚本的名字以.sh结尾,用于区分这是一个shell脚本 4. 执行.sh脚本方法有两种:

微信小程序管理后台介绍

微信小程序的管理后台,每次进入都需要扫码,还是特别不爽,现在微信小程序还没正式发布,很多人都还没看到管理后台,这里抢先发布出来 ------------------------------------------------------------ http://www.cnblogs.com/likwo/p/6057258.html 好推小程序统计:https://weixin.hotapp.cn关键指标分析推广效果,一行代码接入微信登录 ---------------------------

HTML5介绍

声明:本栏目所使用的素材都是凯哥学堂VIP学员所写,学员有权匿名,对文章有最终解释权:凯哥学堂旨在促进VIP学员互相学习的基础上公开笔记. HTML5没有那么难,他是一个非常简单的标记. 三个知识点:THML5/JS/CSS3. 之后是网页框架 C/S 客户端/服务器 B/S 浏览器/服务器 C/S构架的优缺点: C/S架构的模型: C/S架构一旦发生更新,那么成千上万个客户机都要进行更新,如果更新内容比较多,客户机不更新完毕,就无法运行. B/S架构工作原理: B/S架构优缺点: 移动公司都是

-Java基础-Java介绍

声明:本栏目所使用的素材都是凯哥学堂VIP学员所写,学员有权匿名,对文章有最终解释权:凯哥学堂旨在促进VIP学员互相学习的基础上公开笔记. java的介绍 1.1java简介 Java是一种可以撰写跨平台应用程序的面向对象的程序设计语言. 它最初被命名为Oak,目标设定在家用电器等小型系统的编程语言,来解决诸如电视机.电话.闹钟.烤面包机等家用电器的控制和通讯问题.由于这些智能化家电的市场需求没有预期的高,Sun放弃了该项计划.就在Oak几近失败之时,随着互联网的发展,Sun看到了Oak在计算机

linux入门基础知识及简单命令介绍

linux入门基础知识介绍 1.计算机硬件组成介绍 计算机主要由cpu(运算器.控制器),内存,I/O,外部存储等构成. cpu主要是用来对二进制数据进行运算操作,它从内存中取出数据,然后进行相应的运算操作.不能从硬盘中直接取数据. 内存从外部存储中取出数据供cpu运存.内存的最小单位是字节(byte) 备注:由于32的cpu逻辑寻址能力最大为32内存单元.因此32位cpu可以访问的最大内存空间为:4GB,算法如下: 2^32=2^10*2^10*2^10*2^2 =1024*1024*1024