OpenCL内核函数支持double和结构体

在opencl开发中，有时需要保证精度，需要支持double类型，但是double类型在opencl标准里面不是要求强制实现的，有些设备支持，有些不支持，如果你的设备支持的话，就需要在所有出现在double的最前面声明如下：

#pragma OPENCL EXTENSION cl_khr_fp64: enable

但是这也有一个问题，就是不能保证程序的可移植性，之前在编写地形因子提取算法时，在某些AMD的显卡就不支持。

另外有时候需要支持结构体的话，就只需要定义和主机端一模一样的结构体，然后在CPU传进来就可以了，比如，我上一篇博客中的RPC结构体的信息如下：

typedef struct
{
	//偏移量
	double      dfLINE_OFF;
	double      dfSAMP_OFF;
	double      dfLAT_OFF;
	double      dfLONG_OFF;
	double      dfHEIGHT_OFF;

	//缩放比例
	double      dfLINE_SCALE;
	double      dfSAMP_SCALE;
	double      dfLAT_SCALE;
	double      dfLONG_SCALE;
	double      dfHEIGHT_SCALE;

	//系数
	double      adfLINE_NUM_COEFF[20];
	double      adfLINE_DEN_COEFF[20];
	double      adfSAMP_NUM_COEFF[20];
	double      adfSAMP_DEN_COEFF[20];

	//最大最小经纬度范围
	double		dfMIN_LONG;
	double      dfMIN_LAT;
	double      dfMAX_LONG;
	double		dfMAX_LAT;

} stRPCInfo;

那么需要再主机端传输结构体参数，具体就是调用clSetKernelArg函数

status = clSetKernelArg(ckKernel,0,sizeof(stRPCInfo),&stInfo);

这样，内核函数中就可以使用double类型和结构体了

__kernel void RPCWarpKernel(
							  struct stRPCInfo RpcInfo,
							  __global double *dbGeoTrans,
							  __global unsigned short* poDataIn,
							  int nWidthIn,
							  int nHeightIn,
							  int nMinRowIn,
							  int nSrcHeight,
							  __global unsigned short* poDataOut,
							  int nWidthOut,
							  int nHeightOut,
							  int nMinRowOut,
							  int nBandCount)

时间： 2025-01-10 12:51:06

OpenCL内核函数支持double和结构体的相关文章

linux内核中的struct rlimit结构体详解

在linux内核中,对一个进程获取系统资源的数量进行了限制.那么linux内核是如何实现这种对一个进程的各种资源的限制呢? linux使用struct rlimit结构体来实现的,rlimit是 resource limit的缩写. struct rlimit { unsigned int rlim_cur; /* soft limit */ unsigned int rlim_max; /* ha

ctypes给扩展模块中的函数传递数组和结构体

传递数组楔子下面我们来看看如何使用ctypes传递数组,这里我们只讲传递,不讲返回.因为C语言返回数组给python实际上会存在很多问题,比如:返回的数组的内存由谁来管理,不用了之后空间由谁来释放,事实上ctypes内部对于返回数组支持的也不是很好.因此我们一般不会向python返回一个C语言中的数组,因为C语言中的数组传递给python涉及到效率的问题,python中的列表传递直接传递一个引用即可,但是C语言中的数组过来肯定是要拷贝一份的,所以这里我们只讲python如何通过ctypes给

通过一个函数，操作一个结构体，实现对应函数功能

指针结构体一直是我的盲点,所以今天有必要整“清理门户”.此种通过一个函数操作一个结构体,实现对应函数功能,用法十分巧妙,使用得当可以使得代码可移植性和易懂性大大的增加,有人说过“代码注释的最高境界是程序的自述,而不是双斜杠然后后面跟着中英文的注释”.哈哈,说远了,下面开始进入今天的加油站,补充体力了. 1 // 头文件 2 #include <stdio.h> 3 4 // 函数声明 5 typedef struct _halDeviceFuncs_t 6 { 7 void (*pfnInit

菜鸟学习-C语言函数参数传递详解-结构体与数组

C语言中结构体作为函数参数,有两种方式:传值和传址. 1．传值时结构体参数会被拷贝一份,在函数体内修改结构体参数成员的值实际上是修改调用参数的一个临时拷贝的成员的值,这不会影响到调用参数.在这种情况下,涉及到结构体参数的拷贝,程序空间及时间效率都会受到影响. 例子: typedef struct tagSTUDENT{ char name[20]; int age; }STUDENT; void fun(STUDENT stu) { printf("stu.name=%s,stu.age=%d/

函数外面对单个结构体成员进行赋值出错

关于"为什么整型的就可以,结构体类型的就不能这么赋值呢?"--整形等常规数据类型由编译器自动识别,而自定义的数据类型(楼主自定义的结构体类型),编译器在编译阶段无法识别,故出错. 关于"在函数外单个初始化"--在入口函数(main函数)之前定义变量及初始化,得到的是全局变量.编译器对程序进行编译时,必须先构造或者创建全局变量,为全局变量分配内存,再找入口函数:而在创建全局变量时,该变量类型(楼主自定义的结构体)编译器无法识别,故无法创建该全局变量. 进入main函数

c语言，结构体里面的函数

以linux-3.2内核代码为例,结构体里面的函数的用法: 例,在某驱动文件中,定义了一个平台设备驱动: static struct platform_driver s3c24xx_led_driver = { .probe = s3c24xx_led_probe, .remove = s3c24xx_led_remove, .driver = { .name = "s3c24xx_led", .owner = THIS_MODULE, }, }; 对struct platform_d

入职培训笔记记录--day9（1、指针函数与函数指针、函数指针数组 2、malloc memset 3、递归函数 4、结构体 5、共用体---》大小端 6、枚举）

1.指针函数与函数指针.函数指针数组指针函数:返回值为指针的函数 char *fun() { char str[] = "hello world"; return str; } int main() { char *p = fun(); puts(p); return 0; } 编译时,会出现警告,返回了一个已经被释放掉的内存空间的首地址解决方法:1.static 2.char *str = "hello world"; 3.malloc 注意:使用完后要free

C-函数指针，指针函数，构造体之结构体

指针函数: 返回值是指针的函数指针函数的定义: 一般形式: 类型说明符 *函数名(形参表){ 函数体 } 其中, 函数名之前加了’*’ 号表明这是一’指针型函数, 即返回值是一个指针. 类型说明符表示了返回的指针所指向的数据类型函数指针: 一个函数在内存中总是占用一段连续的内存区, 而函数名就是该函数所占内存区的首地址——把函数的这个首地址(入口地址) 赋予一个指针变量, 使该指针变量指向该函数. 然后通过指针变量就可以找到并调用这个函数——这种指向函数的指针变量称为”函数指针变量” 类型说

(struct)结构体变量作为函数参数调用的方法小结

结构体变量.结构指针变量.结构数组作为函数的参数应用实例分析 struct stud { long int num; float score; }; /*结构体变量作为函数的参数,修改之后的成员值不能返回到主调函数*/ void funvr(struct stud t) { t.num=2000101; t.score=71.0; } /*结构体数组作为函数的参数,修改后的元素的成员值能返回到主调函数*/ void funar(struct stud t[]) //void funar(stru