浅谈 OpenGL 中相关阻塞问题

　　昨天我遇到一个问题，问题如下：

　　　　我使用了延迟渲染，我的渲染流程是：Pass1 --> CUDA并行计算 -->Pass2

　　　　CUDA并行计算中需要使用Pass1渲染生成的两张纹理，然而我在GPU端使用CUDA计算时发现纹理为空（数据全是0值），但是如果将两张纹理的数据传回CPU端，打印出来是有值的，且是正确的值。如果在CUDA并行计算之前先将纹理数据传回CPU，这时发现CUDA并行计算中纹理是正常有值的。。。这个现象很奇怪，我开始想了想会不会是阻塞啥原因，但我对OpenGL阻塞过程不了解，没看到过相关的资料，简单思考了一下觉得不是阻塞的原因，我觉得可能是其中的一张纹理有问题，牵连导致这个问题。。。。。最终验证发现还是OpenGL阻塞的原因。在CUDA并行计算之前加上 glFinish()函数即可。

　　为啥加上glFinish()函数就解决了呢？解释这个之前，先说一下glFlush()和glFinish()函数的作用：

　　　　一个OpenGL渲染程序会调用很多的OpenGL命令，而OpenGL是异步的，CPU将这些耗时的命令发送到GPU端，然后直接返回继续执行，这些OpenGL相关指令存储在GPU的缓存中一条条的执行，但是CPU也不是直接发送给GPU的，CPU自己有缓存，先存储在自己的缓存中，之后再发送过去（有时机，例如遇到某些刷新的命令等）。现在开始介绍以上两个函数的作用。

　　　　glFlush()：将缓存在CPU端的命令发送到GPU上，清空缓存，发送完立即返回。

　　　　glFinish()：将缓存在CPU端的命令发送到GPU上，清空缓存，发送完，等待GPU执行完在返回。

　　看到这里就可以理解我加上 glFinish() 可以解决问题的原因了。我没加 glFinish() 时，CUDA并行计算时，这时Pass1实际没有执行完，故纹理为空，CUDA中拿不到正确的纹理数据，加上 glFinish() 后实际就是加入了GPU阻塞，等待Pass1执行完，然后执行CUDA并行计算。

　　注：说到这里，谈点我思考的问题：

　　　　1、在OpenGL渲染中，不管是 Pass1 --> CUDA并行计算 -->Pass2，或者 Pass1 --> Pass2 或者Pass（只有一个Pass），我们统计两次渲染之间的时间差值就可以计算帧率，为啥不会因为异步问题计算不准呢？因为 glfwSwapBuffers(glfw_window) 命令会将所有CPU端的命令发送到GPU端，并等待其执行完，然后再交换前后缓冲。

　　　　2、对于Pass1 --> Pass2这样的延迟渲染，Pass1和Pass2都是作为命令发送到GPU端，按序执行，故不会出现Pass2拿到的数据（由Pass1处理的）不正确情况，我们不需要加阻塞保障其执行。

　　　　　另外不要错误以为，CPU运行到Pass2处看见Pass1还在执行，CPU阻塞等待Pass1执行完然后发送Pass2指令。

　　　　3、为啥在CUDA并行计算前，对纹理进行一次数据传回可以让CUDA获取正确的纹理数据？我觉得（差不多肯定是这样，哈哈，自信……）拷贝纹理数据的OpenGL API虽然与GPU相关，但是其与CPU也相关，需要在CPU端的内存上接收传回的数据，从CPU端考虑它也会阻塞的。

　　　　4、Pass1 和 CUDA并行计算都是在GPU上执行的，而CUDA拿不到正确的纹理数据，可以认为 Pass1 和 CUDA并行计算同时在GPU上并行执行（我猜的，应该是吧……）。

原文地址：https://www.cnblogs.com/chen9510/p/12158299.html

时间： 2024-10-12 07:49:01

浅谈 OpenGL 中相关阻塞问题

浅谈 OpenGL 中相关阻塞问题的相关文章

浅谈Linux中的信号机制（二）

Java网络编程和NIO详解7：浅谈 Linux 中NIO Selector 的实现原理

浅谈Java中的对象和引用

浅谈Java中的hashcode方法 - 海子

浅谈hadoop中mapreduce的文件分发

浅谈Java中的对象和对象引用

浅谈Java中set.map.List的区别

浅谈JAVA中的“hashcode()”方法

浅谈js中的this关键字