[PyTorch]PyTorch中反卷积的用法

文章来源：https://www.jianshu.com/p/01577e86e506

pytorch中的 2D 卷积层和 2D 反卷积层函数分别如下：

 class torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, groups=1, bias=True)

class torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, bias=True)

我不禁有疑问：

问题1：两个函数的参数为什么几乎一致呢？
问题2：反卷积层中的 output_padding是什么意思呢？
问题3：反卷积层如何计算input和output的形状关系呢？
看了中文文档后，我得不出答案，看了英文文档，才弄明白了。花费了一个下午的时间去研究这个问题，值得用此文纪录一下。

我们知道，在卷积层中，输入输出的形状关系为：

o = [ (i + 2p - k)/s ] +1 （1）

其中：

O : 为 output size
i: 为 input size
p: 为 padding size
k: 为kernel size
s: 为 stride size
[] 为下取整运算

(1) 当 S=1 时

若 s等于1，则公式（1）中的取整符号消失，o 与 i 为一一对应的关系。我们有结论：

如果卷积层函数和反卷积层函数的 kernel_size, padding size参数相同（且 stride= 1），设反卷基层的输入输出形状为 i‘ 和 o‘, 卷积层的输入输出形状i和o, 则它们为交叉对应的关系，即：

i = o‘
o = i‘

为回答问题3, 我们将上述关系代入公式中，即：

i‘ = o‘ + 2p - k +1

已知 i‘, 即可推出 o‘:

o‘ = i‘ - 2p + k - 1 （2）

摘两个例子：

(2) 当 S>1 时

若 S>1 , 则公式（1）中的取整符号不能消去，o 与 i 为多对1 的关系。效仿 S=1时的情形, 我们有结论：

如果卷积层函数和反卷积层函数的 kernel_size, padding size参数相同（且 stride>1），设反卷基层的输入输出形状为 i‘ 和 o‘, 卷积层的输入输出形状i和o,

i‘ = [ (o‘ + 2p - k)/s ] +1

已知 i‘, 我们可以得出 s 个 o‘ 解:

o‘(0) = ( i‘ - 1) x s + k - 2p
o‘(1) = o‘(1) + 1
o‘(2) = o‘(1) + 2
...
o‘(s-1) = o‘(1) + s-1

即：

o‘(n) =o‘(1) + n = ( i‘ - 1) x s + k - 2p + n,
n = {0, 1, 2...s-1}

为了确定唯一的 o‘ 解，我们用反卷积层函数中的ouput padding参数指定公式中的 n 值。这样，我们就回答了问题（2）。

摘一个简单的例子：

(3) 实验验证

给出一小段测试代码，改变各个参数值，运行比较来验证上面得出的结论，have fun~.

from torch import nn
from torch.nn import init
from torch.autograd import Variable

dconv = nn.ConvTranspose2d(in_channels=1, out_channels= 1,  kernel_size=2, stride=2, padding=1,output_padding=0, bias= False)
init.constant(dconv.weight, 1)
print(dconv.weight)

input = Variable(torch.ones(1, 1, 2, 2))
print(input)
print(dconv(input))

原文地址：https://www.cnblogs.com/kk17/p/10111768.html

时间： 2024-10-08 16:45:30

[PyTorch]PyTorch中反卷积的用法的相关文章

第十四节，TensorFlow中的反卷积，反池化操作以及gradients的使用

反卷积是指,通过测量输出和已知输入重构未知输入的过程.在神经网络中,反卷积过程并不具备学习的能力,仅仅是用于可视化一个已经训练好的卷积神经网络,没有学习训练的过程.反卷积有着许多特别的应用,一般可以用于信道均衡.图像恢复.语音识别.地震学.无损探伤等未知输入估计和过程辨识方面的问题. 在神经网络的研究中,反卷积更多的是充当可视化的作用,对于一个复杂的深度卷积网络,通过每层若干个卷积核的变换,我们无法知道每个卷积核关注的是什么,变换后的特征是什么样子.通过反卷积的还原,可以对这些问题有个清晰的可视

（原）CNN中的卷积、1x1卷积及在pytorch中的验证

转载请注明处处: http://www.cnblogs.com/darkknightzh/p/9017854.html 参考网址: https://pytorch.org/docs/stable/nn.html?highlight=conv2d#torch.nn.Conv2d https://www.cnblogs.com/chuantingSDU/p/8120065.html https://blog.csdn.net/chaolei3/article/details/79374563 1x1

Convolution Network及其变种（反卷积、扩展卷积、因果卷积、图卷积）

今天,主要和大家分享一下最近研究的卷积网络和它的一些变种. 首先,介绍一下基础的卷积网络. 通过PPT上的这个经典的动态图片可以很好的理解卷积的过程.图中蓝色的大矩阵是我们的输入,黄色的小矩阵是卷积核(kernel,filter),旁边的小矩阵是卷积后的输入,通常称为feature map. 从动态图中,我们可以很明白的看出卷积实际上就是加权叠加. 同时,从这个动态图可以很明显的看出,输出的维度小于输入的维度.如果我们需要输出的维度和输入的维度相等,这就需要填充(padding). 现在我们来看

Linux中特殊符号的用法

在shell中常用的特殊符号罗列如下: # ; ;; . , / \\ 'string'| ! $ ${} $? $$ $* \"string\"* ** ? : ^ $# [email protected] `command`{} [] [[]] () (()) || && {xx,yy,zz,...}~ ~+ ~- & \\<...\\> + - %= == != #井号 (co

C语言中一些乱七八糟的用法与细节（不断更新）

用C语言比较多,这篇是平时攒下的.有些内容在工作后可能会很常见,但是不用容易忘,所以就写篇博客吧. 一.printf的用法 %*可以用来跳过字符,可以用于未知缩进.像下面一样. for(i = 1; i < 10; i++) { printf("%*c\r%*c\n", 9 - abs(i - 5), '*', abs(i - 5) + 1, '*'); } %[]可以用来读取指定的内容,%[^]可以用来忽略指定内容(正则表达式?) %m可以不带参数,输出产生的错误信息二.关

第十五节，利用反卷积技术复原卷积网络各层图像

在第十三节,我们已经介绍了使用带有全局平均池化层的CNN对CIFAR10数据集分类,在学习了反卷积神经网络之后我们把第十三节那个程序里的卷积层可视化出来. 一替换掉tf.nn.max_pool()函数这里不再使用自己定义的max_pool_2x2函数,改成新加入的带有mask返回值得max_pool_with_argmax()函数: #定义占位符 input_x = tf.placeholder(dtype=tf.float32,shape=[None,24,24,3]) #图像大小24x2

深度学习—反卷积的理解

1.Deconvolution大致可以分为以下几个方面: (1)非监督学习:unsupervised learning,其实就是covolutional sparse coding:这里的deconv只是观念上和传统的conv反向,传统的conv是从图片生成feature map,而deconv是用unsupervised的方法找到一组kernel和feature map,让它们重建图片. (2)CNN可视化:通过deconv将CNN中conv得到的feature map还原到像素空间,以观察特

tensorflow 卷积/反卷积-池化/反池化操作详解

Plese see this answer for a detailed example of how tf.nn.conv2d_backprop_input and tf.nn.conv2d_backprop_filter in an example. In tf.nn, there are 4 closely related 2d conv functions: tf.nn.conv2d tf.nn.conv2d_backprop_filter tf.nn.conv2d_backprop_i

反卷积理解

不定时更新反卷积就是转置卷积,也可以写成两个矩阵相乘,通常由小尺寸变成大尺寸,反卷积的反向传播也是可行的. 如图是反卷积的过程: 下面介绍卷积的反向传播过程,此过程与反卷积相同. 反卷积的计算是把卷积的得到的结果与卷积核的转置相乘,所以也叫转置卷积. 卷积的过程如下图: 用矩阵表达: 反向传播的公式: 其矩阵形式为: 这时就转为计算的过程. 从前面的计算过程可以找出x11参与了A中哪些元素的计算,并且可以根据对应的前向计算得出反向传播的计算公式: 后面的矩阵即为卷积核的转置. 原文地址:htt