deformable conv

在原feature map上经过卷积生成与原feature map一样w、h大小的feature map,但是channel变为2倍,即2N。2N代表的是每个像素x、y两个方向的偏移量。

这个偏移量生成的坐标大概率是float型的,但像素或者feature map只有在整数位置才有值。所以找最近的4个整数位置的像素点进行双线性插值获得当前位置的值(这个与roi-align类似,都是通过对x、y取整和取整+1就能获得最近的4个坐标点)

原文地址:https://www.cnblogs.com/ymjyqsx/p/11380028.html

时间: 2024-07-29 20:48:56

deformable conv的相关文章

论文讨论&&思考《Deformable Convolutional Networks》

这篇论文真是让我又爱又恨,可以说是我看过的最认真也是最多次的几篇paper之一了,首先deformable conv的思想我觉得非常好,通过end-to-end的思想来做这件事也是极其的make sense的,但是一直觉得哪里有问题,之前说不上来,最近想通了几点,先初步说几句,等把他们的代码跑通并且实验好自己的几个想法后可以再来聊一聊.首先我是做semantic segmentation的,所以只想说说关于这方面的问题. 直接看这篇paper的话可能会觉得ji feng的这篇工作非常棒,但实际上

论文: Deformable Convolutional Networks

论文: Deformable Convolutional Networks CNN因为其内部的固定的网络结构,对模型几何变换的识别非常有限. 本paper给出了两个模块deformable convolution 和 deformable ROI-Pooling来提高CNN的模型变换能力. 过去的办法解决几何变换的方法,一,使用data Augmentation来增大不同几何形状的object,二,使用sift 或者 sliding windows这样的方法来解决. 本paper主要针对三个mo

Deformable Convolutional Networks

1 空洞卷积 1.1 理解空洞卷积 在图像分割领域,图像输入到CNN(典型的网络比如FCN)中,FCN先像传统的CNN那样对图像做卷积再pooling,降低图像尺寸的同时增大感受野,但是由于图像分割预测是pixel-wise的输出,所以要将pooling后较小的图像尺寸upsampling到原始的图像尺寸进行预测,之前的pooling操作使得每个pixel预测都能看到较大感受野信息.因此图像分割FCN中有两个关键,一个是pooling减小图像尺寸增大感受野,另一个是upsampling扩大图像尺

总结2017,希望2018越挫越勇

从2018年到来就开始意识到2017年挺失败,自己不满意,不满意到心态已经崩了.在攀登科研之峰的路上越走越慢,越慢越抑郁. 今天大哭了一场,和男票聊了好久终于想开了,踏踏实实慢慢走吧,只要坚持总能看到一点点转机.励志的鸡汤就不写了,记录一下聊天的心得吧: 方法论: 男票说:"现在的论文主要都是一个思路:把先验知识融入到网络结构中.网络擅长学习分类分割等任务,但是有些先验知识很难学到或者学不好,需要设计到网络结构中,比如用乘法(attention).加法.位移(STN, Deformable Co

im2col:将卷积运算转为矩阵相乘

im2col:将卷积运算转为矩阵相乘 发表于 2019-04-26  更新于 2019-05-15  分类于 深度学习  阅读次数: 28 本文字数: 2.9k 博客:blog.shinelee.me | 博客园 | CSDN im2col实现 如何将卷积运算转为矩阵相乘?直接看下面这张图,以下图片来自论文High Performance Convolutional Neural Networks for Document Processing: im2col上图为3D卷积的传统计算方式与矩阵乘

CVPR2019论文看点:自学习Anchor原理

原论文链接:https://arxiv.org/pdf/1901.03278.pdf CVPR2019的一篇对anchor进行优化的论文,主要将原来需要预先定义的anchor改成直接end2end学习anchor位置和size.首先anchor的定义通常为(x, y, w, h) (x, y为中心点),formulate一下: 本文所提的guided anchoring利用两个branch分别预测anchor的位置和w.h: guided anchoring的主要内容有如下几点: Anchor

目标检测论文阅读:Deformable Convolutional Networks

https://blog.csdn.net/qq_21949357/article/details/80538255 这篇论文其实读起来还是比较难懂的,主要是细节部分很需要推敲,尤其是deformable的卷积如何实现的一步上,在写这篇博客之前,我也查阅了很多其他人的分享或者去github找代码,当然也不敢说完全了解了这种特殊的卷积--仅仅做一点自己的阅读心得与体会吧.这是一篇很有意义的工作,但是和深度学习很多论文一样,在读完之后内心也不免有着种种疑云. Deformable Convoluti

DPM(Deformable Parts Model)--原理(一)(转载)

DPM(Deformable Parts Model) Reference: Object detection with discriminatively trained partbased models. IEEE Trans. PAMI, 32(9):1627–1645, 2010. "Support Vector Machines for Multiple-Instance Learning,"Proc. Advances in Neural Information Proces

matlab中filter,conv之间的区别

conv是做卷积,就是按照书上的做法,先翻转,在一步步平移,得出结果.对于两个长度分别为n,m的序列,卷积结果长度为m+n-1 filter是做滤波,其实原理跟卷积是想通的,只不过处理结果的方法不同,先看示例程序: x=[1,2,3,4,5]; h=[1,1,1]; y1=conv(h,x) y2=filter(h,1,x) y3=filter(x,1,h) y4=filter(x,1,[h,zeros(1,4)]) 结果为: y1 = 1     3     6     9    12