PSPnet:Pyramid Scene Parsing Network——作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet

from:https://blog.csdn.net/bea_tree/article/details/56678560

2017年02月23日 19:28:25

阅读数:6094

首先声明,文末彩蛋,不是笔者提问的

1 一句话总结

作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet,另外本文提出了引入辅助loss的ResNet优化方法。

2 网络结构

本文提出的网络结构简单来说就是将DeepLab(不完全一样)aspp之前的feature map pooling了四种尺度之后 将5种feature map concat到一起经过卷积最后进行prediction的过程。

3 ResNet

本文除了网络之外,其ResNet的模型还是挺强的

如上图,首先作者在训练的时候加入了辅助loss,另外ResNet起始的7x7的卷积替换了三个3x3的卷积

4 实施细节

  • 使用了poly的学习策略,learning rate 0.01,power 0.9
  • momentum 0.9 weight decay 0.0001
  • random mirror
  • random resize [0.5,2]
  • random rotation [-10 degree,10 degree]
  • random gaussian blur
  • new caffe (batch size 16)
  • auxiliary loss weight to 0.4

5 Ablation study

作者通过实验,验证了文中各种设置的作用

5.1 psp net的作用(包括pooling的形式及数量)

5.2 auxiliary loss

5.3 pre-trained model

5.4 其他

6 知乎上的讨论

原文地址:https://www.cnblogs.com/bonelee/p/9031710.html

时间: 2024-11-05 18:39:03

PSPnet:Pyramid Scene Parsing Network——作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet的相关文章

mac下,mysql5.7.18连接出错,错误信息为:Access denied for user 'root'@'localhost' (using password: YES)

mac下,mysql5.7.18连接出错,错误信息为:Access denied for user 'root'@'localhost' (using password: YES)()里面的为shell中输入的命令,一定要输全包括:&等符号 第一步:苹果->系统偏好设置->最下面点MySQL,关闭mysql服务 第二步:进入终端输入(cd /usr/local/mysql/bin/)回车输入(sudo su)回车以获取管理员权限输入(./mysqld_safe --skip-grant

学生信息管理系统,Ubuntu下Codeblocks+wxWidgets编程

题目链接:https://oj.leetcode.com/problems/set-matrix-zeroes/ Given a m x n matrix, if an element is 0, set its entire row and column to 0. Do it in place. 一个个找肯定会超时,我们可以分别用一个行向量和一个列向量进行维护.这样O(m*n) 能出来 class Solution { public: void setZeroes(vector<vector

Django现有模型增加字段

对于Django已经存在的模型中需要增加一个字段,如何实现? 首先在model.py文件中找到对应的模型名称,加入需要增加的字段 然后python manage.py sqlall 数据库名 找到新增加的字段的sql语句,记录下来 再执行python manage.py shell 执行如下命令 from django.db import connection cursor=connection.cursor() cursor.execute('ALTER TABLE tablename ADD

Review of Semantic Segmentation with Deep Learning

In this post, I review the literature on semantic segmentation. Most research on semantic segmentation use natural/real world image datasets. Although the results are not directly applicable to medical images, I review these papers because research o

ECCV 2018 | 旷视科技提出统一感知解析网络UPerNet,优化场景理解

全球计算机视觉三大顶会之一 ECCV 2018(European Conference on Computer Vision)即将于 9 月 8 -14 日在德国慕尼黑拉开帷幕.届时,旷视首席科学家孙剑博士将带领团队远赴盛会,助力计算机视觉技术的交流与落地.本文介绍了旷视科技被 ECCV 2018 所接收的一篇论文,该论文提出了一种用于场景理解的统一感知解析网络--UPerNet. 论文名称:<Unified Perceptual Parsing for Scene Understanding>

深度学习(四)转--入门深度学习的一些开源代码

原文作者:aircraft 原文链接: 没错这篇又是转发的,因为觉得学习深度学习难免要从别人的代码开始,所以就转发了.不过转发的时候没找到原作者是谁,所以原作者看到不要打我-------QAQ 语义分割: Awesome Semantic Segmentation https://github.com/mrgloom/awesome-semantic-segmentation Semantic Segmentation Algorithms Implemented in PyTorch http

基于深度学习的图像分割在高德的实践

一.前言 图像分割(Image Segmentation)是计算机视觉领域中的一项重要基础技术,是图像理解中的重要一环.图像分割是将数字图像细分为多个图像子区域的过程,通过简化或改变图像的表示形式,让图像能够更加容易被理解.更简单地说,图像分割就是为数字图像中的每一个像素附加标签,使得具有相同标签的像素具有某种共同的视觉特性. 图像分割技术自 60 年代数字图像处理诞生开始便有了研究,随着近年来深度学习研究的逐步深入,图像分割技术也随之有了巨大的发展.早期的图像分割算法不能很好地分割一些具有抽象

CVPR 2017 Paper list

CVPR2017 paper list Machine Learning 1 Spotlight 1-1A Exclusivity-Consistency Regularized Multi-View Subspace Clustering Xiaojie Guo, Xiaobo Wang, Zhen Lei, Changqing Zhang, Stan Z. Li Borrowing Treasures From the Wealthy: Deep Transfer Learning Thro

短时间上手MongoDB

什么是MongoDB MongoDB是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统. 在高负载的情况下,添加更多的节点,可以保证服务器性能. MongoDB旨在为web应用提供可扩展的高性能数据存储解决方案. MongoDB将数据存储为一个文档,数据结构由键值(key=>value)对组成.MongoDB文档类似于JSON对象.字段值可以包含其他文档,数组及文档数组. ![](http://www.runoob.com/wp-content/uploads/2013/10/cru