CS231n笔记 Lecture 11, Detection and Segmentation

Other Computer Vision Tasks

Semantic Segmentation. Pixel level, don‘t care about instances.
Classification + Localization. Single object.
Object Detection. Multiple object.
Instance Segmentation. Multiple object.

Semantic Segmentation

Simple idea: sliding window, crop across the whole image, and ask what the center pixel is. Expensive.

Fully Convoltional (Naive) : let the network to learning all the pixels at once, keep the spacial size, convolutions at original image resolution, expensive.

Fully convolutional: Design network as a bunch of convolutional layers, with downsampling and upsampling inside the network!

Downsampling: Pooling, strided convolution
Upsampling: Unpooling (nearest neighbor, bed of nails, max unpooling in symetrical NN), Transpose convolution (multiply the filter by the pixels on the input, use stride and pad to impose the value on the output).

　　

Classification + Localization

Get class scores and box coordinates from the CNN, treat localization as a regression problem, we have 2 loss!

Aside: Human Pose Estimation, for different position, multitask loss.

Object Detection

Since we have different numbers of objects present, it‘s impossible to use regression. Naively, sliding window.

R-CNN: Based on tranditional techniques in CV, gives thousands proposal region, much better.

Fast R-CNN: Region crop after ConvNet.

Faster R-CNN: Proposal Region Network.

YOLO/SSD: base grids.

Instance Segmentation

Mask R-CNN

原文地址：https://www.cnblogs.com/ichn/p/8504452.html

时间： 2024-10-29 21:27:06

CS231n笔记 Lecture 11, Detection and Segmentation的相关文章

CS231n笔记 Lecture 9, CNN Architectures

Review: LeNet-5 1998 by LeCun, one conv layer. Case Study: AlexNet [Krizhevsky et al. 2012] It uses a lot of mordern techniques where is still limited to historical issues (seperated feature maps, norm layers). Kind of obsolete, but it is the first C

0801-----C++Primer听课笔记----------C++11新特性 function 和 bind 的简单使用

1.function 和函数指针 1.1 function有函数指针的功能,但是使用起来明显比函数指针更加灵活和方便. 1.2 函数指针和function的用法实例. 1.2.1 函数指针首先要清楚函数指针的类型,如void (*)(int, char)等,然后声明一函数指针变量直接调用即可. #include <iostream> using namespace std; /* * 函数指针的用法 */ void test(int i,double j){ cout << i

Java笔记（11）

day1 -- day3 XML Java基础加强 day4 -- day7 Servlet编程 day8 -- day10 JSP 综合案例 day11 -- day16 MySQL 数据库练习SQL语句 JDBC编程关系化数据模型? 常见关系化数据库有哪些? 收费产品免费产品 Microsoft SQL Server : 微软公司产品,中等规模数据库收费产品,运行在windows平台上 --- .net平台+SQLServer进行开发 Oracle :甲骨文公司产品,大型商业数据层,

Oracle基础知识笔记（11）建表、更新、查询综合练习

有某个学生运动会比赛信息的数据库,保存了如下的表: 运动员sporter(运动员编号sporterid,运动员姓名name,运动员性别sex,所属系号department) 项目item(项目编号itemid,项目名称itemname,项目比赛地点location) 成绩grade(运动员编号id,项目编号itemid,积分mark) 请用SQL语句完成如下功能: 1. 建表,并在相应字段上增加约束: 定义各个表的主键和外键约束: 运动员的姓名和所属系别不能为空: 积分要第为空值,要么为6,4

《浪潮之巅》读书笔记——第11章摩托罗拉

第11章摩托罗拉公司发展 1928创立原名高尔文制造公司基因注重技术和品质 1947 改名摩托罗拉 2011 拆分为摩托罗拉移动和摩托罗拉解决方案两个独立上市公司 2011 Google收购摩托罗拉移动获得大量专利扭转了苹果和微软的专利战产品最早是做汽车收音机 Motorola是其品牌给军方做便携式无线通信工具步话机二战前模拟无线通信的老大(无线双工霸主) 1946 汽车电话 1958 汽车对讲机

CSS自学笔记（11）:CSS3背景和边框

CSS3 背景在CSS3中新增了多个关于背景的属性,可以让我们对背景有了更多更好的操作,减少用第三方工具对背景图片进行修改美化. CSS3中主要是通过定义backgrounp中的各个属性来控制背景(高宽,位置,透明度----). 关于背景的部分常用属性有(*为CSS3中新增属性): 值描述 background-color 规定要使用的背景颜色. background-position 规定背景图像的位置. background-size* 规定背景图片的尺寸. background-rep

CS231n笔记4-Data Preprocessing, Weights Initialization与Batch Normalization

Data Preprocessing, Weights Initialization与Batch Normalization Data Preprocessing Weights Initialization与Batch Normalization 数据预处理Data Preprocessing 权重初始化Weights Initialization 让权重初始化为0 0方差1e-2标准差 0方差1标准差 Xavier Initialization 再改进批归一化Batch Normaliza

[论文理解]Region-Based Convolutional Networks for Accurate Object Detection and Segmentation

Region-Based Convolutional Networks for Accurate Object Detection and Segmentation 概括这是一篇2016年的目标检测的文章,也是一篇比较经典的目标检测的文章.作者介绍到,现在表现最好的方法非常的复杂,而本文的方法,简单又容易理解,并且不需要大量的训练集. 文章的大致脉络如图. 产生region proposal 文章提到了滑窗的方法,由于滑窗的方法缺点非常明显,就是每次只能检测一个aspect ratio,所以确

cs231n笔记：线性分类器

cs231n线性分类器学习笔记,非翻译,根据自己的学习情况总结出的内容: 线性分类本节介绍线性分类器,该方法可以自然延伸到神经网络和卷积神经网络中,这类方法主要有两部分组成,一个是评分函数(score function):是原始数据和类别分值的映射,另一个是损失函数:它是用来衡量预测标签和真是标签的一致性程度.我们将这类问题转化为优化问题,通过修改参数来最小化损失函数. 首先定义一个评分函数,这个函数将输入样本映射为各个分类类别的得分,得分的高低代表该样本属于该类别可能性的高低.现在假设有一个

猜你喜欢

这就是焦距

XX公司在线笔试题编程题之一

题目: #include <iostream> #include <vector> #include <string> #include <list> ...

ajax页面数据的传递

在上一篇文章中,简单提到了ajax的工作流程,那么在这里我们就得实战一回了,真正将ajax的用途展现出来,这一整套流程就是在页面上触发一个ajax事件,然后发送请求,紧接着到数据库读取数据,返回值,然 ...

TCP为何采用三次握手来建立连接，若采用二次握手可以吗

1. TCP简介 TCP(Transmission Control Protocol 传输控制协议)是一种面向连接(连接导向)的.可靠的.基于IP的传输层协议,采用三次握手确认建立一个连接. TCP为 ...

BZOJ_3527_[ZJOI2014]_力_(FFT+卷积)

描述题面: http://wenku.baidu.com/link?url=D2ORnA9xjgSxa2GlYLB7gGiYgBcXsy-Aw0kVYTjTE-iYhH1s7h8xXGmnaMwl3 ...

hdu 5148 Cities(树形dp)

题目链接:hdu 5148 Cities dp[i][j]表示以i为根节点,选j个最优值,每条边被选中的时候就计算出被经过的次数,并乘上权值. #include <cstdio> #inc ...

puts "Mary had a little lamb. " puts "It's fleese was white as #{'snow'}." puts ...

计算机网络哪些事

1.思科路由器配置有哪些大的方向? 在我们的计算机网络配置中,或者小型企业中,主要干的事情就是组网.组网里面涉及到很多问题.第一个就是如何划分局域网.第二个就是局域网与局域网如何连接.第三个就是内网和 ...

文本框脚本 - select 事件

HTML中,用两种方式来表示文本框: input 单行文本.textarea 多行文本那么在文本中存在哪些事件尼? 1 select 都支持但是其触发的时机不一样 IE9+ .Safair ...

临时暂存信息

[KEY TOPIC] Official LEGO Sets made in LDD - LEGO Digital Designer and other digital tools - Eurobri ...

SCRUM 12.19

我们的爬虫依然存在一些问题,我们决定暂时将大家的工作重心放在爬虫上. 新的任务分配如下成员原本任务新任务彭林江落实API 研究美团爬虫郝倩研究遍历美团数据方法研究遍历美团数据方法牛强 ...

匿名用户上传文件

实验2允许匿名用户上传文件实验环境在虚拟机Linux 6.5系统下需要2台Linux系统一台A作为服务端一条B作为测试客户端开启2台Linux系统. 实验目标 A作为服务端配置VSFTPD服务器实 ...

CSS中的相关概念

CSS的几个概念: 包括块:一个元素的"布局上下文".对于正常的HTML文本流中的一个元素,包括块由近期的块级祖先框.表单元格或行内块祖先框的内容边界(content edge)构 ...

[React Fundamentals] Component Lifecycle - Updating

The React component lifecycle will allow you to update your components at runtime. This lesson will ...

SQL - 内连接与外连接

PDF下载地址:SQL-内连接与外连接.pdf 连接查询在关系型数据库中经常用到,是多表联合查询的基础. 主要包含:内连接,外连接,交叉连接. SQL - 内连接与外连接内连接等值连接不等值连接 ...

广度搜索（2）

Description The GeoSurvComp geologic survey company is responsible for detecting underground oil dep ...

洛谷——P2615 神奇的幻方【Noip2015 day1t1】

https://www.luogu.org/problem/show?pid=2615 题目描述幻方是一种很神奇的N*N矩阵:它由数字1,2,3,……,N*N构成,且每行.每列及两条对角线上的数字之 ...

杭电1003动态规划

抄过来的学习下: import java.util.Scanner; /* O(N^3)这中方法就是采用暴力法咯,把所有情况都列出来!假设我们要求i--j这段下标的序列和,i从1-n,j也从1-n,有 ...

今天折腾了下NodeJs的调试

写个NodeJs的小应用,查到了同学写的服务器端的调试方法,折腾用了下Chrome调试,还不错. 我们写JS代码调试的时候一般都用谷歌浏览器内置的调试工具,nodejs程序也可以这样子来调试,但是首先 ...

201671010111 2016-2017-2《Java程序设计》关于Java继承学习的困难

上周的实验编程题有一道是应用继承来实现图形边长以及面积计算的,还有一道是编制一个程序,将身份证号.txt 中的信息读入到内存中,输入一个身份证号或姓名,查询显示查询对象的姓名.身份证号.年龄.性别和出 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.