location
对输入图像定位,找到盒子坐标(x,y,w,h);Clssificaion and Location的最后一层是的特征做两件事,一个是分类,一个是定位。
训练时使用已有的模型,也就是最后一层全联接之前所有的参数都用已有模型的,然后在这个基础上进行微调(fine tune),使其向着想要的网络去收敛。
分类时,softmax计算loss,随机梯度下降SGD反向传播更新参数。测试时同时得到分类得分和定位(坐标)。
回归模块(regression head)放在什么位置呢?选择不同的卷积神经网络,回归模块放的位置也是不一样的。可以用于box坐标定位,也可以用于姿势识别、人脸识别。
滑动窗口:实际要做scale变换,就是将图像缩小、放大,用同一个滑动窗口去检测。不同的神经网络对比(ResNet深度参差网络,层数越多Error越低)。
原文地址:https://www.cnblogs.com/zzx1905/p/CNN_Application.html
时间: 2024-10-18 23:12:57