论文笔记之：A CNN Cascade for Landmark Guided Semantic Part Segmentation

A CNN Cascade for Landmark Guided Semantic Part Segmentation

ECCV 2016

　　摘要：本文提出了一种 CNN cascade （CNN 级联）结构，根据一系列的定位（landmarks or keypoints），得到特定的 pose 信息，进行语义 part 分割。前人有许多单独的工作，但是，貌似没有将这两个工作结合到一起，相互作用的 multi-task 的工作。本文就弥补这个缺口，提出一种 CNN cascade 的 tasks，首先进行 landmark的定位，然后将这个信息作为输入，用于指导 semantic part segmentation。作者将这个结构用于 facial part segmentation，取得了显著的效果。代码将会很快放出，候选连接如下：http://www.cs.nott.ac.uk/~psxasj/

　　引言：就像摘要里提到的差不多，就是这个意思。不废话了。看看效果图，然后看看别人怎么做的。。。

　　本文的创新点写的很有特色，说解决了下面的两个问题：

　　1. Is a CNN for facial part segmentation needed at all ?

　　2. Can facial landmarks be used for guiding facial part segmentation, thus reversing the result metioned above ?

　　我们卖个关子（其实，我是想说，先装个逼，但是，。。。，忽略这句话吧，God），先不解释，希望看完后，读者能自己领悟到答案。

　　 The Proposed Method :

　　本文提出的 CNN 级联网络结构，如上图 4 所示，是一个 landmark localisation 网络，紧跟着是一个 facial part segmentation 网络结构。这个级联网络是基于 VGG-FCN 的，基于 CAFFE ，主要由两个部分构成：

　　1. 利用交叉熵损失函数（Sigmoid Cross Entropy Loss）进行 facial landmarks 的检测，这是一个 FCN 网络；

　　2. 第二，是受到 human pose estimation method 【1】的激发，检测到的 68 个定位点，编码成 68 个单独的 channels，这个 channels 在其对应的 landmark 位置有一个 2D Gaussian 。这 68 个channels 堆积在一起，和原始图像一起传送给 segmentation network。然后用标准的 Softmax loss 进行分割。

　　这里的【1】是：Human pose estimation with iterative error feedback. CVPR 2016

　　接下来，详细的介绍这两个网络架构：

　　Facial Landmark Detection：

时间： 2024-12-26 02:14:09

论文笔记之：A CNN Cascade for Landmark Guided Semantic Part Segmentation

论文笔记之：A CNN Cascade for Landmark Guided Semantic Part Segmentation的相关文章

【转】Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现

Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现（转）

深度学习论文笔记--Recover Canonical-View Faces in the Wild with Deep Neural Network

DL4NLP —— 看图说话（Image Caption）任务的论文笔记（一）评价指标和NIC模型

论文笔记 Deep Patch Learning for Weakly Supervised Object Classication and Discovery

Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

Deep Learning Face Representation from Predicting 10,000 Classes论文笔记

【论文笔记】Recursive Recurrent Nets with Attention Modeling for OCR in the Wild

论文笔记（1）——《Where's Wally?Precise User Discovery Attacks in Location Proximity Services》