语义分割之车道线检测Lanenet（tensorflow版）

Lanenet

一个端到端的网络，包含Lanenet+HNet两个网络模型，其中，Lanenet完成对车道线的实例分割，HNet是一个小网络结构，负责预测变换矩阵H，使用转换矩阵H对同属一条车道线的所有像素点进行重新建模

将语义分割和对像素进行向量表示结合起来的多任务模型，最近利用聚类完成对车道线的实例分割。

将实例分割任务拆解成语义分割和聚类，分割分支负责对输入图像进行语义分割（对像素进行二分类，判断像素属于车道线还是背景），嵌入分支对像素进行嵌入式表示,可将分割后得的车道线分离成不同的车道实例，训练得到的向量用于聚类。最后将两个分支的结果利用MeanShift算法进行聚类，得到实例分割的结果。

当得到车道实例后，就需要对每条线做参数描述，曲线拟合算法作为这个参数描述，常用的拟合算法有三次多项式，样条曲线，回旋曲线。为了提高拟合质量，通常将图像转到鸟瞰图后做拟合，再逆变换到原图。

1.语义分割

训练输出得到一个二值化的分割图，白色代表车道线，黑色代表背景。

设计模型时主要，主要考虑了以下两点：

1）在构建Label标签时，为了处理遮挡问题，将可能属于每条车道线对应的像素都连成线。好处是即使车道线被遮挡了，网络仍能预测车道位置。

2）Loss使用交叉熵，为了解决样本分布不均衡问题（属于车道线的像素远少于属于背景的像素），使用Bounded Inverse class weight 对 Loss进行加权：

Wclass=1ln(c + p(class))

其中，p为对应类别在总体样本中出现的概率，c是超参数。

2.实例分割
当分割分支识别得到车道后，为了分离车道像素（就是为了知道哪些像素归这条，哪些归那条车道），我们训练了一个车道instance embedding分支网络,我们用基于one-shot的方法做距离度量学习，该方法易于集成在标准的前馈神经网络中，可用于实时处理。利用聚类损失函数，instance embedding分支训练后输出一个车道线像素点距离，归属同一车道的像素点距离近，反之远，基于这个策略，可聚类得到各条车道线.

大致原理如下：

有两股力在做较量，一股是方差项，主要是将每个embedding往某条车道线的均值方向拉（激活拉这个动作的前提是embedding太远了，远于阈值δv就开始pull），另一股是距离项，就是使两个类别的车道线越远越好(激活推这个动作的前提是两条车道线聚类中心的距离太近啦，近于阈值δd就push)。最后这个总损失函数L的公式如下：

聚类

聚类可以看做是后处理，前一步的Embedding_branch 已经为聚类提供好了特征向量，利用这些特征向量可以用任何聚类算法完成实例分割的目标。

终止聚类的条件是：车道聚类（即各车道线间间距）中心间距离>δd,每个类（每条车道线）中包含的车道线像素离该车道线距离<δv 设置 δd > 6δv为迭代终止条件，使上述的loss做迭代。

网络架构

基于ENet的encoder-deconder模型，ENet由5个stage组成，其中stage2和stage3基本相同，stage1，2，3属于encoder，stage4，5属于decoder。

Lanenet网络共享前面两个stage1，2，并将stage3和后面的decoder层作为各自的分支进行训练。其中语义分割分支输出单通道的图像W*H*2。embedding分支输出N通道的图像W*H*N。两个分支的loss权重相同。

用H-NET做车道线曲线拟合
lanenet网络输出的是每条车道线的像素集合。常规处理是将图像转为鸟瞰图，这么做的目的就是为了做曲线拟合时弯曲的车道能用2次或3次多项式拟合（拟合起来简单些）。但变换矩阵H只被计算一次，所有图片使用相同变换矩阵，导致地平面（山地，丘陵）变化下的误差。

为了解决这个问题，需要训练一个可以预测变换矩阵H的神经网络HNet，网络输入是图片，输出是变换矩阵H：

通过置0对转置矩阵进行约束，即水平线在变换下保持水平。（坐标y的变换不受坐标x的影响）

意思就是通过H-Net网络学习得到的变换矩阵参数适用性更好，转置矩阵H只有6个参数，HNet输出一个6维向量，HNet由6层普通卷积网络和一层全连接层构成。

曲线拟合

通过坐标y去重新预测坐标x的过程：

。对于包含N个像素点的车道线，每个像素点pi=[xi,yi,1]T∈Ppi=[xi,yi,1]T∈P, 首先使用 H-Net 的预测输出 H 对其进行坐标变换：

P′=HPP′=HP

随后使用最小二乘法对 3d 多项式的参数进行拟合：

w=(YTY)−1YTx′w=(YTY)−1YTx′

根据拟合出的参数 w=[α,β,γ]Tw=[α,β,γ]T 预测出 x′∗ixi′∗

x′∗i=αy′2+βy′+γxi′∗=αy′2+βy′+γ

最后将 x′∗ixi′∗ 投影回去：

p∗i=H−1p′∗i

拟合函数

Loss=1/N∑Ni=1(x∗i−xi)2

模型网络设置(帧率达50fps)

LaneNet

Dataset : Tusimple embedding维度是4（输出4通道），δv=0.5，δd=3，输入图像resize到512x256，采用Adam优化器，batchsize=8，学习率=5e-4;

H-Net

Dataset : Tusimple,3阶多项式，输入图像128x64，Adam优化器，batchsize=10，学习率=5e-5；

评估标准：

accuracy=2/(1/recall+1/precision)

recall=|P1∩G1|/|G1| # 统计GT中车道线分对的概率

precision=|P0∩G0|/|G0| # 统计GT中背景分对的概率

设定 G1 代表 GT二值图里像素值为 1 部分的集合，P1 表示检测结果为 1 的集合。

fp=(|P1|−|P1∩G1|)/|P1| # 统计Pre中的车道线误检率

fn=(|G1|−|P1∩G1|)/|G1| # 统计GT车道线中漏检率

语义分割之车道线检测Lanenet（tensorflow版）的相关文章

语义分割之车道线检测（tensorflow版）

由于项目需要,参考了多篇相关车道线检测论文与源码,设计了一套Tensorflow版车道线检测功能. 二.基本结构: 该模型主要由以下部分组成: 1.数据源:包括所有原始数据,分组后的数据: 2.数据预处理:包括数据的准备,数据的导入,数据的提取,数据的分组(训练与测试): 3.配置文件:包括各种参数与超参数,如:训练周期,训练步长,批量数据,学习率,卷积核大小,全连接大小,训练模型存放路径(checkpoint),摘要存放路径(summary)等: 4.基础网络:包括基本

图像分割 - LaneNet + H-Net 车道线检测

本文是对论文的解读与思考论文: Towards End-to-End Lane Detection: an Instance Segmentation Approach introduction 该论文提出了一种端到端的实例分割方法,用于车道线检测: 论文包含 LaneNet + H-Net 两个模型网络,其中 LaneNet 是一种将语义分割和像素矢量化结合起来的多任务模型,语义分割用来分割车道线与背景,像素矢量化用于把属于同一条车道线的像素聚类在一起, H-Net 是

车道线检测资源

数据集 CULane Dataset https://xingangpan.github.io/projects/CULane.html BDD100K https://bdd-data.berkeley.edu/ 代码 Spatial CNN for Traffic Lane Detection https://github.com/XingangPan/SCNN 汇总 GitHub:车道线检测最全资料集锦 http://bbs.cvmart.net/articles/158/github-c

数字图像处理：基于霍夫变换的车道线检测

1 数字图像处理:基于霍夫变换的车道线检测 https://zhuanlan.zhihu.com/p/60190848 2 环境 2-1 安装 Anaconda3 环境 2-2 在Anaconda3 环境种安装开发IDE spyder 刚开始找不到spyder,但是我安装完vs code之后就出现了选择安装spyder的图标 2-3 安装opencv和contrib扩展库 2-4安装matplotlib库 https://blog.csdn.net/weixin_42116878/art

Udacity无人驾驶工程师试看课——车道线检测观后感

第一周的内容就是完成一个项目 Finding Lane Line,是免费试看的,网页版的,最多三四个小时就能看完. 讲的就是整个pipeline,一分钟视频版可以在这里看完:https://www.youtube.com/watch?v=xknesDIgOcA 或者看这个博客https://medium.com/udacity/udacity-self-driving-car-nanodegree-project-1-finding-lane-lines-719ac1adbed9 我也简单描述一

车道线检测文献解读系列(一) 基于机器视觉的高速车道标志线检测算法的研究_李晗

作者背景基于机器视觉的高速车道标志线检测算法的研究_李晗东北大学车辆工程硕士学位论文 2006年 [GB/T 7714]李晗. 基于机器视觉的高速车道标志线检测算法的研究[D]. 东北大学, 2006. DOI:10.7666/d.y852642.` 论文结构一览预处理灰度化 [亮点]模式判别选择日间模式还是夜间模式: 在每个检测周期开始时,首先判断采用日间模式还是夜间模式工作.摄像机视野中的上半部分为天空背景,天空亮度可以显著区分日间和夜间环境.由于天空的颜色为蓝离,日间天空的蓝色分

语义分割(semantic segmentation) 常用神经网络介绍对比-FCN SegNet U-net DeconvNet，语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类；目标检测只有两类,目标和非目标，就是在一张图片中找到并用box标注出所有的目标.

from:https://blog.csdn.net/u012931582/article/details/70314859 2017年04月21日 14:54:10 阅读数:4369 前言在这里,先介绍几个概念,也是图像处理当中的最常见任务. 语义分割(semantic segmentation) 目标检测(object detection) 目标识别(object recognition) 实例分割(instance segmentation) 语义分割首先需要了解一下什么是语义分割(s

车道线识别之 tusimple 数据集介绍

Tusimple 是一家做自动驾驶的公司,他也公布了一些其在自动驾驶领域积累的数据,其中有一些是和车道线检测相关的.2018年6 月份,其举办了一次以摄像头图像数据做车道检测的比赛,公开了一部分数据及其标注.数据下载数据是:https://github.com/TuSimple/tusimple-benchmark/issues/3 在其doc中可以发现数据个数的一些说明标注json 文件中每一行包括三个字段 raw_file : 每一个数据段的第20帧图像的的 path 路径 lanes 和

Tensorflow实现Mask R-CNN实例分割通用框架，检测，分割和特征点定位一次搞定（多图）

Mask R-CNN实例分割通用框架,检测,分割和特征点定位一次搞定(多图) 导语:Mask R-CNN是Faster R-CNN的扩展形式,能够有效地检测图像中的目标,同时还能为每个实例生成一个高质量的分割掩码. 对Facebook而言,想要提高用户体验,就得在图像识别上做足功夫. 雷锋网此前报道<Facebook AML实验室负责人:将AI技术落地的N种方法>(上 ,下篇)就提到,做好图像识别,不仅能让Facebook的用户更精准搜索到想要的图片,为盲人读出图片中包含的信息,还能帮助用户在