PriorLane: A Prior Knowledge Enhanced Lane Detection ApproachBased on Transformer

news/2024/7/19 11:15:55 标签: transformer, 深度学习

Abstract

在本文中,我们采用了一种仅限变压器的车道检测方法,因此它可以受益于

vision transformer

的蓬勃发展,并通过微调在大数据集上完全预训练的权重,在CULane和TuSimple基准上实现了最先进的(SOTA)性能。

更重要的是,本文提出了一种新颖的通用框架PriorLane,该框架通过引入低成本的局部先验知识来提高全视觉转换器的分割性能。

知识嵌入对齐(KEA)模块可以通过对齐知识嵌入来提高融合性能。

本文采用带有分层编码器的纯视觉Transformer对图像中的车道标记进行分割,称为混合Transforme(MiT)

提出了一种称为PriorLane的通用融合框架,利用先验知识来提高MiT块的性能。

局部先验知识数据用鸟瞰视图(BEV)中的网格图表示,然后PriorLane将网格图切割成patches,然后用可训练的线性投影进行映射

设计了一个相应的知识嵌入对齐(KEA)模块,对嵌入进行空间对齐。

Contributions

 

采用一种新型的融合变压器(FT),将通过MiT块提取的图像特征与先验知识数据的嵌入进行融合。

采用多层感知器(MLP)块,将融合后的特征与纯MiT特征进行合并,并输出分割预测的像素级结果。

  据我们所知,我们首次采用了只有Transformer的架构来进行车道检测,它可以受益于Transformer预训练的发展,

  提出了一种新的通用框架PriorLane,通过将图像特征与低成本的局部先验知识相结合,提高了车道分割的性能

KEA块进一步用于先验知识对齐

III. METHOD

Mix Transformer

生成分层特征

Knowledge Embedding Alignment.

知识嵌入对齐。由于车辆的位置比较粗糙,因此很难确定在BEV中嵌入的与摄像机视图相一致的参考知识。为了解决这个问题,需要一个知识嵌入对齐(KEA)模块来将知识嵌入与图像特征进行空间对齐

Fusion Transformer.

Architecture on benchmarks

ARFs)和ORpool[24]、[25]分别从先验知识嵌入中提取方向信息并保持旋转信息不变

带有一个通道的网格地图,而0/1表示相应的网格是否在道路自由空间中

这样,先验知识被呈现为“大图像”,一旦给出感知范围,局部先验知识可以表示为较小的知识。

 

Knowledge Embedding.

首先,我们将局部网格地图数据M∈RH×W×C切成补丁,每个补丁的大小是P×P。此外,每个补丁转换成一个向量大小1××线性投影,因此当地先验知识表示为“知识嵌入”,用X表示,相应的大小为(H/P)×(W/P)×Ep。

C. Knowledge Embedding Alignment

在本节中,空间变压器网络(STN)[23]被调整用于对齐KEA模块中的嵌入。STN可以根据定位网络得到的仿射变换矩阵对先验知识的嵌入进行操作,从而提高先验知识与图像特征的融合性能。

IV. EXPERIMENTS

D. Ablation Study

Number of Encoder Layers.

知识编码器层可以作为特征细化器,更深的层产生更高的语义特征,有助于分割性能。然而,较大的L1降低了模型的泛化性,导致峰值后mIoU的降低。

Inflfluence of Perception Range.

但该距离内的图像分辨率较低,模型难以计算出低分辨率特征与相应的先验知识之间的注意力,因此,当感知范围太大时,注意力会降低。


http://www.niftyadmin.cn/n/764639.html

相关文章

电脑乱码怎么修复_笔记本电脑充不进去电怎么回事 如何修复

今天笔者主要来跟大家讨论一下关于电脑的问题,有时候可能我们笔记本电脑没电了,插电进行充电却怎么也充不进去电,是怎么回事呢?要怎么办。一、原因分析1、软件问题 一般来说,很多电脑品牌如 戴尔 、联想、索尼等&#…

struct lnode是什么结构类型_C/C++编程笔记:C语言成绩管理系统,链式结构体管理系统源码分享...

最近很多同学因为学校的要求,需要完成自己的那个C语言课程设计,于是就有很多人私信或者加我私聊我,问的最多的还是《学生成绩管理系统》,其实当你项目写多了你就会发现:其实各类的管理系统都离不开一个核心——链表&am…

python自动化_Python编程快速上手——让繁琐的工作自动化

Python是一种解释型,面向对象,动态数据类型的高级程序设计语言,这几年python极其火爆,应用也非常的广泛,例如:爬虫,数据分析,科学计算,人工智能等python都能胜任&#xf…

pyqt速成(一)

第一个程序: import sysfrom PyQt5.QtWidgets import QApplication, QWidgetif __name__ __main__:app QApplication(sys.argv)w QWidget()# 设置窗口标题w.setWindowTitle("第一个PyQt")# 展示窗口w.show()# 程序进行循环等待状态app.exec()import s…

可移除 否_iFix拆解显示iPhone 12和12 Pro显示屏和电池可相互更换

据外媒报道,在本周早些时候直播了iPhone 12和iPhone 12 Pro的拆解后,iFixit今日(当地时间10月24日)提供了一个更深入的拆解过程从而对新设备的所有组件进行分析以此揭示两者的一些相似之处。iFixit进行的早期测试显示,iPhone 12和12 Pro显示屏…

[蓝桥杯 2021 国 ABC] 123

[蓝桥杯 2021 国 ABC] 123 题目描述 小蓝发现了一个有趣的数列, 这个数列的前几项如下: 1,1,2,1,2,3,1,2,3,4,…1,1,2,1,2,3,1,2,3,4, \ldots1,1,2,1,2,3,1,2,3,4,… 小蓝发现, 这个数列前 111 项是整数 111 , 接下来 222 项是整数 111 至 222 , 接下来 333 项是整数 111 至…

arcgis字段取最大值 公式_51GIS学院ArcGIS水文分析实战教程(1)GIS与水文学

对于大部分GIS从业人员或者利用GIS作为研究方向的人员来说,水文学过于专业,更偏重于理论化,很难从GIS的角度来模拟和分析水文的过程。这其实是个普遍性的问题,任何跨专业跨学科去解决问题,都是需要付出极大的代价的&am…

电脑常见故障处理_疫情期间,修电脑上门费200,修不修都是200,你还修吗?

近期,大白得到这样一个信息,就是在某地,近期上门维修电脑,上门费200元,修不修都是200元,意思能否修好上门费都要200元,维修费用另计。拿命在修电脑,好吧,可以理解&#x…