• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

ICCV'23 | MetaBEV传感器故障解决港大和amp;诺亚新方案

武飞扬头像
CV技术指南
帮助1

前言 现代自动驾驶车辆的感知系统通常从互补的多模态传感器(如LiDAR和摄像机)获取输入。然而,在现实应用中,传感器损坏和故障会导致性能低下,从而影响自动驾驶的安全性。本文提出了一个鲁棒框架,称为MetaBEV,以解决极端的现实世界环境,包括整体六个传感器损坏和两个极端传感器失踪的情况。在MetaBEV中,来自多个传感器的信号首先由特定于模态的编码器处理。随后,初始化一组密集的BEV查询,称为meta-BEV。然后,这些查询被一个BEV-Evolving解码器迭代地处理,该解码器有选择地从LiDAR、摄像机或两者的模态中聚合深层特征。更新后的BEV表示将进一步用于多个3D预测任务。

本文转载自自动驾驶之心

仅用于学术分享,若侵权请联系删除

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班 全面上线!!

1前沿速览 ICCV2023|MetaBEV: 为BEV检测与地图分割解决传感器故障

论文:arxiv.org/pdf/2304.09…
代码:github.com/ChongjianGE…
作者单位:香港大学 华为诺亚方舟实验室 大连理工大学

学新通

2论文思路:

本文提出一种新的M2oE结构,以缓解多任务联合学习中不同任务的性能下降。最后,使用nuScenes数据集,用3D目标检测和BEV地图分割任务对MetaBEV进行评估。实验表明,在完全和损坏的模态上,MetaBEV都比先前的技术有很大的优势。例如,当LiDAR信号缺失时,MetaBEV在vanilla BEVFusion[25]模型的基础上改进了35.5%的检测NDS和17.7%的分割mIoU;而在没有相机信号的情况下,MetaBEV仍然达到了69.2%的NDS和53.7%的mIoU,这甚至比之前在全模态上进行的工作还要高。此外,MetaBEV在规范的感知和多任务学习环境中都比以前的方法表现良好,使用70.4% mIoU刷新了最新的nuScenes BEV map分割技术。

3主要贡献:

MetaBEV是一种新颖的BEV感知框架,用于3D目标检测和BEV地图分割,可以在任意传感器输入下保持弹性(resilient)性能。为了验证其鲁棒性,大量的实际传感器损坏被制作出来并进行了系统的实验和分析。

在训练权重相同的情况下进行三维检测和分割任务时,MetaBEV利用M2oE结构来缓解任务冲突。

MetaBEV在nuScenes数据集[3]上实现了最先进的性能。这是第一个同时针对传感器故障和任务冲突而设计的方法。本文希望MetaBEV能促进未来的研究。

4网络设计:

本文提出MetaBEV在统一的鸟瞰图(BEV)表示空间[18]中通过模态-任意和任务-不可知的学习来解决上述的特征错位和全模态依赖问题。本文认为模态相关(modality-dependent)方法的主要瓶颈是缺乏能够通过融合模块实现不同模态独立融合的设计。因此,本文提出了一种模态-任意BEV-Evolving解码器,它利用跨模态注意力将可学习的meta-BEV查询与单个摄像机特征、LiDAR-BEV特征或两者结合起来,以消除瓶颈。最后,本文应用一些特定任务的头来支持不同的3D感知预测。

学新通

图3:MetaBEV框架的概述。多模态输入分别由摄像机编码器 和LiDAR编码器 进行处理,以产生 的BEV表示。为了生成融合的BEV特征,BEV-Evolving decoder采用多模态BEV表示和一个外部初始化的meta-BEV特征(作为一个查询特征)进行相关计算。特定任务的头采用融合的特征进行3D检测。

学新通

图4:BEV-Evolving block的详细说明。在跨模态可变形注意力层中,本文结合了特定于模型的MLP层,从而能够灵活地计算任意模态的采样偏移量和注意力权值。在FFN层,本文引入了两种MoE选项来缓解多任务学习中的任务冲突。

5实验结果:

学新通

学新通

学新通

学新通

学新通

学新通

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

CV的未来发展方向?平时最喜欢逛的几个地方

训练网络loss出现Nan解决办法

比Meta「分割一切AI」更全能!港科大版图像分割AI来了:实现更强粒度和语义功能

Segment Anything项目整理汇总

Meta Segment Anything会让CV没前途吗?

CVPR'2023年AQTC挑战赛第一名解决方案:以功能-交互为中心的时空视觉语言对齐方法

6万字!30个方向130篇 | CVPR 2023 最全 AIGC 论文汇总

知识蒸馏最新进展

ICCV2023 | 当尺度感知调制遇上Transformer,会碰撞出怎样的火花?

CVPR 2023 | 完全无监督的视频物体分割 RCF

新加坡国立大学提出最新优化器:CAME,大模型训练成本降低近一半!

SegNetr来啦 | 超越UNeXit/U-Net/U-Net /SegNet,精度更高模型更小的UNet家族

ReID专栏(二)多尺度设计与应用

ReID专栏(一) 任务与数据集概述

libtorch教程(三)简单模型搭建

libtorch教程(二)张量的常规操作

libtorch教程(一)开发环境搭建:VS libtorch和Qt libtorch

NeRF与三维重建专栏(三)nerf_pl源码部分解读与colmap、cuda算子使用

NeRF与三维重建专栏(二)NeRF原文解读与体渲染物理模型

NeRF与三维重建专栏(一)领域背景、难点与数据集介绍

异常检测专栏(三)传统的异常检测算法——上

异常检测专栏(二):评价指标及常用数据集

异常检测专栏(一)异常检测概述

BEV专栏(二)从BEVFormer看BEV流程(下篇)

BEV专栏(一)从BEVFormer深入探究BEV流程(上篇)

可见光遥感图像目标检测(三)文字场景检测之Arbitrary

可见光遥感目标检测(二)主要难点与研究方法概述

可见光遥感目标检测(一)任务概要介绍

TensorRT教程(三)TensorRT的安装教程

TensorRT教程(二)TensorRT进阶介绍

TensorRT教程(一)初次介绍TensorRT

AI最全资料汇总 | 基础入门、技术前沿、工业应用、部署框架、实战教程学习

计算机视觉入门1v3辅导班

计算机视觉交流群

聊聊计算机视觉入门

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhgecjcj
系列文章
更多 icon
同类精品
更多 icon
继续加载