什么样的方案,夺得了 CVPR 自动驾驶挑战赛冠军?
2023-06-19 19:14:27来源:ZAKER科技
机器之心报道
编辑:小舟
【资料图】
自动驾驶中的三维占用预测难题,一场比赛给出了解决方案。
道路错综复杂、交通工具形态各异、行人密集,这是当前城市道路交通的现状,也是自动驾驶领域面临的现实挑战。为了应对这一挑战,感知和理解三维环境至关重要。
在传统的三维物体检测任务中,前景物体通常由三维边界框表示。然而,这种方法存在一些弊端,一方面,现实世界的物体几何形状非常复杂,无法用简单的三维框表示;另一方面,这种方法容易忽略背景元素的感知。对于实现全面的 L4/L5 自动驾驶,传统的三维感知方法是远远不够的。
最近,端到端自动驾驶研讨会 ( End-to-End Autonomous Driving Workshop ) 联合视觉中心自动驾驶研讨会 ( Vision-Centric Autonomous Driving Workshop ) 在 CVPR 2023 上举办了自动驾驶挑战赛,其中就包括三维占用预测(3D occupancy prediction)赛道。
图 1 CVPR2023 自动驾驶挑战赛三维占用预测是自动驾驶领域的新兴任务,要求对车辆行驶场景进行细粒度建模,对于实现自动驾驶的通用感知能力有着重要意义。比赛提供基于 nuScenes 数据集的大规模占用预测评估基准,对三维空间进行体素化表示,并在三维占用任务的基础上结合两项新任务:估计三维空间中体素的占据状态和语义信息。整个任务旨在在给定多视角图像的情况下对三维空间进行密集预测。
本次比赛是三维占用感知领域的首个国际顶尖权威赛事,吸引了业界和学界的广泛关注。比赛共有 149 个团队参与角逐,其中包括来自小米汽车,华为,42dot,海康威视的业界团队,也有来自北京大学,浙江大学,中国科学院等科研院所的学术界团队。
最终,来自英伟达 ( NVIDIA ) 和南京大学的团队在激烈的竞争中脱颖而出,同时赢得了三维占用预测任务的冠军和最佳创新奖两个重磅奖项。下面我们来看一下冠军团队的获奖方案。
冠军方案
不同于以往比赛对于数据利用方面的限制,本次自动驾驶比赛允许参赛者使用额外的开源数据或者模型进行数据驱动算法的探索。因此在本次比赛中,英伟达和南大的研究人员在设计高效的模型结构的基础上,也在大模型的训练方面进行了探索,将模型参数扩展到 10 亿量级,达到过去常用 3D 感知模型的 10 倍以上。
凭借先进的模型结构设计和大模型强大的表征能力,该团队提出的方案 FB-OCC 实现了单模型 50+% mIoU 的出色性能,并最终取得了 54.19% mIoU 的最佳成绩。
网络架构
FB-OCC 的主要创新在于使用了前向和后向投影相结合的三维空间建模方式。
如图 2 所示,在前向投影过程中,参考 LSS 投影范式,FB-OCC 会根据每个像素的深度分布生成场景对应的三维体素 ( 3D voxel ) 表征。同时,由于 LSS 范式生产的特征倾向于稀疏且不均匀,FB-OCC 引入反向投影机制来优化稀疏的场景特征。
图 2 网络架构图此外,考虑到计算负担,FB-OCC 在方向投影的过程中会将场景特征压缩为鸟瞰图 ( BEV ) 表征,最后将三维体素表征和鸟瞰图表征相结合。结合后得到的三维体素特征在后续还会经过额外的体素编码器 ( Voxel encoder ) 来增强特征感受野。
大规模模型探索
增加模型参数量是提升模型精度的最便捷的方式,但在三维视觉感知领域,研究人员发现更大规模的模型更容易产生过拟合现象,而现有主流感知模型的参数仍在 100M 量级。
在本次比赛中,FB-OCC 模型尝试使用 10 亿参数量级的 InternImage 主干网络,模型总体参数量是现有常用模型的十倍以上。大模型训练通常需要大数据与之匹配,但受限于自动驾驶数据采集标注的高昂成本,开源的三维感知数据集并不足以支撑 10 亿参数规模的模型。
针对这个痛点,FB-OCC 使用了多轮预训练机制。由于可获取的二维感知数据集远远丰富于三维感知数据,FB-OCC 首先在大规模开源数据集 Objects365 上进行通用目标检测预训练。然后,如图 3 所示,FB-OCC 引入深度和语义联合预训练来建立二维感知和三维感知的桥梁。
图 3 深度和语义联合预训练为了生成语义分割标签,FB-OCC 还使用 Meta 的 SAM 模型来进行自动标注,分别使用框提示和点提示来生成不同类别的语义。经过多轮预训练后,大规模模型在占用感知任务上可以避免严重的过拟合问题。
实验结果
研究团队在实验中证明了 FB-OCC 的出色性能。如表 1 所示,FB-OCC 在 ResNet-50 主干网络以及 256x704 分辨率的输入图像下,借助时序融合、深度监督等技术,模型性能从最初的 23.12% mIoU 增长至 42.06% mIoU。
表 1 小规模模型的消融实验结果为了获得更好的精度,FB-OCC 使用了更大参数量的模型。如表 2 所示,在 400M 的模型规模下,FB-OCC 获得了单模型 50+% mIoU 的效果。借助 InternImage 主干网络,10 亿参数量级的模型进一步取得了 52.79% 的极佳效果。
表 2 不同模型规模下的效果最终,FB-OCC 多个模型的集成结果取得了目前测试集上最高的准确率 —— 54.19%,赢得了比赛的冠军并被授予最佳创新奖。FB-OCC 为自动驾驶中复杂的三维占用预测问题贡献了新的思路。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
责任编辑:hnmd003
相关阅读
相关阅读
-
什么样的方案,夺得了 CVPR 自动驾驶挑战赛冠军?
机器之心报道编辑:小舟自动驾驶中的三维占用预测难题,一场比赛给出了
-
聚焦:马云非公开会议内容首次曝光:“淘天”架构要扁平化,谁有阻力我来搞定
回归淘宝、回归用户、回归互联网。文丨祝颖丽编辑丨高洪浩《晚点LatePo
-
银行人的“存款保卫战”:利率一降再降,拉存款难上加难|今亮点
本文来源:时代周报作者:阿力米热不论是线上还是线下,银行理财经理疯
-
当前最新:楼阳生到省地质研究院调研
6月19日,省委书记楼阳生到省地质研究院,调研地质科学创新、事业单位
-
wtkj是什么意思 天天热议
欢迎来到本次问答,我将为大家详细解答“wtkj到底代表什么”的问题。科
-
银行人的“存款保卫战”:利率一降再降,拉存款难上加难-速讯
不论是线上还是线下,银行理财经理疯狂开启了揽客模式,激情营销。“三
-
当前短讯!年金保险需要健康告知吗?到期后可取出来吗?
在购买年金保险时,通常需要填写健康告知表或进行健康问询。 健康告知
-
抖音Vs美团:生活服务之战“醉翁之意不在酒” 世界快资讯
图片来源@视觉中国生活服务赛道的双雄对决,激战正酣。日前,据《晚
-
环球快看点丨小米折戟印度,九年白干了?
“进印赶考”快十年,人们似乎习惯了小米在印度市场的高歌猛进。所
-
新华全媒+|新疆裕民:夏粮收购“钱等粮”保丰收
近期,新疆多地夏粮收购在即,中国农业发展银行新疆分行充分发挥粮食收
-
海南椰岛法定代表人变更段守奇接替王晓晴|世界热门
近日,海南椰岛(600238)发生工商变更,法定代表人由王晓晴变更为段守
-
全球即时:贾跃亭“9年诈骗”计划:薛定谔的220万豪车,与被“割”的央视大楼设计师家族
从FF屡次延期交付的背后,是巨大的资金问题的投射,如果未来贾老板不能
-
讯息:卷王极兔,快递中间商难赚差价
图片来源@视觉中国文|商业数据派,作者|刘俊宏近日,极兔速运(以下称
-
极星成立战略合资企业 持续加速中国市场发展
2023年6月19日,上海——全球豪华纯电高性能汽车品牌Polestar极星(纳
-
8.7 亿元!华为成立新公司,所属行业的中国产销规模处全球之首 焦点热门
华为的业务涵盖了电信设备、消费者业务、企业业务和云服务等多个领域。
-
ROG 掌机震撼发布,多项全能搭配显示器,解锁超多玩法-世界今头条
6月13日,华硕ROG玩家国度召开了夏季新品发布会。本次发布会以尽掌控·
-
苹果股价重返历史高位,能否保持“避风港”属性取决于业绩的持续性
红周刊本刊编辑部|张一雪2023苹果全球开发者大会(WWDC)结束一周后,
-
长江、珠江流域或现超警以上洪水 水利部针对10省区启动水旱灾害防御Ⅳ级应急响应
中国能源新闻网是由国家能源局主管,中国电力报社、中电传媒股份有限公
-
环球热点评!华住与法国雅高合作的两家杭州酒店开业 宜必思3年内将达500家店
据华住集团方面透露,截至2023年3月,双方合作在营酒店472家,待开业酒
-
养老年金和养老保险一样吗?冲突吗?|天天新资讯
不一样。 虽然养老年金和养老保险都与养老有关,但它们在概念和运作方
-
世界观焦点:养老保险是企业年金吗?怎么买最划算?
不是。 养老保险和企业年金虽然都与养老有关,但并不完全相同。养老保
-
每日快报!太平洋鑫享福年金保险怎么样?怎么领取?
太平洋鑫享福年金保险是一款长期储蓄型养老保险,具有以下几个突出特点
-
安联安享丰年年金保险怎么样?怎么买? 环球快播报
安联安享丰年年金保险是一款备受认可的养老保险。 它提供了稳定的长期
-
国泰航空公布改善举措:决定招聘内地空乘!8月起内地航班均有普通话广播_环球最新
据媒体报道,6月19日,国泰航空(00293 HK)行政总裁林绍波向全体员工
-
全球焦点!职业年金和养老保险一样吗?退休时能拿回吗?
不一样。 1、性质不同:职业年金补充养老保障制度,养老保险是国家和社
-
续航620km 上汽通用别克E4将今日上市
续航620km上汽通用别克E4将今日上市日前,车质网从上汽通用别克官方获
-
天津拟调整公积金贷款上限:首套房最高可贷100万元
近日,天津市住房公积金管理中心发布公告,对个人住房公积金贷款、提取
-
央视曝光原神动漫计划,中国影视之夜提前爆料
央视在中国影视之夜上揭幕:《原神》动漫将于2023年上映。
-
【热闻】苹果:将升级 iPhone 15 硬件,积极为头显铺路
6月19日消息,知名分析师郭明錤刚刚发文指出,苹果将积极升级硬件产品
-
环球微头条丨大模型 2.0 时代的优化与突破
贝克街探案官作者车行运大模型可以让无人驾驶更智能今年6月份,各大厂
精彩推荐
阅读排行
精彩推送
- 机构:人们对生成式人工智能欠缺...
- 喜马拉雅申请 AI 开放平台商标...
- 理想汽车负责人:我们在 ChatGP...
- 每日快讯!618,我为什么不买了?
- 三大股指放量收跌,AI 概念逆势...
- 全球快消息!头部券商交易系统出...
- 世界视讯!不负期待 珠山塾院...
- 朔州市平鲁区李林中学(关于朔州...
- 新资讯:吴三桂为什么反清失败_...
- 太平财富年金保险条款是什么?怎...
- 【新视野】被骗买了理财保险怎么...
- 中融其乐融融年金险保障怎样?优...
- 独生子女年金保险怎么样?怎么领...
- 福享连连年金保险是真的吗?怎么...
- 实时焦点:北京京西大悦城6月18...
- 小鹏汽车法务部晒立案书_全球实时
- “双星”合并,极星汽车与星纪魅...
- 钱还不够用?法拉第未来继续延迟...
- 每日短讯:我国资本市场双向开放...
- 卓谊生物拟冲刺深交所主板IPO上...
- 持续高温,小心热射病!常见症状...
- 每日消息!OPPO K11x 综合体验...
- 新资讯:华为高级副总裁:有眼力...
- 市场消息:土耳其反垄断委员会开...
- MacBook Air 15 分析解读:这...
- 夏日炎炎如何为设备安全供电?你...
- 去年因“打鸡血”言论出圈的国泰...
- 此轮存款“降息”缘何又快又急?...
- 三大平台“王炸”纷飞 暑期档电...
- 每日聚焦:实验舱、神舟、天舟、...