GPT 能为自动驾驶带来什么?毫末给出了答案
2023-04-16 16:08:56来源:ZAKER财经
在最新的毫末 AI DAY 上,毫末智行董事长张凯给出了这一判断,并基于这一判断发布业内首个自动驾驶生成式大模型 DriveGPT,中文名 " 雪湖 · 海若 "。
自去年年末以来, GPT 的热度一直高涨不下,尤其是 ChatGPT 的大火更是引发全行业关注。此前,GPT 多应用于文本生成、代码生成或是搜索领域,但由于缺乏数据支撑,GPT 在自动驾驶行业这一垂类的应用并不高。
截至目前,业内也仅有毫末一家率先将 GPT 应用到自动驾驶领域,即 DriveGPT 雪湖 · 海若。
【资料图】
DriveGPT 能为智能驾驶做什么?
GPT 的全称是生成式预训练 Transformer 模型,本质上是在求解下一个词出现的概率。即根据输入的前序文本,模型会输出可能出现的下一个字的几率分布,再从中取样出几率较高的字。如此循环往复,直到完整地写完下文。
据官方介绍,DriveGPT 雪湖 · 海若的底层模型采用 GPT(Generative Pre-trained Transformer)生成式预训练大模型,与 ChatGPT 使用自然语言进行输入与输出不同,DriveGPT 输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景 Token 化,形成 "Drive Language"。
Drive Language 基于毫末的 CSS 场景库理论,将驾驶空间进行离散化处理,每一个 Token 都表征场景的一小部分,相当于许多个可能在未来出现的平行宇宙,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。截至目前,毫末从真实驾驶场景库中提取的 token 序列,规模达到 50 万个。有了 Drive Language,毫末就可以用人类驾驶的数据对模型进行预训练。
首先,在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管 Clips 数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。同时,DriveGPT 雪湖 · 海若会根据输入端的提示语以及毫末 CSS 自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。
毫末智行 CEO 顾维灏表示,毫末 DriveGPT 雪湖 · 海若通过引入驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。据毫末方面的说法,在 RLHF 的加持下,Hard Case 通过率提升了 48%。
目前,毫末 DriveGPT 雪湖 · 海若实现了模型架构与参数规模的升级,参数规模达 1200 亿,预训练阶段引入 4000 万公里量产车驾驶数据,RLHF 阶段引入 5 万段人工精选的困难场景接管 Clips。毫末方面表示,DriveGPT 雪湖 · 海若现阶段主要用于解决自动驾驶的认知决策问题。" 在感知到了周围的世界之后,怎么样把车开得更安全,把车开得更顺滑,怎么样跟周围的交通参与者互相博弈。" 顾维灏说道。
毫末判断,DriveGPT 雪湖 · 海若还将在城市 NOH、智能陪练、驾驶捷径推荐、脱困场景中得到应用,最终目标是要实现端到端自动驾驶
毫末在 AI DAY 上宣布,DriveGPT 雪湖 · 海若将在即将量产上市的新摩卡 DHT-PHEV 首发。
毫末基于 GPT 技术的探索,毫末衍生出服务于业界的能力和新的商业模式,即向业界开放 DriveGPT 的能力,4 月 11 日开放单帧自动标注服务,可降低标注成本,之后还将陆续开放驾驶行为验证、困难场景脱困等功能。
DriveGPT 背后的支持
事实上,DriveGPT 雪湖 · 海若的训练和落地,离不开算力的支持。
今年 1 月,毫末和火山引擎共同发布了其自建智算中心 " 毫末雪湖 · 绿洲 MANA OASIS"。毫末表示,OASIS 的算力高达 67 亿亿次 / 秒,存储带宽 2T / 秒,通信带宽达到 800G / 秒。
不过,只有算力还不够,还需要训练和推理框架的支持,由此毫末进行了三方面升级——
一是训练稳定性优化。毫末在大模型训练框架的基础上,与火山引擎共同建立了全套训练保障框架,可以通过集群调度器实时获取服务器异常,将异常节点从训练 Task group 中删除,再结合 CheckPoint 功能,利用 VePFS 高性能存储和 RDMA 网络高效分发,以保障 DriveGPT 雪湖 · 海若大模型训练的稳定性。
二是弹性调度资源的升级。毫末构建了一个大模型持续学习系统,数据以动态数据流的形式结合增量学习,持续不断地将量产回传和筛选的存量数据,传入认知和感知 Pretrain 大模型。三是吞吐效率的升级。在 Transformer 的大矩阵计算上,毫末通过对内外循环的数据拆分,尽量保持数据在 SRAM 中提升计算的效率;在传统的训练框架中,通过引入火山引擎提供的 Logo 核心算子库实现融合,端到端吞吐提升 84%。
另外,毫末表示,自动驾驶数据智能体系 MANA 架构已迎来全线升级。截至 2023 年 4 月, MANA 学习时长超 56 万小时,相当于人类司机 6.8 万年。
在 MANA 发布迭代一年后,在本次 AI DAY 也迎来升级,具体包括:
首先,MANA 感知和认知相关大模型能力统一整合到 DriveGPT 雪湖 · 海若中;
其次,MANA 计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,并集成到 OASIS 中;
第三,增加了使用 NeRF 技术的数据合成服务,降低 Corner Case 数据的获取成本;
最后,针对多种芯片和多种车型的快速交付难题优化了异构部署工具和车型适配工具。
在视觉感知能力上,毫末对视觉自监督大模型做了一次架构升级,将预测环境的三维结构,速度场和纹理分布融合到一个训练目标里面,强迫模型练好内功,使其能从容应对各种具体任务。目前毫末视觉自监督大模型的数据集超过 400 万 Clips,感知性能提升 20%。
顾维灏举例称,在泊车场景下,毫末将鱼眼相机也引入到视觉 BEV 的感知框架当中,鱼眼图像通过 2D backbone 提取出视觉特征,经过空间转换映射至 BEV 空间,并在该空间下对于障碍物的轮廓边界进行识别和测量,目前可做到在 15 米范围内达测量精度 30cm,2 米内精度高于 10cm。除了用自监督大模型练内功,毫末还公开了在纯视觉三维重建方面的一些进展。
毫末对 NeRF 做了升级,将视觉感知结果转化为可用于 BEV 模型训练的带 3D 标注的真值数据,目前可以做到重建误差小于 10cm。
单趟重建有时会受到遮挡的影响,不能完整地还原三维空间,因此毫末尝试了多趟重建的方式——即将同一地点不同车辆在不同时间经过的数据合并做多趟重建,由此提升场景还原度,重建效率可提升 5 倍。
重建之后,MANA 可以编辑场景合成难以收集的 Corner Case。毫末表示,近期训练了一个可以在静态场景做虚拟动态物体编辑的模型,可以控制虚拟物体在场景中按照设定的轨迹运动,由此合成各种 hardcase,例如近距离回车,行人、电动车交互行为等。
2023 年将是智驾产品大考之年"2023 年智驾产品进入全线爆发期。" 毫末智行董事长张凯在活动上表示。
张凯判断,城市导航辅助驾驶产将在 2023 年将围绕量产上车发力,主要玩家的城市导航辅助驾驶产品进入到真实用户覆盖和多城市落地的比拼。
其次,行泊一体和末端物流自动配送产业商业化将成为自动驾驶公司深耕的重点。在乘用车领域,搭载行泊一体功能的智驾产品将迎来前装量产潮;在末端物流自动配送领域,末端物流自动配送车在商超、快递等场景迎来爆发,2023 年将在这些场景实现可持续商业化闭环。
在 AI DAY 上,毫末表示其城市 NOH 已在北京、保定、上海等城市开启泛化测试,即将量产上车。张凯表示,到 2024 年,毫末城市 NOH 将有序落地 100 城。一年之内,从三座城市扩张至百城,毫末给出的目标可以说十分激进。
截至目前,毫末三代乘用车产品搭载车型近 20 款,毫末辅助驾驶用户行驶里程突破 4000 万公里,HPilot2.0 日均里程使用率 12.6%。
毫末智行透露,目前已与 3 家主机厂(包括长城)签署定点合同,相关项目正在交付中。
结合毫末往届 AI DAY 的动态来看,从发布中国首个数据智能体系 MANA,到建设智算中心雪湖 · 绿洲,再在其基础上训练出参数规模达 1200 亿作为 DriveGPT 雪湖 · 海若模型,毫末的闭环思维始终贯彻其技术始末,并逐渐形成数据驱动的闭环。正如毫末所言,2023 年将是智能驾驶冲刺之年、大考之年。这对毫末来说,这也是长久技术布局走向落地应用的关键时期;毕竟,毫末要在 2025 年实现城市 NOH 落地 100 城,这并不是一个简单的事情。
(本文首发钛媒体 App,作者 | 肖漫,编辑 | 张敏)
责任编辑:hnmd003
相关阅读
-
青海姑娘回应陪嫁 100 头牦牛:只是一部分,还有珊瑚项链、金手镯
青海海北祁连县的藏族姑娘尕(gǎ)玛措出嫁了。她在4月11日发布的视频里提到,嫁妆是100头牦牛和1匹骏...
2023-04-16
相关阅读
-
GPT 能为自动驾驶带来什么?毫末给出了答案
在AI技术生态上,生成式大模型已成为自动驾驶系统进化的关键,基于Transformer大模型训练的感知、认知算...
-
杂技女演员表演时从高空坠落身亡,官方:个人组织的商演
4月15日晚,安徽宿州埇桥区蒿沟镇一场演出现场,一名表演高空杂技的女演员在升空过程中突然坠落到舞台上...
-
青海姑娘回应陪嫁 100 头牦牛:只是一部分,还有珊瑚项链、金手镯
青海海北祁连县的藏族姑娘尕(gǎ)玛措出嫁了。她在4月11日发布的视频里提到,嫁妆是100头牦牛和1匹骏...
-
车险跟汽车年龄有关系吗?车险包含哪些?
车险的价格和汽车的年龄是有一定的关系的。 因为汽车的年龄越大那汽车的价值就会越低,所以在这个时候...
-
车险怎么网上续保?什么时候有比较大的优惠?:焦点热闻
打开百度搜狗等搜索引擎,然后在搜索框当中输入对应的车险公司名字。之后就会进入到保险公司的官网,然...
-
医疗险和重疾险应该先买哪个?应该先买哪个?-每日热议
1、从保障力度的角度来说,优先配置重疾险更为重要;重疾险主要是针对重疾病进行保障,而且保障力度很大...
-
保险交了几年想退保怎么办?退保有哪些损失?:热推荐
如果保险交了几年想要退保的话,大家去退就可以了。 任何保险只要在保障期内,不管是几年之后,都可以...
-
车险交哪几种就够了?要给多少钱?:天天时讯
第一,交强险。 交强险属于是必须投保的,保险产品也是一种强制性购买的产品,如果我们不买的话就无法...
-
【环球快播报】何小鹏:淘汰赛刚刚开始,300万年销量规模将只是入场券,主流车企只有前八
何小鹏:淘汰赛刚刚开始,300万年销量规模将只是入场券,主流车企只有前八4月16日,盖世汽车获悉,小鹏...
-
职业年金就是坑吗?怎么领取?-天天实时
职业年金并不是坑。 职业年金是单位在依法为员工缴纳社会养老保险的基础上,参加的一种补充性养老保障...
-
全球快播:苹果设备出现Bug,不断要求用户输入AppleID密码
据IT之家消息,近日,苹果的在线服务出现了多次故障,而且似乎还有
-
全球最新:平安e生保百万医疗险怎么样?投保注意什么?
1、保障全面:平安e生保包含了一般医疗、特疾医疗保障,可以满足大部分人的日常医疗所需。 2、性价比高...
-
鑫盛12保险有什么优缺点?可以买吗?|世界速讯
1、投保门槛低:该保单最低一千元即可起投,门槛较低,对预算有限的人群会比较友好。 2、保障期限:该...
-
平安万能智盈人生适合交几年?投保注意什么?
适合交多少年,主要看消费者个人的实际情况。 智盈人生的缴费年限并没有严格的限制,投保人在十年到五...
-
国寿鑫尊宝终身寿险万能型怎么样?投保注意哪些问题?|焦点报道
1、追加保费:该保单可以在保障后期追加保费,可以让被保人获得更好的保障。 2、保单持续奖励金:鑫尊...
-
官方回应女演员表演杂技高空坠落:演员经抢救无效死亡
4月15日,安徽宿州蒿沟镇尹楼村文冠花文化旅游节被曝有女演员高空表
-
今日关注:太平洋长相伴到期可以全部取出吗?可以买吗?
太平洋长相伴是一款终身保障的保障,并没有固定的保障期限,而且保险公司仅针对被保人身故进行给付,因...
-
当前快讯:保险交20年保终身本金能取出来吗?能取多少钱?
不确定。 不同保险的保障责任是不同的,具体保险交费二十年后是否可以取出本金,需要看保单实际的保障...
-
天天实时:余承东:华为ADS2 .0发布,今秋起推10余款新车
据媒体报道,华为常务董事、终端BG CEO、智能汽车解决方案BU CEO
-
女子辟谣妈妈做月嫂存款近500万-通讯
4月14日,“女儿发现做月嫂的妈妈存款近500万”的新闻引发热议。4月
-
北京地铁已取消口罩佩戴要求,时隔近两年客流量重回 1200 万人次
近日,有网友反映,北京市各条地铁线路已全面放开口罩要求,乘客在进站安检、候车乘车的过程中,均无需...
-
淄博烧烤爆红满月:本地人吃不上,小饼厂家连轴转,“机器都要冒烟了”_全球快资讯
“知道火,但也没想到这么火!”在淄博上学三年的张源被眼前的景象“吓”到了,“下午四点去排队吃烧烤...
-
华为 4 月 17 日首发全液冷超充架构・充电网络解决方案_微速讯
品玩4月16日讯,华为近日宣布,将会在4月17日的发布会上公布全液冷超充架构充电网络解决方案。目前华为...
-
"淄博烧烤"搜索量暴涨,当地月薪万元招不到烧烤师傅
小饼烤炉加蘸料,灵魂烧烤三件套!近期,淄博烧烤在社交媒体上火爆出圈,大学生组团到淄博吃烧烤淄博烧...
-
越秀集团举行会员运营体系上线发布会,发出湾区“粤生活”会员联盟倡议
4月15日下午,越秀集团在悦汇城举行以“生活向美,喜悦上线”为主题的会员运营体系上线发布会暨湾区“粤...
-
淄博回应被疑只欢迎清北名校生:系误解 每日动态
据四川观察消息,近日,淄博烧烤火遍全网。一则“五一期间,淄博将
-
法国抗议者冲进LV总部:呼吁富人为国家养老金提供资金
据澎湃新闻,抗议养老金改革的法国工人短暂“占领”奢侈品巨头LVMH
-
京东方存货减值百亿,陈炎顺称行业处于修复期
作者|谢涵编辑|陈彦旭运营|陈小妍另镜(ID:DMS-012)2023年,面板行业仍处于修复之中。近日,京东方发布20...
-
叮咚!呼和浩特300万株花草预计5月初陆续出圃-今日精选
叮咚!呼和浩特300万株花草预计5月初陆续出圃
-
当前要闻:网红软文的“话术”你信了吗?
如今,不少女性追求极致身材,也在寻找各种方法来改变,有这样一群人就将目光放在她们身上,在小红书、...
精彩推荐
阅读排行
精彩推送
- 深圳一市民因在地铁站停留太久,...
- 曝淄博酒店网上标价千元前台仅需200
- 当前焦点!“人均存款27万”的年...
- 每日速看!大三男生回应给同学洗...
- 环球观点:官方通报马戏团狮子意...
- 大国工匠与技能“小匠”
- 全市公安机关开展全民国家安全教...
- 拉萨南北山绿化工程推进记:植下...
- 今日最新!京东赚赚宣布4月20日...
- 马斯克否认特斯拉开启价格战:只...
- 世界观天下!做优城市功能 提升...
- 我市2023年市直事业单位招聘考试...
- 包头勇做氢能产业“碳”路者 ...
- 达茂旗国际氢能冶金化工产业示范...
- 反恐应急演练_观速讯
- 苹果升级 ios16.4 后无法再降级
- 六款百元热门耳机比拼!100 元...
- 天天新动态:FF 91首台量产车下...
- 实时:专访荣耀赵明:聚焦做精品...
- 每日热点:央行这场会议,出现三...
- 这就是信心|喜——“朋友圈”越...
- 世界看热讯:老桥段的新尝试,小...
- 2013 — 2015 年的 TMT
- 世界热点!比亚迪逼宫日系「三杰」
- 好评中国|为什么会走进安江农校?
- 每日聚焦:曲屏 + 星环 真我...
- 世界观天下!价值 365 万美元...
- 全球热推荐:年轻人做“猪食”,...
- 一体化压铸:特斯拉行,不代表你...
- 【全球快播报】4-2=0,两轮特斯拉之死