别吹了,自动驾驶大模型 PPT 们_世界今头条
2023-06-02 22:28:01来源:ZAKER科技
人工智能产业(包括自动驾驶)有一个不可忽视的人性缺陷:
除了天然受制于技术语言,也有不少人故意把东西说得模棱两可、艰涩难懂、天下第一……以达到让人不明觉厉、让资本掏钱的目的。
有些自动驾驶公司就善于此道。
(资料图)
或者说,如今市面上,把汽车工业与 " 超大模型 ""GPT" 以及 "AIGC" 强绑定的说辞,基本可以归于 " 非蠢即坏 " 的商业炒作行径。
特别是,在 " 大模型 " 到底有多大都没法定义的情况下,有人拿出几亿参数值说大,有人搬出几十亿也说大,而 GPT2 的 " 大 " 就有 150 亿,GPT3 则是 1750 亿。
当然,大不大无所谓,很多人最关心的问题是,开始有公司向汽车产业推出所谓的自动驾驶 GPT,到底有什么用?
答案是,或许真的没太多用处。
首先,就像写 Paper 占坑一样,它的确有一小部分研究价值,属于学术界的任务;
其次,忽悠资本,因为不少资本会对汽车产业与大模型的双倍规模与估值买账。
但事实上,包括自动驾驶产业与深度学习圈,许多开发者们对 " 自动驾驶 GPT" 的说法很不认同,甚至是极为恼火的。
我们请教了多位曾在大厂、中美科技独角兽做自动驾驶研发的资深工程师,以及包括 OEM 在内的汽车产业人士看法,再结合部分博客文章,总结了一些观点,或许会对汽车工业、资本以及更广阔的大众群体有一些启发。
把 GPT 吹上车
以某家公司给出的 " 自动驾驶 GPT 产品 " 为例,其神经网络概念图让内行都一头雾水,不知所云。
此外,1200 亿的参数量的确够大,相当于对标了 GPT3。这意味着支撑这庞大数据量训练的硬件资源支持,同样不菲。
但是,他们虽背靠主机厂,却并没有自建昂贵的数据中心,而是跟其他企业一样租用云上资源。很明显,这是将某大厂云服务整合包装为自己的数据基础设施服务体系。
其次,最重要的,大模型到底怎么落地?
把跟 ChatGPT 一样的 " 黑匣子 " 塞进汽车里,做从 " 感知、规划到决策 "(这是自动驾驶技术三个组成部分)的端到端输出?
从这一方向,各方非常严谨地表示,目前离落地非常遥远。
ChatGPT 有着自己天然的生存环境,那就是昂贵的数据中心里。而所有关于 AIGC 的应用都要跟数据中心联网,这没有任何问题——在光缆的连接体系里,做到极快反应。
但作为大型移动设备,车唯一靠的就是无线,但目前连 5G 也非常不稳定。所以,包括特斯拉在内,大家都只能选择走一条路——
将高性能且轻量化的算法模型,塞进一枚性价比足够高的芯片里。
本质上,英伟达从 Tegra 2、Xavier,过渡到 Orin,再到 2000Tops 的 Thor,算力的确是沿着自动驾驶 AI 算法模型在车内的疯狂扩充与变化而一路往上爬的。
而估算一下,GPT3 需要的算力至少是 Thor 的 10 的 N 次方倍。
当然,就像 GPT3.5 开源之后,有开发者已采用量化技术用苹果 M2 芯片运行起 ChatGPT,所以,不排除未来有人会把它塞进英伟达的芯片里。
但是,除去车辆感知、规划与决策过程本身的复杂性,汽车工业疯狂追求的性价比、以及延迟两秒就会出人命的严苛交通环境,对一切 " 不可解释性 " 有着天然的回避姿态。因此,业内认为,可行的时间点极为遥远。(当然,这家公司说自己的模型对于驾驶策略是可解释的,请拿出更详细的证据。)
目前来看,自动驾驶前装市场普遍情况是:" 唯有‘感知’模块用上了模型 "。
业内清楚,感知最好做,且各家已成功落地——从 CNN(卷积神经网络)开始,它就是一套相对成熟的流水线。而芯片里的 GPU 部分也基本被 " 感知 " 占用。
当然," 决策 " 与 " 规划 " 两个部分,并非没有人做 AI 化尝试,只是汽车工业大多在当下,依然采用最为稳健的方法——
一系列来自机器人等领域的经典规则理论。譬如以 " 蒙特卡罗搜索树 " 为代表的启发式搜索算法。
以 " 规划 " 为例,其上车最常见的方式是把 " 纵向规划 " 和 " 横向规划 " 分开,做 " 时空分离 "。而在这一点的创新上,就分出了几个 " 流派 " ——
以 B 大厂与苏 Q 厂为代表,做时空联合规划。相当于把纵向控制与横向控制的问题结合在一起,更容易搜索出全局最优值。
这个流派的优点是,在面对极为困难或复杂场景,局部最优算法很难搜索出一个更智能路径,但全局可能性更大。但缺点是占用更多算力。
以苏 M 厂等很多从深度学习领域 " 出道 " 的公司为代表,在经典决策规划里融入 AI 算法,把其中一部分模块用 AI 算法替代掉,而非上来就做大一统。
的确,五六年前 " 计算机视觉 " 的大火,早就证明了深度学习具备巨大的应用潜力。但它的缺点也是显而易见的—— " 不可解释性 ",以及通过大量资源投入来持续燃烧数据。
因此,要想上车,大部分企业在努力采用折中的方式——经典理论辅以 AI 算法,既保留经典方法的稳定性,又能提升性能表现。
" 譬如,规划里的‘路径生成’,就可能用 AI 做替代;而路径的选择、判定以及决策,以及后面的纵向规划,仍基于规则去做,形成一种复合方法。"
因此,大模型当然是一个终极理想状态,但上车的最好方法却是 " 分步骤推进 ",与成本之间做更多权衡。
当然,如今也有高端玩家们已经在研究 " 单模型多任务 " 的所谓 " 大一统 " 形式,不过一切没有定论。
大小可能不重要
我们从来都没想到,就像当年 " 自动驾驶分级 " 概念的模糊不清,让国内不少公司钻过空子一样;大模型这个 " 大 " 竟开始也被钻空子——
你有 10 亿,我有 100 亿,他有 1000 亿参数。
然而,在国外,对大模型的 " 大小 " 虽然有讨论,却从来不是重点。况且,国外工业界已经有了" 去大用小 "的势头。因为 " 大模型 " 绝不是越大越好,越大就意味着越不透明,越具有排它性。
包括苏黎世联邦理工大学的科学家在内,一群年轻学者已发起一个叫做 "BabyLM" 的迷你模型挑战赛,用规模为大型语言模型千分之一(一亿参数左右)做更适用工业界的模型。
此外,2022 年,诸多国内自动驾驶公司蹭的所谓 "Transformer" 大模型,更多指代的,是包括 GPT 在内诸多大模型背后的深度学习基础架构,而非仅指代大模型本身。
它最早出现在 2017 年谷歌的论文里。但这个被常用在自然语言处理(NLP)的 Transformer 模型,之所以突然在自动驾驶视觉界火了,是因为特斯拉将这一深度学习模型的 " 原理 ",极具创造性地用在了 " 图像空间转化为矢量空间 " 的感知预测中。
简单来说,特斯拉工程师思考的是,既然这是一个优秀的语言翻译模型,那么为何不能将 " 摄像头获取的图像空间‘翻译’为 3D 矢量空间 "?
所以,Transformer 发源于 NLP 但转入了 CV(计算机视觉);而 2023 年最火的 BEV 大模型,则是基于 Transformer 在自动驾驶领域的衍生物。
如果感兴趣,可以直接看 Medium 上关于特斯拉 FSD 的技术博客。工程师全程从没提过所谓的 BEV 模型到底有多大(虽然 BEV 被印证的确是烧数据的),而是设法解决目前车载摄像头数据融合产生的问题——
纯摄像头系统对闭塞区域与大型物体的预测结果比较糟糕,那么便从神经网络源头改变算法模型的设计理念——从图像过渡至 BEV。
效果也确实有了质的提升。
事实上,特斯拉更多值得称道的,是对各种各样已存的如 RNN、LSTM、RegNet(上图)等普通模型进行创新,且把它们的潜力发挥到极致;同时,强大的工程能力,又让特斯拉把这些模型都塞进了车里。
" 特斯拉是在从大模型原理入手,去试图做一些有益于自动驾驶整个模型的设计,同时又考虑到汽车必要的轻量化和小型化,再结合自己的 AI 芯片(TRIP)工艺往车上搬。
我认为这是一件更趋向于实干的事情,而不是像国内一些公司吹牛蹭热点。"
从 1 到 1.X?
不能上车,那么大模型做离线支持的" 数据闭环 "工作总可以吧?
" 数据闭环 " 这个概念,可以参考被说烂了的特斯拉 Autopilot 数据引擎框架——
确认模型误差、数据标注和清洗、模型训练,再到重新部署。
与此同时,全球各地的特斯拉车辆源源不断的回传数据进入这套流程,使之迅速流转起来,形成一套闭环系统。
但有趣的是,没有 " 大模型 ",这些工作也可以做,不是非大模型介入不可。
譬如,数据闭环里的 " 预标注 ",国内无论是早期的 B 大厂,还是 H 大厂的某生物工具链,做的这套东西已经非常成熟,那么大模型的 " 增益 " 就有待评估,没有 PPT 们渲染的那么厉害。
实际上,数据闭环的概念既简单又复杂。
简单在于,它可以被直接看做是" 锤炼算法的大型基础设施 ",从它里面出来的模型上车后足够智能,足够见多识广。
而复杂之处在于,它的每个环节,几乎可以作为一个小型创业项目——
如何做到样本的自动化挖掘,如何清洗掉冗余数据留下最有营养的部分,如何做好数据的冷存储与热存储?如何分门别类组织好数据?如何做到更有效的预标注……
所以,这套闭环的工程量极为庞大,每个环节都需要专门的人才维护。
而对于自动驾驶创业公司来说,由于极度烧钱,一般会选择" 把 A 部分做好,把 B 部分外包出去 "的轻量化模式,有强项也有短板。
目前,虽然各家东西细节无从比较,但 L4 独角兽 P 厂的数据闭环工具链 "CQ",竟然得到了业内不错的评价。
对于这只早期 L4 巨兽,不谈商业模式,被认为 " 在构建基础设施上的积累比较厚实 ",是一家在技术层面有真东西的企业。
此外,维持这套东西的运转,必然需要投喂更多的新鲜血液——数据与人才。因此,不是谁都能玩得起。
而特斯拉与比亚迪,是被认为最有可能把这个东西做好的商业组织。
只不过,基于人工智能的特性,数据闭环短期内是看不到成效的。它更像是春播秋收,把该浇的水、该施的肥、该播的种都做到位,不会立竿见影且巨烧资源,但效果出现后,便是马太效应形成的开始。
因此,要比大模型在数据闭环上的应用,不如比谁更有钱。
写在最后
当然,以上内容无意在狙击谁,也无意表扬谁(否则不会用字母指代),而是希望产业能回到一个正常的对比参照系内,以及重点放在实际效果上。
以及,建议企业把办公室内的 " 牌匾 " 换成特斯拉的成功三要素:
坚持第一原则思考方式,工程能力,以及执行力。
本文来自微信公众号:宇多田(ID:hellomusk),作者:宇多田
责任编辑:hnmd003
相关阅读
-
全球热消息:横扫全球 60 国畅销 Top5,这款产品靠的居然是「换皮」?
文 手游那点事Corgi海外的休闲手游市场似乎有些沉寂,至少就畅销榜,尤其是头部畅销榜而言,鲜少能够看到新
2023-06-02 -
GPT-4 变笨?OpenAI 回应:稳定性不足,但外部数据没有污染模型
品玩6月2日讯,据财联社报道,随着GPT-4的应用越来越广泛,有大量用户反馈近期大模型的回答质量有所下降,
2023-06-02 -
世界信息:2023 款 ES6 是款好车,但蔚来还需要更多好牌
小通(ID:dianchetong233)早在上海车展说过:2023年,对于车企来说是充满机遇与挑战的一年。尽管行业公认
2023-06-02
相关阅读
-
别吹了,自动驾驶大模型 PPT 们_世界今头条
本文来自微信公众号:宇多田(ID:hellomusk),作者:宇多田,题图来自:《末路狂花》人工智能产业(包括
-
全球热消息:横扫全球 60 国畅销 Top5,这款产品靠的居然是「换皮」?
文 手游那点事Corgi海外的休闲手游市场似乎有些沉寂,至少就畅销榜,尤其是头部畅销榜而言,鲜少能够看到新
-
时讯:有用户反馈称尼康Z8禁用第三方电池
6月2日消息,有用户反馈称,尼康Z8禁用第三方电池。某些第三方电池安装后,相机会弹出不兼容的提醒,根本无
-
UP主都去做直播了?B站陈睿否认“停更潮”,称将加速商业化
根据财报,一季度,B站日均活跃用户达9370万,同比增长18%,月均活跃用户数达3 15亿;用户日均使用时长96分
-
全球通讯!微软的新猎物:OpenAI之后,下一个是动视暴雪
自投资OpenAI重回浪潮之巅的微软,近期正在就高价“迎娶”动视暴雪展开最后的战斗。5月30日,就微软对英...
-
每日快播:我国民用无人机领域首项国标发布
证券时报网讯,近日,市场监管总局(标准委)发布了《民用无人驾驶航空器系统安全要求》强制性国家标准(GB
-
世界简讯:2023中国量化科技白皮书:量化交易监管框架仍需完善
证券时报e公司讯,6月2日,在上海举行的2023·量化科技嘉年华上,发布了《2023中国量化科技白皮书》。白皮
-
无人机安全标准出台!我国对民用无人机提出17个方面强制性技术要求|焦点快看
每经AI快讯,市场监管总局(标准委)近日发布了《民用无人驾驶航空器系统安全要求》强制性国家标准,将于20
-
输入法哪个好用而且没有广告(输入法哪个好用)_焦点资讯
每日小编都会为大家带来一些知识类的文章,那么为大家带来的是输入法哪个好用方面的消息知识,那么如果各位
-
万人说新疆|有滋有味的干果人生-环球速讯
随着收入的增加,阿妮古丽一家在阿勒泰市购买了楼房定居了下来,并抚养大了一双儿女。
-
GPT-4 变笨?OpenAI 回应:稳定性不足,但外部数据没有污染模型
品玩6月2日讯,据财联社报道,随着GPT-4的应用越来越广泛,有大量用户反馈近期大模型的回答质量有所下降,
-
环球资讯:荣耀 X50 通过 3C 认证,预计本月发布
近日,一款型号显示为「ALI-AN00」的机型正式通过3C认证,结合以往爆料消息显示,该机应该就是近日有过爆料
-
英伟达股价是否还涨得动?华尔街分析师仍在加码目标价预期 当前要闻
财联社6月2日讯(编辑史正丞)作为今年标普500指数涨幅最大的成分股,AI概念龙头英伟达在上周暴涨20%后又进
-
最贵 ST 股狂欢:*ST 左江一年涨 5 倍,业绩亏损,牛散爆炒股东套现-世界快看点
本文来源:时代周报作者:黄嘉祥ST股也疯狂。*ST左江(300799 SZ)股价在5月31日创下275 08元新高后,6月1
-
因为任正非这张“爆火”照片,大 V 但斌“翻车”了,公开道歉
近年来,一张华为公司创始人任正非单独一人在机场等出租车的照片在网络上广泛流传,备受网友好评。5月31日
-
【环球快播报】30 天,不开会:一家公司的提效实验
本文来自微信公众号:盖雅学苑(ID:thinkwithgaia),作者:董伟,头图来自:视觉中国如果说开会是我们工
-
环球热推荐:别吹了,自动驾驶大模型 PPT 们
本文来自微信公众号:宇多田(ID:hellomusk),作者:宇多田,题图来自:《末路狂花》人工智能产业(包括
-
当前速读:奶茶店两年才开了9家,中国邮政又搞起茶馆,加盟一家要花约55万
中国邮政又跨界。这一次,它不仅开起了茶馆,还瞄上了蛋糕和冰淇淋。近日,中国邮政PostTea邮局茶馆全国首
-
今日看点:天助畅运发生5起医疗器械不良事件,部分产品集采中标价低于成本价
来源|时代商学院作者|雷映编辑|陈佳鑫深交所公告显示,北京天助畅运医疗技术股份有限公司(下称“天助畅...
-
禧赢人生年金保险怎么样?有风险吗? 全球热推荐
禧赢人生年金保险是中国人民人寿保险推出的一款专业养老保险,该产品采用固定收益和权益投资相结合的方式,
-
建信尊享延年养老年金保险怎么样?怎么买?
建信尊享延年养老年金保险是一种长期的储蓄和投资方式,旨在为购买者提供一种稳定的收入来源。这种保险的优
-
年金险十年后可以取出么?和增额终身寿险哪个好?_世界微资讯
年金保险交费10年是否可以取,需要看实际情况。 大多数年金保险一般在第五年的时候就可以开始领取生存金了
-
年金险万能账户的骗局是真的吗?追加钱划算吗?
不是。 首先,我们需要知道的是,年金险万能账户并非完全是一个骗局。该账户确实可以为投资者提供某种程度
-
每日热点:年金保险的种类包括哪些?给付条件是什么?
1 普通年金保险:这种保险一般需要投保人支付一定的保费,然后在退休后,按照合同约定的期限和金额,获得固
-
世界今头条!震惊!这家私募让AI独立管理基金!业内称蹭热度,总经理这样回应
无所不能的AI(人工智能),要淘汰基金经理了。6月1日,一家名叫“止于至善投资”的私募发布公告宣布,...
-
世界看热讯:Nikola或将进行反向股票分割 以避免被纳斯达克退市
Nikola或将进行反向股票分割以避免被纳斯达克退市盖世汽车讯据路透社报道,电动卡车制造商Nikola首席执行官
-
打卡有奖丨“品古诗 逛海丝”线上活动来啦!
万里丝路,纵览千年。万众期待的2023广东21世纪海上丝绸之路国际博览会将于6月2日—4日在广交会展馆A区举办
-
世界今日报丨星火成炬 | 遇见有趣的灵魂
他们总能在生活里找到乐趣,为平凡的生活增添一抹彩色。
-
魅族 20 系列——流畅好用精致特别的直屏旗舰|关注
【CNMO视频】魅族20这部手机,主打的就是一个流畅看,这超声波指纹的解锁速度,快得很看,这流畅的动画效果
-
世界信息:2023 款 ES6 是款好车,但蔚来还需要更多好牌
小通(ID:dianchetong233)早在上海车展说过:2023年,对于车企来说是充满机遇与挑战的一年。尽管行业公认
精彩推荐
阅读排行
精彩推送
- 快讯:手机影像越来越强了,但拍...
- 天天微速讯:放弃内部创业,互联...
- 大盘延续反弹 新能源赛道乘势拉...
- 全球百事通!山西证券两名分析师...
- A 股退市房企再添一家!ST 泰...
- 欧洲央行执委Panetta:加息还未...
- 雅戈尔: 雅戈尔关于第一期核心...
- 基金经理要失业了?有私募将AI用...
- 【环球速看料】盒马版“开心农场...
- 变额年金保险的特征有哪些?有风...
- 企业年金是保险吗?是交多少领多...
- 日产高管Jose Roman将出任英菲...
- 中国星辰 | “带着我的梦想上...
- 10.24 发 骁龙 8Gen3 官宣 ...
- 魅族折叠屏砍掉了?CEO 回应:...
- 世界热议:一加 11 也有原神限...
- 最新旗舰 / 次旗舰性能排行 ...
- 焦点速讯:首款无风扇 Macbook...
- 华夏福临门年金保险咋样?有分红...
- 全球热讯:泰康乐鑫年年年金保险...
- 百万医疗险价格贵吗?多少钱?|...
- 播报:平安重疾险包括哪些疾病?...
- 2023百万医疗险对比哪个好?哪款...
- 前海人寿·Vcare关爱空间 “童...
- 中国电建:拟筹划分拆下属控股子...
- 腾讯张军回应马化腾截图刷屏:这...
- PDD 够狠的,iPhone 14 最高...
- 让你用手机也能“打鸟”,高通骁...
- 别笑了,宝马的「大鼻孔」是给有...
- OPPO 618 Reno10 Pro+ 获抖...