数学论证 GPT-4 不是随机鹦鹉:真如此的话整个宇宙都会坍缩 世界报道
2023-05-27 13:19:52来源:ZAKER科技
对于 ChatGPT 的工作原理,一个常见的解释是根据统计学规律预测下一个词。
(相关资料图)
但最近一位叫 Jacob Bayless 的工程师用数学方法得出惊人结论:
若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞。
这一数据量是500008000,根据贝肯斯坦上限( Bekenstein bound ) 原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。
而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。
而 ChatGPT 与单纯统计预测的区别,可以做这样的类比:如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。
但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。
什么是 " 随机鹦鹉 "
一个流传很广的说法,所谓大语言模型实际上相当于一个 " 随机鹦鹉 " ——
与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。
出自论文 On The Dangers of Stochastic Parrots: Can Language Models Be Too Big
这对过去的语言模型,或许确实成立。比如曾经流行的 n-gram 算法。
比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。
具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT …
n = 1: REPRESENTING AND SPEEDILY IS AN GOOD …
n = 2: THE CHARACTER OF THIS POINT IS THEREFORE …
不难看出,随着 n 值的升高,文本越来越接近人类语言。
而 n-gram 模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。
据此有人猜想,GPT-4 会不会也只是一种高级的 n-gram 呢?
Bayless 提出,GPT 必须学会抽象才能有如今的效果,至少 GPT-4 肯定如此。
GPT-4 不只是 " 随机鹦鹉 "
要证明这一点,可以先看下棋机器人的例子。
如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。
那它就能通过 " 背谱法 " 模仿其他任何棋手或程序的下法。
比如 Stockfish 是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定 Stockfish 是否在背谱。
但实际上,包含所有情形和步骤的棋谱数据量可能超到 2154。
而 Stockfish 的程序只占用了不到 50MB 的空间,根本不可能存下需要的所有棋谱。
所以 Stockfish 肯定是通过更高级的方法来实现下棋的。
人类语言的复杂度远超过棋类游戏,因此 GPT 的数据量更是同理。
仅在是上一代的 GPT-3 的 token 字典中就有超过 5 万 token。如果对每个词都逐一建立统计信息,n-gram 模型中 n 值将高达 8000。
届时,需要存储的情景数量将达到 500008000。
正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。
因此,GPT 是 " 随机鹦鹉 " 的猜测在理论上得到了一定程度的批驳。
" 随机鹦鹉 " 达不到的高度
仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。
第一个实验关于一道经典的农夫过河问题。
一个农夫有一条船,和狼、羊、菜,农夫要把这 3 样东西运到河到另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?
研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。
狼、羊和菜则分别换成火星人、金星人和月球人。
替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。如果 GPT 不是 " 随机鹦鹉 ",那么它至少不会犯下只有 " 随机鹦鹉 " 才会犯的错误。
GPT-4 针对替换后的问题给出了正确的回答,GPT-3.5 则没有。
但它们并没有犯研究人员预想的 " 鹦鹉 " 错误——即在回答中出现狼、船、河等已被替换掉的词语。回答中使用的句子,也无法在互联网中被检索到。
这些现象都证明了现在的大语言模型的生成方式已经超越了 " 概率预测 "。第二个实验则是数字排序。
如果让 GPT 学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?
其实只要从 GPT 的输出当中就可以看出来了。假如从 1-100 中随机选择 10 个数字,并将其顺序打乱,将一共有这么多种情形:
如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。因此,只要 GPT 能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。
研究人员训练了一款特斯拉前 AI 总监 Andrej Kaparthy 发明的语言模型 nanoGPT,专门让它做数字排序。
结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。
虽然在训练步数达到 16 万左右时突然出现了大量错误,但也很快得到了纠正。
这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。
这个测试只是在一台笔记本电脑、算力非常有限的 GPU 上进行的。更不必说 GPT-4 了。
参考链接:
https://jbconsulting.substack.com/p/its-not-just-statistics-gpt-4-does
责任编辑:hnmd003
相关阅读
-
数学论证 GPT-4 不是随机鹦鹉:真如此的话整个宇宙都会坍缩 世界报道
对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。但最近一位叫JacobBayless的工程师
2023-05-27 -
超越历史最佳纪录 15 倍!华为分布式存储产品性能全球第一,受益上市公司一览
财联社5月27日讯(编辑刘越)国际最权威的存储性能排行榜——IO500最新榜单近日正式公布,华为OceanStorPac
2023-05-27
相关阅读
-
数学论证 GPT-4 不是随机鹦鹉:真如此的话整个宇宙都会坍缩 世界报道
对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。但最近一位叫JacobBayless的工程师
-
今年9月,91.8%的幼儿园将开设托班!网上预报名开始啦 环球通讯
托班网上预报名开始啦为实现“幼有善育”的目标,闵行区积极挖掘潜力,鼓励有条件的公办幼儿园和民办幼...
-
外媒:特斯拉100GB数据泄露,涉及马斯克社保号码和员工工资_天天短讯
据财联社援引外媒消息,一名举报者向德国《商报》泄露了100GB的特斯拉数据,除了首席执行官马斯克的社保
-
超越历史最佳纪录 15 倍!华为分布式存储产品性能全球第一,受益上市公司一览
财联社5月27日讯(编辑刘越)国际最权威的存储性能排行榜——IO500最新榜单近日正式公布,华为OceanStorPac
-
无线快充取消“ MFi ”认证,苹果在下一盘大棋
「独乐乐」和「众乐乐」之间,苹果一直是倾向于前者,这一点,从它对认证配件的严格程度就能看出来。但想要
-
数实相融,终端筑路:华为擎云点亮 2023 数博会|当前报道
文 柳华芳云贵高原,山川秀美,不止有宜人气候,还有云上贵州,有温暖阳光,也有高科技的天下英雄会。5月26
-
当前快报:小鹏、深蓝都往车里“加床”,车载大床是伪需求吗?
苹果高级运营副总裁JeffWilliams曾表示,汽车是移动设备的终极形态。进入新能源时代后,汽车行业竞争更加激
-
全球关注:余承东:华为不是不造车,我们是和合作伙伴一起造车
品玩5月27日讯,余承东在赛力斯AITO问界十万辆量产车下线的庆祝仪式上,对华为不造车的说法给出最新回应:
-
1 克黄金,便宜 100 元?!黄金“代购”,火了!|实时焦点
一般来说,五六月是婚庆市场的旺季,也带动了黄金饰品热销。在被称为黄金市场晴雨表的深圳水贝市场,近期持
-
【环球热闻】阿里巴巴最新回应!
25日晚,阿里巴巴官方微博发布消息,近日,关于淘宝天猫、阿里云、菜鸟、本地生活各个业务裁员谣言传得很厉
-
“贵到离谱!” 300 元一个,冲上热搜第一!
榴莲又上热搜了,还是因为价格,昨天 榴莲,贵 话题冲上微博热搜第一,短短几个字,击碎一众榴莲价格敏感型
-
注意!油价最新消息
涨了,本轮计价周期国内油价终究还是没有抗住最后的几天,又是由跌转涨。截至5月25日,累计上调75元 吨,冲
-
今日聚焦!国家统计局:1-4 月份全国规模以上工业企业利润下降 20.6%
1—4月份,全国规模以上工业企业实现利润总额20328 8亿元,同比下降20 6%(按可比口径计算,详见附注二)。
-
青农商行与青岛前首富决裂?多次减持,“巴龙系”持有上亿元该行股权将拍卖
青农商行(002958 SZ)股权再被拍卖!5月24日,青农商行公告称,因债务问题,青岛市黄岛区人民法院将于6月28
-
中国汽车产业链全景图:243家汽车供应商谁在吃肉,谁在喝汤?|天天热闻
一场油箱的争论,让人们开始关注汽车上游供应商和零配件。近几年,中国新能源车蓬勃发展,大家的关注力更多
-
小米新周期交出第一份答卷,高端进展加速带动盈利大幅回升_快看
日前,小米交出了高端化转型第四年的首份答卷。据小米集团5月24日发布的财报,今年前三个月,集团整体毛利
-
广东省周末天气炎热并伴有雷雨|环球头条
近日,全省气温不断上升,随着副热带高压和台风外围下沉气流的持续影响,未来多天广东将处于高温炎热天气,
-
新华财经|渤海湾首个千亿方大气田中心平台建造完成
根据中国海油提供的信息,渤中19-6凝析气田位于渤海中部海域,是大型、整装、高产、特高含凝析油的千亿立方
-
李彦宏:大模型即将改变世界|焦点速看
李彦宏意气风发。做为中国人工智能技术积累最深的公司之一,在今年3月文心一言正式对外测试后,百度已经迅
-
马斯克一重要试验,获批准|世界热门
当地时间5月25日,马斯克旗下脑机接口公司Neuralink宣布,该公司已获得美国食品和药物管理局(FDA)的批准,
-
当前视讯!GOTC 2023 嘉宾畅谈:开源助推云原生、汽车软件发展
大家期待已久的GOTC2023召开在即,组委会广邀各个论坛嘉宾讲师畅谈开源与各技术领域的发展趋势,让小伙伴们
-
【世界快播报】13 层网络拿下 83% 精度,华为诺亚新型神经网络架构 VanillaNet「简约」到极致
机器之心专栏机器之心编辑部深度学习模型架构越复杂越好吗?自过去的几十年里,人工神经网络取得了显著的进
-
苹果 7 月关闭“我的照片流”服务
钛媒体App5月27日消息,苹果宣布将于7月26日关闭我的照片流(MyPhotoStream)服务,建议现有用户尽快迁移到
-
基辛格 100 岁了,但现在的美国似乎不再需要他
5月27日,当今世界最具传奇色彩的外交家基辛格,迎来了自己100岁的生日。撇开政治立场,看他100年的人生经
-
网信办“清朗”专项行动:处置违规账号92.76万余个_当前快报
据“网信中国”消息,按照“清朗·从严整治‘自媒体’乱象”专项行动要求,3月10日以来,各级网信部门积...
-
巨星传奇上市,周杰伦卖咖啡三年赚7个亿
据北京商报报道,周杰伦巡演火热开唱期间,与其深度绑定的巨星传奇集团有限公司通过港交所上市聆讯,在
-
天天消息!Faraday Future 宣布 FF 91 成功通过 FMVSS 碰撞测试 第一阶段交付将于 5 月 31 日开始
品玩5月26日讯,据法拉第未来官方消息,FF91电动汽车成功通过了美国联邦机动车安全标准(FMVSS)的碰撞测试
-
【新要闻】Great Wall Motor Accuses Rival BYD of Failing on Hybrid Emissions
GreatWallMotorAccusesRivalBYDofFailingonHybridEmissions,with,sold,wall,share,sales,motor
-
天天消息!A16z 精心整理的最全 AI 学习资料(全文中译 + 链接)
硅谷以善于研究和喜爱分享著称的投资机构A16z(AndreessenHorowitz)最近发布了一份经过详细筛选并配有简介
-
我过上了“二手人生”,真是一言难尽!一言难尽! 全球讯息
本周六我们的心理学入门小学堂将进入第一章——精神分析流派,这次直播主讲弗洛伊德的人生故事。弗洛伊...
精彩推荐
阅读排行
精彩推送
- 环球热推荐:AI+ 广告营销望成...
- 西藏林芝森林消防开展30公里徒步...
- 日喀则博物馆开馆 头条
- 【世界新视野】西藏今年计划实施...
- 世界微头条丨非标业务估值核算 ...
- 142亿全归女方,A股又现天价离婚...
- *ST庞大被证监会立案调查 全球微动态
- 百果园被曝不收顾客一元纸币,店...
- 2023年全国“奔跑吧·少年”儿童...
- 热门:我市全力做好青年就业创业...
- 爱心送考专项服务启动
- 全国首个家校社协同育人研究与实...
- 包头市全民健身发展研究中心在包...
- 全球百事通!我国科研团队揭示人...
- 西藏启动电力便民服务体系示范点...
- 走向珠峰丨行动——走向那座湖|...
- 世界动态:2023年珠峰科考登顶队员凯旋
- 环球速看:哈铁开行今年首趟“龙...
- 全球超高海拔单机容量最大风电机...
- 滚动:全球首艘,正式交付!
- 让梦想触手可及 全新一代中高端...
- 网红何丹彤称在巴黎被抢劫:劫匪...
- 全区推进县域学前教育普及普惠督...
- “高精尖”科技成果扎堆亮相2023...
- 特斯拉:Model Y 成为第一季度...
- FF:首款量产车 FF 91 已通过碰撞测试
- 通信网如何随 AI 之需而变?
- C919 机票开售,上海虹桥飞成都...
- 所有人免费!著名景区官宣 环球讯息
- 法院判了!特斯拉车顶维权女车主...