人类被 AI “毁灭”,一定是从教它玩《我的世界》开始的
2023-06-03 11:23:56来源:ZAKER科技
上周,几乎是前后脚,英伟达和国内几家科研机构分别发布了两份内容相似的论文。
首先是英伟达宣布开发出了一个全新的游戏 AI 智能体 "VOYAGER",将 AI 大模型 GPT-4 接入了《我的世界》(Minecraft)游戏。基于 GPT-4,VOYAGER 能够在《我的世界》里扩充着自己的物品和装备,完成诸如建造房屋、挖矿、收集仙人掌和狩猎等基本生存技能;也能独立进行开放式探索,去到不同的城市和地点,甚至是自己搭建传送门。
【资料图】
接着就是商汤科技联合清华大学、上海人工智能实验室等机构发布了通才 AI 智能体 "Ghost in the Minecraft(GITM)"。
同样是将大语言模型(LLM)整合进《我的世界》,GITM 在《我的世界》内主世界的所有技术挑战上实现了 100% 的任务覆盖率(成功通关解锁了完整的科技树),而此前所有智能体的总和只能覆盖 30%;另外在 " 获取钻石 " 任务上,GITM 成功率达 67.5%,同样相比于此前的最佳成绩—— OpenAI 的 VPT 方法大幅提高了 47.5%。
GITM 在《我的世界》的任务覆盖率远高于现有 AI 智能体直白点说,他们都选择了《我的世界》这款游戏来训练 AI,并且 AI 都实现了真人玩家能够完成的几乎所有游戏任务,堪比是能以假乱真的效果(这放在几个月前还是不可能的事)。
我们先抛开看起来艰涩的技术细节不谈,为啥他们不约而同都迷上了拿《我的世界》做实验?
《我的世界》就是个大型 AI 试验场
要说起在《我的世界》里训练过的 AI,那可就太多了。
著名的莫拉维克悖论是这么说的:一些任务对于人类而言很困难,例如下棋,但对 AI 来说很简单;而像《我的世界》这样开放世界中与环境交互、进行规划和决策等对人类来说较为简单的事情,对 AI 来说却是巨大挑战。
正因为这种情况的存在,在 AI 还不像现在这么发达的早几年,科学家们最初只是在《我的世界》里用 AI 完成一些简单的指令。
比如在 2019 年,Facebook 研发过一款《我的世界》AI 助手 "craftassist bot",这是一个智能协作式的助理机器人,可以执行人类玩家指定的各种任务,如驯服马匹、建造城市、与村民会面及交易等。也是在 2019 年,卡内基 · 梅隆大学、微软、DeepMind 和 OpenAI,联合机器学习顶级会议 NeurIPS 共同举办了一个叫做 "MineRL" 的专门针对《我的世界》游戏的 AI 比赛,到 2022 年一共举办了四届。
这个比赛同样见证了 AI 在《我的世界》中的应用由简单到复杂的过程。
比如第一届 MineRL 比的东西还很简单:看哪个研究团员能够创造出可以在《我的世界》中成功开采钻石的 AI。不过很惨,最后参加的 900 多个全球顶尖团队没有一个能完成挑战,一些 AI 撸掉木材却不会合成,一些 AI 造出了熔炉却不会冶炼,一些 AI 知道去地下挖矿,但却选择了垂直挖……
后来到了第三届,比赛内容就变成了看谁能训练出样本高效的《我的世界》AI 智能体。这一届的冠军是以 76.970 分的绝对优势夺冠的腾讯 AI Lab" 绝悟 "。
各种公司、机构密集开始在《我的世界》中训练 AI 其实也是最近五年的事。
美国国防高级研究计划局(DARPA)在 2020 年 8 月启动了自适应分布式概率任务分配(ADAPT)项目,以期在战场空间中利用 AI 协助指挥官进行决策,该项目的承包商 Aptima 公司用到的就是《我的世界》来训练 AI 与人类的互动能力。
2021 年哥本哈根信息技术大学、纽约大学和上海大学的研究者也创建过一个使用 3D 神经元胞自动机(Neural Cellular Automata,NCA)的系统,并将该系统部署在了《我的世界》里,这个时候的 NCA 已经可以建造毛毛虫、城堡、公寓楼和树等复杂的实体。
比较出圈的一次实验是在去年。
OpenAI 去年宣布由他们训练的 AI 已经做到了熟练游玩《我的世界》。通过引入一种新颖且便捷的 AI 训练法 " 视频预训练(Video PreTraining)",在向 AI" 投喂 " 了 7 万小时从相关合作方处获取的《我的世界》演示视频以及与视频配套的键盘鼠标操作记录后,OpenAI 旗下的 AI 的操作已经相当传神,掌握了只有人类才能领悟的高阶玩法。
OpenAI 在《我的世界》中的实操演示此外,DeepMind 也在今年年初开发出了能够媲美 OpenAI 成果的名叫 "DreamerV3" 的 AI 智能体。DreamerV3 在没有任何人工数据辅助的情况下,被丢进《我的世界》里摸爬滚打了 17 天,惊人地学会了如何从 0 开始挖钻石,成了世界上第一个纯靠自己摸索,就能在《我的世界》里速挖钻石的 AI 智能体。
当时 MineRL 比赛的发起人之一 William Guss 都忍不住第一时间发来贺电:4 年了," 钻石挑战 " 终于被攻克了!
没有谁比《我的世界》更合适了
《我的世界》面世 12 年,已经成为世界上最受欢迎的一款游戏,被许多玩家形容为电子版的乐高。早在 2019 年,《我的世界》就超过《俄罗斯方块》成为全球销量最高的游戏。
《我的世界》" 开放世界 " 的游戏属性让它成了科学家们训练 AI 的绝佳场所。
不同于 LOL 和王者荣耀等单一的战略对战游戏,《我的世界》并不预先设定目标,仅有的两个模式是 " 生存 " 和 " 创造 "。" 生存 " 模式中,玩家要造好房子并收集东西,保证活下来,即使是用来击退僵尸和蜘蛛的剑也需要玩家用木材和铁矿来锻造;" 创造 " 模式则更加自由,玩家使用各种功能的立方体,自由构建建筑物和物体,而且游戏永远不会结束。
如果说 LOL、王者荣耀或是很多棋类游戏因为简单的规则和游戏机制,可以让 AI 以极快的速度学习并超越战胜人类,《我的世界》游戏过程的复杂程度就几乎是在挑战 AI 的极限。
极度多样的环境、完全靠随机种子生成的地图、长决策序列与复杂的技能学习、高自由度玩法带来的海量策略偏好,都增加了《我的世界》AI 研究的难度。
比如,为了让 AI 在 15 分钟内找到钻石,AI 需要经历徒手采集原木、合成木板、木棍与木镐,采集到铁矿,经过一系列加工才能合成钻石,看似只是一件小事,但对于 AI 来说,却需要掌握其中复杂的逻辑关系——这还只是《我的世界》游戏的一部分,除了制造工具,AI 还需要给自己制定目标,学着在游戏世界里探索,直到解锁所有的游戏任务。
《我的世界》中找钻石的步骤而如果只是学下棋或是打 LOL,AI 只用知道怎么赢就行了。
是不是觉得,《我的世界》训练出来的 AI,要比靠下棋、玩 LOL 训练出来的 AI 高级多了(虽然学习速度可能慢了点)?
事实上在当前的 AI 研究中,科学家们会越来越追求通用人工智能(AGI)的研究,追求打造更通用的 AI 智能体,也就是发展 AI 智能体能够掌握广泛的技能,适应各种环境变化,更深入地模拟和应对人类在复杂问题上的能力,像人一样的进行感知、理解和交互(而不是只会回答简单问题、下棋能赢人类那种 " 小打小闹 " 的 AI)。
这就意味着要训练通用 AI,《我的世界》模拟的环境是非常合适的。
不过,开放世界游戏那么多,为什么又偏偏是《我的世界》呢?
有网友在推特向参与开发了 VOYAGER 的英伟达首席科学家 Jim Fan 发问说,既然 VOYAGER 是为开放世界而生,那为什么没有选择在《塞尔达》或者是《艾尔登法环》这样看上去更加宏大的开放世界游戏中作 AI 训练?
Jim Fan 的回答是,这中间的主要难点其实并不是算法,而是因为《塞尔达》和《艾尔登法环》这样的游戏运用了 " 缓慢且难以以编程方式控制高端控制台 ",并且 " 需要一个好的编码 API 来控制角色 "。相较之下,《我的世界》的技术门槛要更低,在目标和玩法类似的情况下,《我的世界》实际也为 AI 训练降低了难度。
另外,《我的世界》对开发者也很友好。许多用于构建《我的世界》的代码库都是开源的,所以人们可以很容易修改。并且该游戏也允许研究人员记录和学习人们是如何一起完成任务的,然后观察他们将如何与 AI 智能体一起工作。从这些意义上说,没有谁比《我的世界》来训练 AI 更合适的了。
这次《我的世界》里的 AI 有什么特别?
此次英伟达开发的 VOYAGER,和商汤科技联合清华大学、上海人工智能实验室等机构开发的 GITM,与过去基于《我的世界》训练的 AI 智能体最大的不同在于,引入了大语言模型(LLM)作为 AI 训练的核心方法。
以往在《我的世界》中训练 AI 用到的主流方法则是,模仿学习和强化学习。
即便是此前 OpenAI 和 DeepMind 开发出的最先进的《我的世界》AI 智能体,用到的训练方法也是模仿学习和强化学习。
打个比方,如果想让 AI 在《我的世界》里学会挖矿,模拟学习要做的就是先喂给 AI 上万个游戏视频,让它分析学习为什么要撸树,如何利用工作台进行分解合成,如何做出第一把镐子,如何冶炼铁锭,制作铁镐,获取钻石,如何避免落入岩浆,如何战斗等等挖矿的必要步骤。
等到投喂学习结束,AI 接下来就要接受强化学习,也就是把 AI 小人扔进《我的世界》,让它去 " 真正 " 执行挖矿的任务,通过反复实验来发现和解决问题,从而真正学会挖矿这一技能。
但在大语言模型的训练方法下,AI 的学习逻辑是被完全重构的。
依然拿挖矿来说,AI 智能体自身会首先根据 " 尽可能多发现不同的东西来帮助挖矿 " 的总体目标去提问、自动生成许多小任务,通过去存储有助于成功解决某个任务的行动程序(比如撸掉树木再去进行合成被验证是正确的,造出了熔炉就要去冶炼也是正确的),AI 就会逐渐建立起一个如何正确挖矿的技能库。而往后如果再遇到挖矿任务,AI 就可以根据其描述的嵌入在技能库中进行检索。
大语言模型训练方法下的 GITM也就是说,大语言模型的训练方法下,AI 是可以自主驱动探索并掌握广泛技能的,这就使得大语言模型方法更能帮助 AI 成为一个终身学习者,能在较长的时间跨度内逐步获得、更新、积累和迁移知识,同时缓解了其他持续学习方法中的 " 灾难性遗忘 "。
VOYAGER 探索物品量高于其他许多 AI 智能体有点像是一直让 AI 呆在学校里读书实习,还是让 AI 一开始就在社会里摸爬滚打的区别。
总而言之,用大语言模型方法在《我的世界》训练出来的 AI 更像一个真实的人了。
我们知道,一个理想的 AI 应该具有与人类类似的能力。《我的世界》里的 AI 不管是根据其当前的技能水平和世界状态提出合适的任务(如果发现自己处于沙漠而不是森林,就会在打铁前学会获取沙子和仙人掌),根据环境反馈完善技能并将掌握的技能存入记忆(比如打僵尸和打蜘蛛的技能类似),还是不断探索世界,以自驱动的方式寻找新任务,其实都已经和现实世界中人类的决策过程和行为方式非常相近。
说《我的世界》已经是一个缩小版的现实世界也许一点也不夸张。
而让人细思极恐的是,随着 VOYAGER 和 GITM 的研究成果发布,AI 现在已经能通关《我的世界》了。
这不禁让人猜想,AI 是不是很快就能在现实世界里如鱼得水,它能像人一样生活,会做饭、会用手机、知道怎么穿衣服、怎么养宠物、怎么坐公交地铁……更不可思议的是,它还能像人一样有自己的想法,知道穿哪件衣服好看,怎么做饭能更好吃,电话应该打给谁……没准在不久的将来,我们在生活中遇到到的 " 人 ",都无法分辨它是不是 AI。
既然都能通关《我的世界》了,AI 过上人的生活从技术上来讲也不是不能实现。
人类又会如何选择呢?
责任编辑:hnmd003
相关阅读
-
-
-
环球今头条!“车内打伞”名场面再现,汽车全景天窗是一个“美丽的错误”?
1932年,一家伟大的车企,在一辆汽车的脑门上凿了个洞,人们第一次从通过车顶获取到了阳光。那一辆由Austin
2023-06-03 -
微软、谷歌、英伟达领军,红得发紫的生成式 AI 在医疗已有哪些进展?-全球头条
生成式AI(GenerativeAI)的市场空间究竟有多大,这个数字随着新兴机会如雨后春笋般冒出正在不断被改写。但
2023-06-03 -
英伟达推出新 AI 模型 Neuralangelo 可将视频转换为高精 3D 模型
品玩6月2日讯,据科创板日报报道,英伟达宣布推出一款名为Neuralangelo的AI模型,该模型能够将视频片段转化
2023-06-03 -
滚动:中国科幻大会元宇宙产业峰会顺利落幕 当红齐天发布九大业态及四大平台
文 VR陀螺万里当时我第一次用OculusDK2,整个人一下子就陷进去了。怀揣着这一个VR梦,齐笑及其创办的北京当
2023-06-03
相关阅读
-
人类被 AI “毁灭”,一定是从教它玩《我的世界》开始的
上周,几乎是前后脚,英伟达和国内几家科研机构分别发布了两份内容相似的论文。首先是英伟达宣布开发出了一
-
众泰董事长请辞:复制别人一时爽,但不能一直爽 全球实时
在很长时间里都没有消息的众泰汽车,于近日发布了公告,称众泰董事会收到公司董事长黄继宏的辞职报告,申请
-
环球今头条!“车内打伞”名场面再现,汽车全景天窗是一个“美丽的错误”?
1932年,一家伟大的车企,在一辆汽车的脑门上凿了个洞,人们第一次从通过车顶获取到了阳光。那一辆由Austin
-
机器人如何担任私募基金经理? 今日快讯
作者|唐婧编辑丨周鹏峰一家小型私募连续两日公告,行业或迎首个AI机器人基金经理——赛博坦。1日,私募...
-
当前热议!被指参与监控俄罗斯 iPhone 用户 苹果公司回应:从未植入后门
财联社6月2日讯(编辑夏军雄)当地时间周四(6月1日),俄罗斯安全局表示,他们发现苹果与美国情报机构合作
-
原行长辞职后被认定“不称职”,这家银行经历了什么?
作者丨唐婧编辑丨周鹏峰图源丨图虫5月31日,青岛农村商业银行股份有限公司(下称青农商行)披露了即将召开
-
环球关注:罗永浩“三嫁”,京东直播任重道远
文|雷达财经,作者|孟帅,编辑|深海5月31日,2023年的618大促正式拉开帷幕。与以往不同的是,作为618大促的
-
外媒:美财政部高官会见中国大使,称双方进行“坦诚、建设性沟通” 全球时快讯
美国财政部发表声明称,美财政部负责国际事务的副部长杰伊·香博当天会见了中国新任驻美国大使谢锋,双...
-
全球热文:咸安统计局:开展经济普查“两员”培训
6月2日,区普查专班人员来到普查试点单位温泉办事处肖桥村对选聘的普查指导员,调查员开展经济普查试点工作
-
福满满养老年金险好不好?收益高违规吗?
福满满养老年金险是一款不错的养老产品。 1 保险金领取丰富 福满满养老年金有“三金”,除了基础的养老...
-
光大永明福运连年(B款)年金保险怎么样?怎么买?_焦点简讯
光大永明福运连年(B款)年金保险是一款以稳健理财为主题,提供长期收益和保障的年金保险。该产品的主要特点
-
年金保险属于寿险吗?适合什么人买?
是的。 年金险理财属性突显,以被保人生存为给付条件,属于人寿险的一种,但是不仅保生还可以保死,也就是
-
环球消息!逸享人生年金保险怎样查询?怎样领取?
1、中国保险万事通:客户可以在微信中搜索关注“中国保险万事通”微信公众号,在菜单栏“保单查询”中登...
-
高库存压顶,lululemon欲瓜分耐克们生意,门店狂开到二三线城市
在中国疯狂开店的lululemon正瓜分Adidas、Nike们的生意。6月1日,加拿大运动服装品牌lululemon(LULU US)发
-
岁岁盈盈年金保险条款是什么?到期没取会怎样? 天天聚看点
岁岁盈盈年金保险条款包括: 1、投保年龄:30天-60岁。 2、保障责任:15年或20年的满期生存金和豁免保险费
-
【播资讯】“新包头 新青年”作品展播|那位默默努力的快递小哥
(点击图片查看征文启事)著名作家果戈里说过:“青春之所以幸福,是因为拥有未来。”青年是冉冉升起的...
-
“最严”婴幼儿配方奶粉国标倒逼市场转向品质竞争
婴幼儿配方奶粉新国标于今年2月22日开始实施,按照规定,只有通过新国标配方注册的奶粉产品才能在中国境内
-
微软、谷歌、英伟达领军,红得发紫的生成式 AI 在医疗已有哪些进展?-全球头条
生成式AI(GenerativeAI)的市场空间究竟有多大,这个数字随着新兴机会如雨后春笋般冒出正在不断被改写。但
-
华为余承东:要用完美主义精神做产品|世界快资讯
5月27日,华为和赛力斯合作推出的汽车品牌问界下线第10万辆汽车。这个成绩,蔚来用了3年,理想汽车用了2年
-
“应战” 618,小红书派出“有故事的女同学”
图片来源@视觉中国文|文娱价值官,作者|刘娜娜,编辑|美圻第一次参加618的小红书,虽然不是电商小白,却属
-
悦安新材:6月2日融资买入459.05万元,融资融券余额1.52亿元
6月2日,悦安新材(688786)融资买入459 05万元,融资偿还564 08万元,融资净卖出105 03万元,融资余额1 23亿元。
-
众安保险退保的钱能要回来吗?退保怎么操作? 天天报资讯
可以要回来。不过,众安保险的产品种类繁多,不同的产品可能有不同的退保政策和要求。因此,在考虑退保之前
-
平安少儿保险是什么?一年需要多少钱?
平安少儿保险是由平安保险公司推出的一款专为未成年人设计的保险产品。该产品主要分为两类:教育形少儿保险
-
聚焦:国寿瑞鑫两全保险怎么样?提供什么保障?
国寿瑞鑫两全保险既能够为被保险人提供定期寿险保障,又可以实现长期储蓄的功能。该保险产品提供了多种选择
-
六十岁以上的老人买什么保险?买保险要注意什么?|世界今亮点
医疗保险是老年人最需要的保险之一,因为他们可能会面临更高的医疗费用和更多的健康问题。医疗保险可以帮助
-
百万医疗保到多少岁?一年需要多少钱?|每日头条
百万医疗险通常提供长达100岁的保障期限,只需符合续保条件即可。百万医疗险的投保年龄一般可以达到65周岁
-
售价220万!贾跃亭宣布FF 91第一位车主已签合同|最资讯
FF创始人兼首席产品和用户运营官贾跃亭在微博上宣布,设计界的”颠覆者”Rem成为FF首位车主,目前双方已...
-
迪士尼乐园有望落户武汉?官方:正在洽谈 今日聚焦
据“湖北发布”微信公众号消息,近日有网友询问武汉市相关部门,能否引进迪士尼乐园?武汉市蔡甸区回复...
-
E周新势力 | 理想2.8万辆创新高;售价30.9万美元,首辆FF91进入交付阶段;小鹏G6将6月9日开启预售_最资讯
E周新势力|理想2 8万辆创新高;售价30 9万美元,首辆FF91进入交付阶段;小鹏G6将6月9日开启预售1 5月新势力
-
我市举办“才聚两都”首场人才恳谈会 全球球精选
6月2日,我市“才聚两都”首场人才恳谈会在市党群服务中心人才会客厅举办。市委常委、组织部部长董欣悦...
精彩推荐
阅读排行
精彩推送
- 沈洋:在平凡岗位上守护群众平安
- 最新消息:《蒙古马》奏响大剧院
- 多彩活动 庆“六一”
- 英伟达推出新 AI 模型 Neural...
- 加油卡充值开具普通发票可以报销吗
- 15 个签署国,全面实施
- 张雪峰宣布:公司每周“上四休三...
- 华贵保险回应罚单:已完成全部处...
- 直播或成 B 站新的救命稻草?
- 一声叹息!股价仅剩 4 毛 3,...
- 热点聚焦:西藏雪山下的绿草地电...
- 【新视野】信美相互宜脉相连年金...
- 新资讯:合众福享金生年金保险怎...
- 太平福满e生年金保险怎么样?值...
- 富赢金生年金保险产品介绍有什么...
- 环球要闻:信泰如意鑫享养老年金...
- 全球速讯:我国大气环境质量继续...
- 绿水青山环水田 夏种插秧正当时
- 焦点播报:为学子撑起“保护伞”...
- 滚动:中国科幻大会元宇宙产业峰...
- moto razr 40 ultra,小折叠...
- 比亚迪这次,很可能没问题。
- 最新出手!撤销文件,紧急致歉
- 每日精选:这些账号禁止变现!新...
- 马斯克刚走,黄仁勋要来,科技大...
- 建设银行怎样转账到工商银行_当...
- 30 天,不开会:一家公司的提效...
- 欧洲央行加息炮火暂难停-全球快资讯
- 老年人发病率处于较高数位,如何...
- 不报事故、贻误抢救!“券业一哥...