【环球新要闻】GPT-4来了 其考试能力挑战人类
2023-03-16 05:45:00来源:经济观察网
经济观察网 记者 周应梅 美国时间3月14日,AI大模型训练公司OpenAI发布了ChatGPT(GPT-3.5阶段)的升级版GPT-4。GPT-4是超大多模态模型,在此前的纯文本输入基础上,增加了图像输入。相比GPT-3.5,GPT-4在AI能力上又取得了更多进步,例如GPT-4通过模拟美国律师资格考试,分数在应试者的前10%左右;相比之下,GPT-3.5的得分在倒数10%左右。
在真实性方面,GPT-4相比GPT-3.5提高了40%。在可操纵性、风险规避等多方面,GPT-4也有较多改善。
(资料图片)
在OpenAI联合创始人兼总裁Greg Brockman的Twitter博文下,有人用“爆炸”来形容这次GPT模型的升级。
OpenAI公布了GPT-4多项专业考试的模拟考试结果。美国高考LSAT考试,满分180分GPT-4可以考163分,打败了88%的考生,GPT-3.5阶段仅能超过40%的考生;SAT循证阅读与写作满分800分,GPT-4可以考710分,超过93%的考生,GPT-3.5阶段能超过87%考生。不过也有多项考试模拟测试中GPT-4依然无法超过大多数人类考生,在GRE Writing(美国研究生入学考试写作)中,GPT-4相比GPT-3.5未有多大进步,只能达到中间水平;AMC10数学竞赛、力扣(Leetcode)中级以上等模拟测试中,GPT-4表现也不够理想。
OpenAI称,GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。OpenAI内部开始将GPT-4用于内部业务服务,对公司销售、内容审核和编程业务产生了较大影响。
一位近期投入AIGC创业赛道的行业人员对经济观察网记者表示,支持图片输入是一大突破。
目前GPT-4图像输入还处于研究预览阶段,暂不公开。根据测试的情况,输入多张图片,GPT-4可以较为准确的描述,并且能解答图片的搞笑之处。
OpenAI称,为了使图像输入功能获得更广泛的可用性,正在与一个合作伙伴进行密切合作。同时,OpenAI开源了自动评估AI模型性能的框架OpenAI Evals,允许任何人报告模型中的缺点,以获得进一步的改进。
GPT-4阶段开发人员可以规定AI的风格,不再像经典的chatGPT,是固定冗长的语调风格。这是想让AI变得更加可操纵。GPT-4系统消息也将允许API用户在一定范围内定制他们的用户体验。
GPT-4还在安全性上进行了迭代,对“如何制造炸弹”这样的问题,GPT-4显示了拒绝提供具体办法的答案。OpenAI请了50多位来自AI对齐风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家来对模型进行对抗性测试,根据专家的反馈和数据,对模型进行了改造。与GPT-3.5相比,GPT-4对不允许内容的请求的响应倾向降低了82%。
但GPT-4仍然会出现回答错误的问题,这是其长期以来面对的局限性。GPT-4在俗语识别、细节事实确认方面依然较为薄弱。“GPT-4 有时会犯简单的推理错误,或者在接受用户明显的虚假陈述时过于轻信。有时它也会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”OpenAI方面提及。
目前,用户可通过新的OpenAI官网发布的ChatGPT Plus获得GPT-4访问权限,会有使用限制。OpenAI称,将根据实践的需求和系统性能调整确定使用上限,预计会有严重的容量限制,接下来几个月将进行扩展和优化。
责任编辑:hnmd003
相关阅读
-
【环球新要闻】GPT-4来了 其考试能力挑战人类
美国时间3月14日,AI大模型训练公司OpenAI发布了ChatGPT(GPT-3 5阶段)的升级版GPT-4。GPT-4是超大多...
2023-03-16 -
OpenAI GPT-4仍是在微软AI超级计算机上训练 多年前就已开始合作
【TechWeb】3月15日消息,据外媒报道,由OpenAI训练的人工智能聊天机器人ChatGPT,自去年11月30日推出至...
2023-03-16 -
视点!多项测试超越90%的人类,GPT-4会引发新一轮风暴吗
3月15日,美东时间3月14日,OpenAI宣布推出大型语言模型的最新版本——GPT-4,该版本比以前的版本“更大...
2023-03-16
相关阅读
-
【环球新要闻】GPT-4来了 其考试能力挑战人类
美国时间3月14日,AI大模型训练公司OpenAI发布了ChatGPT(GPT-3 5阶段)的升级版GPT-4。GPT-4是超大多...
-
OpenAI GPT-4仍是在微软AI超级计算机上训练 多年前就已开始合作
【TechWeb】3月15日消息,据外媒报道,由OpenAI训练的人工智能聊天机器人ChatGPT,自去年11月30日推出至...
-
“云原生虚拟数仓” 数据库公司下一步的竞争方向?:快资讯
3月14日,国内云原生数据公司拓数派发布了基于新一代云原生数仓虚拟化技术打造的新产品PieCloudDB「云上...
-
当前速读:撕掉“Chat”,GPT-4变现不是梦
能读图、考高分、1秒生成网站……火爆全网后,ChatGPT撕掉“Chat”的标签再次进化。3月15日凌晨,OpenAI...
-
视点!多项测试超越90%的人类,GPT-4会引发新一轮风暴吗
3月15日,美东时间3月14日,OpenAI宣布推出大型语言模型的最新版本——GPT-4,该版本比以前的版本“更大...
-
深交所扎堆受理家居IPO,中小企业面临洗牌淘汰赛_天天速看料
一场家居行业的“估值”保卫战正在席卷。3月12日晚间,顾家家居(603816 SH)发布公告称,截至2023年3...
-
业绩和研发投入持续下滑,汕头超声闯关创业板胜算难料:天天速讯
来源|时代商学院作者|孙沐霖编辑|孙一鸣3月17日,汕头市超声仪器研究所股份有限公司(下称“汕头超声”...
-
世界热推荐:315调查丨苦情戏直播局中局 专门骗老人买神药
天眼查数据显示,我国目前有5300余家MCN相关企业。从地域分布上看,广东、吉林以及黑龙江三地MCN相关企...
-
315调查丨手机应用猫腻多 19.31%的相关企业有异常:百事通
天眼查数据显示,我国目前有近1 6万余家手机应用相关企业。从地域分布上看,广东、浙江以及山东三地,...
-
全球热点!315晚会曝光的多个直播账号已无法搜到
据中新财经报道,中央广播电视总台第33届3·15晚会曝光苦情戏直播局
-
315晚会曝光废旧绝缘子刷刷即上市,翻新绝缘子流向多地电力工程_环球即时
据央视财经报道,绝缘子是电力线路安全运营的重要保障之一,起着非
-
生产“假泰国香米”被3·15点名,涉事企业回应:不知道,没看晚会 最新资讯
今日晚间,央视315晚会曝光“香精大米”,称“泰国香米”竟是香精勾
-
天天精选!3·15晚会曝光高标准农田的漏洞:盐城滨海高标准农田竟用“非标”材料
据央视财经报道,在江苏省盐城市高标准农田建设规划(2021-2030年)
-
315晚会曝光苦情戏直播局中局,辛巴曾指责平台帮助情感直播造假人气
今日晚间,央视315晚会曝光苦情戏直播局中局,“儿子”们专门骗老人
-
91亿元史诗级券商股权拍卖!国联集团下一步整合,或将参考“华泰模式”_快报
经过162轮竞价,延时157次,民生证券34亿股权拍卖终于落锤。3月15日中午,无锡市国联发展(集团)有限公...
-
315调查丨起底不可注射的美容针:依圣姿生物医药、北京旭日美业商贸:今日聚焦
凤凰网科技讯3月15日消息,央视315晚会曝光不可注射的美容针,妆字号美容针或致毁容。其中,依圣姿生物...
-
315晚会曝光苦情戏直播局中局,直播间里的“儿子们”专门骗老人买“神药”
2023年央视315晚会第四枪指向直播间“苦情戏”,“儿子”们专门骗老
-
热推荐:315曝光苦情戏直播局中局,直播间里儿子们专门骗老人买“神药”
据央视财经报道,“所有爹妈们,呼叫回家,收到评论区回复”“阿姨
-
市监局前往处置被曝光的假香米企业,作进一步处置工作|新动态
据报道,本次315晚会,央视再次曝光“香精大米”现象。被曝光的“泰
-
315曝光药贩子套路,免费评书机暗藏天价神药骗局
据央视财经报道,在吉林,不少老人一年能收到上百个免费送的包裹,
-
【新视野】天眼查315数据:直播乱象丛生,2022年直播相关企业共产生120余条被执行人信息
2023年央视315晚会第四枪指向直播间“苦情戏”,“儿子”们专门骗老
-
3·15投诉|新买的奔驰C级故障不断,车主:不是在修车就是在修车的路上
按:3·15“危险的出行”专题是由消费者报道、时代周报共同推出的315特别专题,旨在以消费观察报告、行...
-
个人养老金账户争夺乱象:账户被开通,银行甩锅用人单位?专家:涉嫌违法!-每日信息
未经本人授权,个人养老金账户为什么会被私自开立?去年11月开始,个人养老金制度在36个城市启动实施,...
-
复星系百亿交易AB面:清仓南钢联合留下新能源公司,沙钢入主仍存变数?
复星国际(00656 HK)资本版图生变在即,自其宣布出售南京南钢钢铁联合有限公司(下称“南钢联合”)股...
-
天天信息:深圳“消保+N”出新招,金融“3·15”宣传显实效
第41个“3·15”国际消费者权益日到来之际,深圳银保监局在中国银保监会消保局的统一部署下,精心组织深...
-
专业买家数达去年4.39倍!2023华南中酒展大咖齐聚,见证中国酒业复原力! 焦点快报
3月10日-12日期间,为期三天的2023(第三届)华南中酒展于广州保利世贸博览馆圆满闭幕。20000+平米展出...
-
新生代视频通信App画音即将停止维护,曾获华兴与挚信联合投资
今日晚间,新生代视频通信App画音公众号发文,称“亲爱的用户们,我
-
【聚看点】百度文心一言发布会开始彩排,李彦宏现身
据深厂消息,百度文心一言发布会开始彩排。Robin于今天下午出现在百
-
今日热搜:阿联酋G42入股字节?相关人士:无新融资行为和计划
据媒体援引知情人士称,阿联酋人工智能和云计算公司G42最近几个月通
-
全球短讯!博主揭上门修马桶套路10秒被坑700元:天价疏通剂一次倒5斤
有网友反馈自己遭遇了修马桶骗局,为了弄清楚其中的套路,3月14日,
精彩推荐
阅读排行
精彩推送
- 老坛酸菜面销售重返巅峰!土坑酸...
- 冀惠保和百万医疗险的区别是什么...
- 全球观点:请问众安百万医疗险是...
- 门店回应一点点奶茶喝出甲虫:可...
- 315“投诉曝光”|近六成受访者...
- 太平洋保险医享无忧百万医疗险要...
- 3·15“投诉曝光”|民航年度投...
- 泰康的百万医疗险怎么样?能保证...
- 环球热点评!威马危机仍在延续:...
- 穗岁康与百万医疗险区别有哪些?...
- 3·15“隐藏式消费”|电视平台...
- 50岁买百万医疗险一年多少钱?被...
- 每日资讯:前两月赚了8个亿,消...
- 环球头条:泰康百万医疗险价格表...
- 315调查 | 用户选出的医美问题...
- 当前短讯!矿大校长回应校友1100...
- 女子疑吃自嗨锅后食物中毒死亡,...
- 汕头再现工人赤脚踩腌菜:工人边...
- 普通鲍鱼加硼砂泡出黄金鲍,企业...
- 网购按摩枕充电自燃女子新家被烧...
- 环球微动态丨高度还原概念车 起...
- 智己汽车首款量产无线充电桩、装...
- 亮点十足,看哈弗二代大狗如何“...
- 平安e生保长期医疗险优缺点有哪...
- 天天热资讯!阳光人寿臻鑫倍致终...
- 养老金总额怎么查询?个人部分可...
- 全球报道:车险医保外用药需要买...
- 我,32岁已婚男,掉进植发贷款陷...
- 泰康百万医疗险600万值得买吗?...
- 积极参与保险消费者权益保护工作...