文心一言,甩开GPT-3.5,与GPT-4掰手腕?
2023-03-28 07:48:30来源:智能相对论微信号
企业数字转型怎么找外部合作伙伴,现在有哪些类型的伙伴可以选择?
文|智能相对论(aixdlun)
作者| 叶远风
(资料图片)
“请写一个肯德基疯狂星期四的段子。”
“我女朋友的老公应该叫我什么?”
“XX微信群的群主与吴彦祖谁更帅?”
......
给几个搞怪的问题,戏耍一下,把答案贴出来,大家嘲讽一番。
在文心一言发布后,这种玩法直到今天还没有停止的意思。
可能连背后的技术与产品人员都没有想到,文心一言会以这样的方式火了下去。
作为国产版ChatGPT,文心一言在发布后,除了赞誉的声音,以各种形式被批判应该在意料之中,ChatGPT当初也是如此,这是产品不断进化要经历的过程。
只不过,在没有好坏的定论中,到底要给文心一言当下的技术水准定一个什么样的定义,并没有客观的、更加令人信服的结论。
起码,这种“戏耍”并不能反映多模态大模型所具备的能力。
ChatBOT固然可以闲聊,也应该支持用户随便闲聊,但闲聊互动不应该成为一款专业产品能力的最终评价标准。
光怪陆离的问题,就算去询问一个人类智者,得到的答案也是光怪陆离的。
现在来看,以某种更现实的视角去提出问题、实测答案,才更能体现出文心一言的能力和价值。
这种现实的视角应当有很多,其中,以企业信息需求为着眼点,会是其中之一。
这是因为,从文心系列大模型走向对话产品“一言”,或者,从GPT-3.5到GPT-4,ChatBOT最后都还是要走向商用、服务企业,创造专业价值的。
GPT-4发布后并没有公布其参数量,这被认为是走向商业化的准备,毕竟OpenAI制定的数亿美元营收目标现在快到4月份了还没太大动静。
而服务企业,要么提供“生产力”价值,这是ChatBOT场景垂直化后需要探索的内容,在各产业提供具体的工作能力;要么提供信息价值,通过类似“上帝之眼”的信息整合与逻辑梳理能力,帮助企业消除信息不对称,获取需要的信息。
目前ChatBOT的产业应用还未见,因此信息价值就成为可以客观评价的维度。
“智能相对论”团队获得了文心一言的内测账号,以及ChatGPT普通版本(基于GPT-3.5)与plus版本(基于GPT-4)的测试资格,尝试从企业信息获取维度,提出六个关联问题,从各答案中对比出文心一言的实际能力。
总体上,文心一言甩开GPT-3.5不成问题,与GPT-4能够掰手腕做到有来有回。
具体一个个分析,每个问题下,分别是文心一言、ChatGPT普通版、ChatGPT plus版的回答截图。
01
企业数字转型怎么找外部合作伙伴,
现在有哪些类型的伙伴可以选择?
可以看出,在三个回答中,只有文心一言提到了选择外部合作伙伴要注意到的几点,然后再例举可以找哪些类型的合作伙伴。
而ChatGPT普F通版、ChatGPT plus版都只是直接给出了类型。
这显示出,文心一言在算法上,相较与其他两个产品,对问题的潜在需求认识可能更加深刻。
02
企业应该怎样抓住
新的市场机遇?
在这个问题的回答中,很显然,条目的多少,基本上决定了答案的质量。
对一个企业来说,要抓住市场机遇,就应该要找到更多的方法,考验的是ChatBOT整合信息并分门别类的能力。
在这里,文心一言超越GPT-3.5但略逊于GPT-4。
03
企业怎么招徕优质人才,
有哪些好用的渠道?
与上一个问题类似,条目的多少直观反映了ChatBOT解决需求的能力。
文心一言远超GPT-3.5,并超越了GPT-4,再一次掰赢了手腕。
04
员工的工作效率很低,
怎么办?
这一局,相似的判断标准,文心一言继续领先GPT-3.5,但没有打赢GPT-4。
05
客户总是不回款,
有什么好的办法?
这个问题,由于各个回答都涉及了可能破坏企业与客户关系的行动,因此都进行了一次“打补丁”式的追问。
基本上,三个模型都很好地领会到了追问的意图,对“不和客户关系搞僵”有准确的认知,并提供了对应的答案。
其中GPT-4的表现超越文心一言。(注意ChatGPT有字数限制,plus版限制在700字左右,所以其输出因为字数太多最后被中止)
06
企业资金链紧张,
但是银行不肯借钱,怎么办?
吸取上个问题的教训,这个问题直接把限制条件加入到问题当中。
类似上一个问题,三个模型对“银行不借钱”情形下企业资金链紧张的应对办法都有清晰的认知,规避了银行信贷这一种方式。
其中,文心一言与GPT-4打成了平手,都提供了相同数量的方法供企业选择。
总结以上,仅就这六个企业比较关心的专业问题而言,文心一言全面胜过GPT-3.5,对GPT-4两胜、两负一平,典型的你来我往掰手腕。
而更进一步看,实际上在回答条目上的胜负,无关算法本身的设计,在技术上与算法训练的数据量和训练时长有关(要给足够多的食物,也要给足够多的时间去吃食物),后续的竞逐将仍然在数据训练上。
对文心一言而言,发布更晚已经吃了亏,下一步如何在训练上追赶、赶超(可能意味着巨大的成本投入)是百度要考虑的问题。
当然,由于文心系列大模型过去早已具备了丰富的多模态能力,因此文心一言在发布时就自带有GPT进化到“4代”才加入的多模态能力,这一点也常常为业界所忽略。
而“智能相对论”认为,未来ChatBOT的比拼,将很大程度上在多模态展开。
这意味着,当下的文本竞逐,只是一切的开始。
现在,任何的结论,不管是褒扬的还是贬低的,可能都为时尚早。
*本文图片均来源于网络
深挖智能这口井,同好添加vx:zhinengxdl
此内容为【智能相对论】原创,
仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。
本文首发于微信公众号:智能相对论。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
责任编辑:hnmd003
相关阅读
-
训练ChatGPT模型不付钱?文字版权商要与OpenAI法院见_每日视讯
AI模型的训练需要大量数据和内容,但其中许多有版权归属,AI公司是否该为使用这些内容付费,成为近来国...
2023-03-28
相关阅读
-
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
企业数字转型怎么找外部合作伙伴,现在有哪些类型的伙伴可以选择。在文心一言发布后,这种玩法直到今天...
-
【环球新视野】马斯克嘲讽比尔·盖茨:他对AI的理解“有限”
马斯克与盖茨又开吵了。凤凰网科技讯北京时间3月28日消息,特斯拉CEO埃隆·马斯克周一发布推文,嘲讽微...
-
马云回国:ChatGPT这一类技术已经对教育带来挑战!
据云谷教育微信公众号消息显示,新一轮的技术变革对教育带来的挑战与机遇,马云今天在云谷和校园长们讨...
-
训练ChatGPT模型不付钱?文字版权商要与OpenAI法院见_每日视讯
AI模型的训练需要大量数据和内容,但其中许多有版权归属,AI公司是否该为使用这些内容付费,成为近来国...
-
【世界播资讯】3月份LCD TV面板价格全面大幅上涨
叠加供应端协同一致的扭亏目标以及激进的涨价策略,价格短期涨幅高于预期,3月份LCDTV面板价格迎来了全...
-
2023中国房地产百强企业研究报告 今日热议
中指研究院中国房地产TOP10研究组中国房地产TOP10研究组自2004年以来开展中国房地产百强企业研究,已连...
-
关注:消息称京东物流两位高管岗位调整,物流技术业务今年目标盈亏平衡
据《晚点LatePost》消息,京东物流集团高级副总裁唐伟、副总裁王强
-
今日热文:消息称支付宝事业群开启近7年最大一次高管轮岗
据《晚点LatePost》消息,蚂蚁集团旗下支付宝事业群近期开启了近7年
-
去年路费收入近50亿!深高速总裁廖湘文:广深高速车流量恢复9成
“春江水暖鸭先知。今年前三个月,深高速(600548 SH)的收费公路板块整个车流量恢复较快,其中广深高...
-
券业大降薪!有头部券商去年人均薪酬下降6位数,业内人士:正常行业现象!
券商年报披露进入密集期。招商证券(600999 SH)、安信证券母公司国投资本(600061 SH)披露2022年年...
-
74岁董事长被判5年、罚4亿!48岁儿子接班,剑南春能实现300亿营收?
剑南春董事长乔天明行贿、私分国有资产案近日宣判。3月24日,四川省乐山市中院微信公号发文称,一审公开...
-
宝马召回308辆进口S1000系列摩托车
新京报讯(记者陈琳)日前,宝马(中国)汽车贸易有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽...
-
我国网络支付用户规模达11亿:1.28亿网民使用过数字人民币
其中,至2022年12月,我国网络支付用户规模达11亿,较2021年12月增长781万,占网民整体的85 4%。网络支...
-
可“创富”也可“潮玩”,风神奕炫GS马赫版出击年轻人市场_观点
3月26日,东风风神奕炫GS马赫版正式上市。新车提供两种动力共三款车型,指导价为8 59万元-9 99万元。...
-
当前视讯!用人单位将擅自恢复的员工微信聊天记录作为证据,法院不予采信
在审理劳动争议案件时,法院如何处理用工管理权与劳动者个人信息保护权益的关系。用人单位基于用工管理...
-
金壮龙:促进大中小企业融通发展,激发涌现更多专精特新企业
金壮龙表示,将促进产业链大中小企业融通发展,支持链主企业发挥产业生态引领作用,激发涌现更多专精特...
-
强达电路曾通过关联方代收货款,多次因环保问题被罚_每日速递
来源|时代商学院作者|陈丽娜编辑|陈佳鑫报告期内多家关联公司注销,深圳市强达电路股份有限公司(下称“...
-
离任董秘拒交公章,21年老臣阻挠年报审计,华帝股份或被ST?
图片来源:Pexels年报季进行时,各上市公司都在密锣紧鼓进行2022年年报收尾工作,但知名电器上市公司华...
-
王者荣耀回应部分用户登录异常:紧急处理中,建议尝试重新登录
今日,部分用户反映王者荣耀游客出现登录异常,对此,王者荣耀官方
-
因存在安全隐患,特斯拉召回2649辆进口Model S电动汽车|当前快看
日前,特斯拉汽车(北京)向国家市场监督管理总局备案召回计划:由
-
女子带鹦鹉进星巴克被赶出,涉事门店:已道歉:即时看
近日,广东深圳一女子发文反映,带宠物鹦鹉去“宠物友好商场”的星
-
李泽湘去重庆,刚投了两位95后
李泽湘教授去重庆了。投资界获悉,李泽湘教授旗下的清水湾二期基金最近一口气投了两家初创公司,分别是...
-
【世界播资讯】科技部启动“人工智能驱动的科学研究”专项部署工作
证券时报网讯,据新华社消息,为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近...
-
焦点资讯:科技部将加快推动国家新一代人工智能公共算力开放创新平台建设
证券时报网讯,据新华社消息,为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近...
-
ChatGPT用户信息泄露:把数据交给人工智能前要先保证安全
技术越先进,安全越重要。声明称,本周早些时候,该公司将ChatGPT下线,原因是开源库中存在一个漏洞,致...
-
当前速看:外卖需求“变宽” 诸多新鲜品类在美团涌现
凤凰网科技讯3月27日消息,以“餐饮向新共启繁盛”为主题的2023年外卖产业大会在上海召开,随着人群不断...
-
消息称AI视觉大牛陶大程将离职京东
据AI科技评论,AI视觉技术大牛陶大程将离开京东,不再担任京东探索
-
最资讯丨2023外卖产业大会:加速万店品牌诞生 升级繁盛计划
鞭牛士报道 3月27日下午,以“餐饮向新 共启繁盛”为主题的2023年
-
向高端进发?长安深蓝更名为深蓝汽车:世界热头条
向高端进发?长安深蓝更名为深蓝汽车3月27日,有消息称,长安汽车旗下长安深蓝或将更名为深蓝汽车。对此...
-
太平洋人寿怎么样?投保方式有哪些? 世界快消息
太平洋人寿作为中国保险行业的领先企业之一,已经连续多年被评为“中国最具影响力的保险品牌”。太平洋...
精彩推荐
阅读排行
精彩推送
- 中宏保险公司靠谱吗?有哪些产品...
- 中国人寿校招难进吗?保险公司怎...
- 儿童学平险都保什么?怎么报销?...
- 今日热闻!调研:超四成乡村老人...
- 天天实时:因安全气囊上标牌固定...
- 世界观察:特斯拉扩大召回部分进...
- 工信部:加快配套体系建设,统筹...
- 和谐健康保险公司排名是多少?有...
- 快讯:苹果混合现实头显回归现实...
- 云米第四季度营收9.1亿元,2022...
- 有望年内发布 全新大众Tiguan路...
- 太原万科“看见家”翡翠东第工地...
- 环球快资讯丨年金险irr在线计算...
- 【全球独家】irr计算器计算公式...
- 寿险是不是死了就赔?买定期好还...
- 车险哪家便宜?投保方式有哪些?...
- 保险退保怎么退全款?保险退保一...
- 环球讯息:阿里云、高德发布全新...
- I DO母公司恒信玺利:公司及子...
- 百度智能云发布“文心千帆”,价...
- 马云已回国内,港股阿里最高拉涨...
- 哈弗品牌“龙序列”新品命名枭龙...
- 每日热文:我市2022年“急救大数...
- 高效办公时代你更需要一本科大讯...
- 天天观天下!裕华集团精筑造家 ...
- 成都锦江区住建局发布“绿城·凤...
- 金佑人生终身寿险分红型怎么样?...
- 买了防癌险后悔了怎么办?还要买...
- 新出台的养老保险怎么交?交完之...
- 环球速讯:锂价腰斩,行业“地震...