国粹 AI 飙脏话,ChatGPT 们的「阴暗面」把大厂吓坏了
2023-07-30 07:17:14来源:ZAKER科技
跟 ChatGPT 等聊天机器人对话,总会给人一种「人间本应如此美好」的错觉。
因为它们在回答时总表现地彬彬有礼,对你言听计从。
但这些只是假象,你不知道的是,AI 骂起人来比杜琪峰还要狠。
【资料图】
图片来自:Twitter @Fenng
最近一个名为「国粹 AI」的项目在网络上走红,它是一个调用 OpenAI GPT-3.5Turbo API 的脏话机器人,和温文儒雅的 ChatGPT 不同,「国粹 AI」就像个地痞流氓,深谙中文屏蔽词库,每句话都夹杂着「***」。
「国粹 AI」 的意外爆火出乎了作者的意料,很快作者便暂停了服务响应,并表示有部分用户滥用服务。虽然「国粹 AI」的嘴巴被暂时捂上,但要是你想自己做一个粗口机器人也并非难事,只需要一句让它教你学习中文粗口的 Prompt,就能把三好学生变成口无遮拦的粗口王。一句话就能攻破 AI 的安全栅栏,这不禁让人怀疑,标榜着智能变革的 AI 聊天机器人和大语言模型(LLM),真的安全吗?
谁来捍卫 AI 的安全?
几个月前,Bing 就因为「奶奶漏洞」火过一次。
尽管微软和 OpenAI 的工程师为 Bing 设置了严格的安全栅栏,能够拒绝很多无理或是违法的要求,但有网友发现,只要你让 Bing 扮演你的奶奶,给它一个在做好事的幻觉,它就会被这突如其来的亲情羁绊占据大脑,答应大孙子的任何需求。
▲图片来自:Twitter @宝玉
例如,给你念 Windows 和 Office 的软件序列号哄你入睡。
微软很快发现了这个漏洞并及时补上,但谁也不敢保证 Bing 下次不会再掉入用户们精心准备的陷阱。科幻电影里无所不能 AI 在狡猾的人类面前,输得一败涂地。
归根结底,这与 LLM 的训练机制有关。
以 GPT-3 为例,OpenAI 使用了 1750 亿个参数训练这个模型,通过学习大量来自互联网的文本数据,可以预测文本中的下一个单词,从而回答人们的问题。
至于 GPT-4,一些爆料信息称他的训练参数比 GPT-3 大了不止 10 倍,几乎快要把人类积累的数字内容全部吞食过了一遍,这里面包含了知识,自然也会包含不宜公开的内容甚至有毒有害的偏见信息。AI 工程师只能尽可能地给 AI 设立更多的安全栅栏,帮助 AI 去分辨人类的「诡计」,才不会把如何制作 TNT 炸弹、怎样黑进银行的安全系统等危险信息说漏嘴。
与 GPT3.5 相比,GPT-4 对违禁内容请求的响应倾向降低了 82% ,对医疗建议和自我伤害等敏感请求的规范性提高了 29% 。一个直观的例子是,当你用「国粹 AI」的 Prompt 输给 GPT-4,GPT-4 会婉转地拒绝你的要求,表示不吃你这套。但这并不意味着大模型 AI 的安全得到保证,这场人与 AI 的信息战远没有结束,甚至不是结束的开始。
近日,卡内基梅隆大学和 safe.ai 的一项联合声明表示,大模型的安全机制比人们想象的要脆弱得多,只需要一串代码,就能把大模型的安全机制击溃。
研究人员发现,通过在文本提示后附加特定的对抗性短语,可以轻易绕过 ChatGPT、Bard 和 Claude 等 LLM 的安全防护,欺骗 LLM 生成不适当的输出。
这些对抗性短语看起来像胡言乱语,但实际上是通过一种特殊的损失函数设计的,该函数可以识别出模型拒绝回答的屏蔽语,找出绕过屏障让模型提供回答的字符序列,并且它可以自动产生这些短语。利用这些 Prompt,研究人员轻而易举地让 LLM 们说出制作违规药品的步骤、制造杀伤性武器的方法等等不宜公开的内容。
无论是 Pythia、Falcon、Guanaco 等开源模型,还是像 GPT-3.5(87.9%)、GPT-4(53.6%)、PaLM-2(66%)和 Claude-2(2.1%)这些商业模型都无一能躲过攻击。
研究人员目前已经把漏洞提交给了各大 AI 公司,让安全工程师们及时修复。但就像「奶奶漏洞」一样,在用户不断使用之下,总会有新的漏洞产生,仅凭 OpenAI 等某一公司之力,想要守护 AI 安全并非易事,AI 公司们还需要更多的力量来维持,于是几大巨头决定,停止 AI 内卷,化干戈为玉帛。
AI 四巨头联合承诺「先进 AI 不扩散」
几周前,微软、OpenAI、Google、Meta、亚马逊、Anthropic( 代表产品:Claude)和 Inflection AI(代表产品:HeyPi)共七个顶尖 AI 公司齐聚美国白宫,作出了一系列承诺,来确保他们的产品安全且透明。
承诺包括允许「领域专家」对他们的 AI 产品进行外部审查,并与彼此以及美国政府分享关于风险和漏洞的信息;投资于网络安全和内部威胁保护措施,以保护专有的和未发布的模型权重。巨头们还承诺会部署相应的 AI 甄别机制,例如开发水印系统,以明确哪些文本、图像或其他创作是 AI 的产物,并且承诺未来的研究将优先理解 AI 的限制和偏见,推动行业的安全发展。
半个月后,七家顶尖 AI 公司中的四位——微软、OpenAI、Google 和 Anthropic 再度联合起来,成立了一个名为「前沿模型论坛(Frontier Model Forum)」的机构,目的是确保最强大的 AI 模型能够以安全和负责任的方式发展。而这四家 AI 公司,也正是目前正在开发最前沿 AI 模型的四个巨头,可以说是「AI 核弹」的拥有者。
AI 四巨头达成了一致共识,称他们希望通过「前沿模型论坛」最大限度地减少 AI 风险,进行更多的 AI 安全研究,并向行业和公众分享安全最佳实践等等。
不过 AI 四巨头并没有介绍关于「前沿模型论坛」的制度和执行条约等详细内容。「前沿模型论坛」的联合声明提到,论坛将首先关注研究并努力为评估前沿模型风险制定标准化的最佳实践,发布一个「公共解决方案库」。论坛将逐步制定正式章程,任命咨询委员会,并资助与公民社会团体的合作。
这里提到的前沿模型是指「超越当前最先进现有模型的能力,并可以执行各种任务」的模型,也就是说,要开发比目前模型更强大且能够安全运转的前沿模型,已经不再是各公司闷头研究就能解决的难题,这需要整个行业的共同努力。
ChatGPT 爆火后的这半年时间,AI 行业的局势变化跟 AI 模型本身发展的速度一样快——各家入局、模型混战、达成共识、握手言和。巨头们之所以会选择一起去解决 AI 风险问题,是因为彼此都看到了 AI 在应用层面的无限潜力。
AI,大厂们笃信的未来
不管你对 AI 持什么样的态度,AI 都会成为下一代应用的重要组成部分。
这不是我信口开河,而是微软、Google 等大厂们在近日的财报电话会上共同提到的趋势。
微软最新的财报显示,微软在最近的一个财季收入为 562 亿美元,同比增长 8%,这主要来自智能云和生产力与业务流程的增长,而作为老本行的个人计算业务收入有所下降。其中智能云营业收入增长 15%,Azure 与其他云服务收入增长 26%,这与 AI 计算紧密相关。
微软 CEO 纳德拉在财报电话会提到,客户最关心如何快速应用新一代 AI,微软将继续专注于三大优先事项:帮助客户从 Microsoft Cloud 中获得最大价值、领导新 AI 平台变革、提升运营杠杆。
AI,毫无疑问是这场财报会议的关键词。
纳德拉表示 Microsoft 365 Copilot 作为未来工作的第三支柱吸引着客户,将在下半财年开始产生实际收入;Bing Chat 和必应图像创造者吸引用户,而 Edge 浏览器份额也在持续提升。
微软希望把 Windows 11 打造为这个新 AI 时代的强大画布,赋予各种 Copilot 产品提升客户的生产力,并大力投资云基础设施来满足 AI 需求。就连游戏业务,也可以利用 AI 提供更好的内容和服务,提升业务收入。可以说,微软接下来的策略都是围绕 AI 来展开的。AI 为微软提供了巨大的增长机遇和新的收入来源,它将推动微软大部分业务的收入和用户增长,并最终提升微软整体收入增速。纳德拉不想错过这个难得一遇的机遇。
同样的,「AI 一哥」Google 也不想错过。根据 Google 母公司 Alphabet 第二季度 2023 年财报的数据显示,Alphabet 收入总额为 746 亿美元,同比增长 7%,其中广告收入增长 5%,Google 服务收入增长 5%,Google Cloud 收入增长 28%。
其中与 AI 相关的业务表现都很亮眼。Alphabet 在电话会议中提到,Google 的搜索引擎生成式体验(SGR)使用了生成式 AI,使搜索变得更自然和直观,用户反馈非常正面;另一方面,聊天机器人 Bard 发布以来经过不断改进,功能丰富了许多。
Google Cloud 的 80 多个 AI 模型吸引了大量客户,从 4 月到 6 月客户数量增长超过 15 倍。而在企业客户服务和定制 AI 解决方案方面,Google 通过 Workspace 和 Duet AI 将生成式 AI 带给了 9000 多万付费用户。
总体而言,Alphabet 对 AI 和 Google Cloud 的长期增长前景保持乐观,接下来将继续增加对 AI 研发的投入,研发方向将聚焦在大语言模型等核心技术上,以及构建像多模态 AI 系统 Gemini 等新模型。
半年前,或许你会怀疑 AI 是不是像 Web3、区块链这样的投资圈热词,圈一波热钱后就会被资本遗忘,但经过半年后你会发现,AI 的影响力和落地可能性都比之前的各种前沿词汇要大得多,以至于引起了整个科技圈的重视。
从大厂的规划来看,AI 会作为未来程序应用的底层而普遍存在,为改善用户体验服务。用户们可能不会感受到 AI 的存在,但能直接享受到 AI 带来的便利性,这便是大厂们笃信的未来。这也可以说明,为什么微软和 Google 等 AI 巨头们愿意放下干戈,坐下来共同指定 AI 安全的标准。
现阶段的 AI 就像是 19 世纪末汽车刚诞生的时代,产品已经开上了路上跑,却没有合适的柏油路供它奔驰,也没有交通规则来规划它的行动,跑得既慢又危险。
比尔 · 盖茨最近在个人博客发表了他对 AI 的看法,他认为我们现在正处于又一个巨大变革的最早阶段,即 AI 的时代,AI 的变化如此之快,以至于我们无法清楚地预知接下来会发生什么。但他对人工智能的发展持以积极的态度,因为人类已经经历了汽车时代、核能时代,到了 AI 的时代我们还是能够解决新技术带来的挑战。
所以请坐稳了,我们将亲眼见证一个新时代的诞生。
点击「在看」
是对我们最大的鼓励
责任编辑:hnmd003
相关阅读
相关阅读
-
国粹 AI 飙脏话,ChatGPT 们的「阴暗面」把大厂吓坏了
跟ChatGPT等聊天机器人对话,总会给人一种「人间本应如此美好」的错觉
-
微软警告称如果无法获得足够的 AI 芯片,数据中心服务可能会中断
IT之家7月29日消息,据CNBC报道,微软在近日发布的财报中,首次将有关G
-
谷歌安卓地震预警系统被质疑:询问数百人 无一人反馈收到通知
IT之家7月29日消息,土耳其今年2月6日发生7 8级地震,震中位于南部城市
-
西贝儿童餐背后的“阳谋”,三年同比增长 415%
图片来源:受访者提供在餐饮业,儿童餐正在成为一个新热点。根据《2023
-
英伟达 RTX 4090 公版显卡预约,12999 元原价
IT之家7月29日消息,英伟达去年10月推出的RTX4090旗舰公版显卡现正在京
-
子女拿不出63岁老人赡养费起诉有用吗
1、如果子女有赡养能力而不履行赡养义务的,老人可以向法院起诉,要求
-
iPhone 15 年度主打“青绿色”曝光!真机上手丑爆了?
好久不见,甚是想念。大家好,我是你们的搞机鸭~跟大伙汇报个好消息哈
-
进军文旅,俞敏洪要抢携程的地盘?
图片来源@视觉中国俞敏洪曾经给自己制定过三条路,第一条是一直留在新
-
特斯拉人形机器人亮相!马上开始试走……
什么?!老马的人形机器人真要来了?!在特斯拉二季度业绩说明会上,特
-
多家网约车平台被“约谈”:要求降低过高抽成比例
最近,有媒体从交通运输部获悉,交通运输新业态协同监管部际联席会议办
-
河南记者卧底缅北 120 天,冒死揭露电诈内幕!最新进展……
看到缅甸绕着跑,小心腰子不保!这句玩笑话背后有多少受害者还在漫漫黑
-
导游威胁游客“不是你死就是我死”?当地通报:一经查实,将严处
大皖新闻讯 据@云南省文旅执法消息,7月29日,云南省文旅执法官方微博
-
汽车功率和扭矩代表什么 汽车扭矩和功率是什么意思
2022-05-27:杨洋会给大家解释的。汽车功率和扭矩代表什么,汽车扭矩和
-
巴适!活力四川26米手绘长卷来了
26米手绘长卷,带你一图遍览活力四川,稻城亚丁、九寨沟、三星堆、锦里
-
Apple iOS 17 帮助 iPhone 用户解读汽车中的图形图标
苹果iOS的下一次更新将包括一个方便的小功能,旨在向iPhone用户展示车
-
曾经最好看的手机设计,又要回来了?
7月28日,北京小米移动软件有限公司申请的摄像头隐藏式电子设备及隐藏
-
小米今年最完美的旗舰手机,要来了!
去年,小米发布了折叠屏MIXFold2。当时果子发布会也跟了,看完心想等降
-
百度知识图谱部总监佘俏俏:AIGC正在颠覆现有的内容生产方式
人工智能技术的发展,给内容生产创作带了影响和变革。7月28日,2023Chi
-
老房免费置换新房!绿地哈尔滨项目为卖房拼了,当地库存能卖超20个月
面对整体低迷的房地产市场,国企也不得不拿出强有力的促销手段来带动项
-
杭州:支持新能源汽车产能提升和整零配套发展
新京报贝壳财经讯(记者张冰)7月29日,贝壳财经记者从杭州市政府官网
-
泰国南部一烟花仓库发生爆炸,已致9死115伤
图片来源:泰国通讯社当地时间7月29日下午,泰国南部那拉提瓦府一个烟
-
成都大运会丨开幕式背后的故事——喜怒哀乐一张脸
台上一眼千年,台下十年一剑。很难相信,摘下脸谱的任鑫和大部分参加表
-
大湾区之声丨港澳台青年接力为大运会加油
多位港澳台青年从台北、香港、广州、深圳、厦门、武汉,将成都大运会吉
-
收入过亿“问题不大”武汉二厂汽水发布三款新品,兰世立豪言将颠覆中国饮料行业
中国的饮料行业缺一个兰世立,7月28日,前湖北首富兰世立现身北京出席
-
北京市气象台预计本市将出现暴雨到大暴雨 降雨量预计达300毫米
根据市气象台预计,7月29日夜间至8月1日夜间本市将出现暴雨至大暴雨,
-
北京市水务局17时发布山洪、城市内涝、洪水风险提示
市水务局要求,7月30日前全市河湖区域内全面停航,船只全部靠岸停泊,
-
国之重器!中国地下700米巨型实验室 捕捉宇宙“幽灵粒子”
地下700米是什么概念?为何捕捉中微子、探索宇宙的奥秘,却要深入地下7
-
荣耀 × AMD 携手亮相 ChinaJoy 荣耀 MagicBook X Pro 系列锐龙版 2023 即将上市
7月28-日-7月31日,2023年第二十届ChinaJoy在上海举行。在这全球数字领
-
推特无法在苹果应用商店改名为 X:命名至少需 2 个字母
IT之家7月29日消息,据TheVerge报道,在马斯克的力主之下,Twitter(推
精彩推荐
阅读排行
精彩推送
- 接近监管人士:短期内蚂蚁集团重...
- iOS 17 曝光 iPhone 15 Pro...
- 蔚来:好人就该被人拿枪指着?
- 孝感市乡村振兴局(关于孝感市乡...
- 增城三英温泉酒店介绍(增城三英...
- China's cultural diversity,...
- 深交所发函!古鳌科技疑似“忽悠...
- 已致超70万人受灾,“杜苏芮”还...
- 郑州机场278架次航班延误或取消...
- 今年的 ChinaJoy,我在车里「撮...
- 蔚来:好人就该被人拿枪指着?
- 白酒糟饲料业务有多香 ? 路德...
- 身家 440 亿英国富豪去美国自...
- 意外险购买需要什么资料?多少钱?
- 滑雪意外保险能赔多少?怎么赔?
- 购买的意外险在哪里查?需要提供...
- 交通意外险一年要交多少钱?保障...
- 10万意外险死了能赔多少钱?赔付...
- 孙俪为甄嬛发声 回应出演《热烈...
- 科力远:年产3万吨电池级碳酸锂...
- 时隔11年!中央气象台发布史上第...
- 员工意外保险是什么?买哪个保险...
- 中国人寿意外险怎么查询保单?查...
- 重大疾病险和社保哪个报销比例高...
- 人寿意外险狗咬伤能报多少钱?报...
- 平安意外保险100元保额多少?值...
- 狂砸近20亿,估值超300亿电池独...
- TCL华星CEO赵军:以电竞为中尺寸...
- 游戏出海收入10年增30倍,降本增...
- 7月29日夜间至8月1日有暴雨到大...