揭秘OpenAI“红军”:聘请专家攻击ChatGPT解决技术伦理问题-每日时讯
2023-04-17 11:53:20来源:新浪网
新浪科技讯 北京时间4月17日早间消息,据报道,在安德鲁·怀特(Andrew White)获得GPT-4的使用权之后,他使用这一人工智能系统提出了一种全新的神经毒剂。GPT-4是热门聊天机器人ChatGPT背后的人工智能技术。
作为罗切斯特大学的化学工程教授,怀特是OpenAI去年聘请的50名专家学者之一。在6个月的时间里,这支“红军”对这一新模型进行了“定性探索和对抗性测试”,试图攻击它。
怀特表示,他使用GPT-4的建议生成了一种可作为化学武器的化合物,并使用“插件”为这个模型提供新的信息源,例如学术论文和化学品制造商名录。随后,这个聊天机器人找到了一个地方来制造这种化合物。
(资料图)
他说:“我认为,这将使每个人都获得更快速、更准确地工具去从事化工行业。但这也使得人们会以更危险的方式去开展化学活动,带来了很大的风险。”
上个月,OpenAI面向更广泛的公众发布了这项新技术,而这些令人惊讶的发现确保新技术不会带来不良后果。
事实上,“红军”的演习目的是探索并了解在社会上部署先进人工智能系统会造成什么样的风险,解决公众这方面的担忧。他们在工作中提出探索性的或是危险的问题,以测试这个工具在回答问题时的详细程度。
OpenAI想要探索模型毒性、偏见和歧视等问题。因此,“红军”就谎言、语言操纵和危险的科学常识进行了测试。他们还评估了模型协助和教唆剽窃的情况、金融犯罪和信息安全攻击等违法活动的可能性,以及模型可能会如何威胁国家安全和战场通信。
“红军”由一系列专业人士组成,包括学者、教师、律师、风险分析师和信息安全研究员,主要来自美国和欧洲。他们的发现被反馈给OpenAI。在更广泛地推出GPT-4之前,“红军”提供的意见被用于模型的重新训练,解决GPT-4的问题。在几个月的时间里,专家们每人花了10到40个小时去测试这个模型。多名受访者表示,他们的工作时薪约为100美元。
其中的许多人都对语言模型的快速发展提出了担忧,尤其是通过插件将语言模型与外部知识源连接在一起可能造成的风险。
GPT-4“红军”的成员、瓦伦西亚人工智能研究所教授何塞·埃尔南德斯-奥拉洛(José Hernández-Orallo)表示:“今天,系统被冻结了。这意味着它不再学习,也不再有记忆。但如果我们让系统继续有机会访问互联网,那么会怎样?这可能会成为一个与世界相连的非常强大的系统。”
OpenAI表示,该公司认真对待安全性问题,并在发布前对插件进行了测试,并将随着用户越来越多继续定期更新GPT-4。
技术研究员罗亚·帕克扎德(Roya Pakzad)使用英语和波斯语的输入信息对该模型进行了性别、种族和宗教偏见的测试,例如对于佩戴头巾问题。
帕克扎德承认,这个工具对非英语母语人士能带来帮助,但也显示出对边缘人群的公开刻板印象,即使随后更新的版本也是如此。她还发现,在用波斯语测试该模型时,聊天机器人用捏造的信息做出回复,即出现所谓“幻觉”的情况更糟糕。与英语相比,在波斯语回复中捏造名字、数字和事件的比例更高。
她表示:“我担心,语言多样性和语言背后的文化会受到损害。”
来自内罗毕的律师、唯一一名非洲测试人员博鲁·戈洛(Boru Gollo)也注意到了模型的歧视性语气。他说:“有一次,我在测试这个模型时,它表现得像个白人在跟我说话。在问到某个特定群体时,它会给一个有偏见的意见,或是在回答中出现歧视。”OpenAI承认,GPT-4仍有可能表现出偏见。
“红军”的成员还从国家安全的角度对模型进行了评估,但他们对于新模型的安全性有着不同的看法。美国外交关系委员会研究员劳伦·卡恩(Lauren Kahn)表示,当她开始研究,如何将这项技术用于对军事系统的攻击时,她“没有想到模型的回答会如此详细,以至于我只需要做一些微调即可”。
不过,卡恩和其他信息安全测试者发现,随着测试时间推移,模型回答的内容逐渐变得安全。OpenAI表示,在推出GPT-4之前,曾训练过这个模型拒绝回答恶意的信息安全问题。
“红军”的许多成员表示,OpenAI在发布GPT-4之前已经进行了严格的安全评估。卡内基梅隆大学语言模型毒性专家马尔滕·萨普(Maarten Sap)说:“他们在消除这些系统中的显性毒性方面做得非常好。”萨普研究了该模型对不同性别的描述,发现模型的偏见反映的是社会差异。但他也发现,OpenAI做出了一些积极的选择来对抗偏见。
然而自推出GPT-4以来,OpenAI一直面临着广泛的批评。例如,有技术伦理组织向美国联邦贸易委员会(FTC)投诉,称GPT-4“有偏见和欺骗性,对隐私和公共安全构成风险”。
最近,该公司推出了一项名为ChatGPT插件的功能。通过该功能,Expedia、OpenTable和Insta等合作伙伴应用可以让ChatGPT访问它们的服务,允许ChatGPT代表用户下单。
“红军”的人工智能安全专家丹·亨德里克斯(Dan Hendrycks)表示,这些插件可能会让人类用户“脱离整个链路”。“如果聊天机器人可以在网上发布你的私人信息,访问你的银行账户,或者派警察到你家里去,那会怎么样?总体而言,在让人工智能掌握互联网的力量之前,我们需要更有力的安全评估。”
受访者还警告说,OpenAI不能仅仅因为其软件是在线的就停止安全测试。乔治城大学安全和新兴技术中心的希瑟·弗雷斯(Heather Frase)测试了GPT-4协助犯罪的能力。她表示,随着越来越多人使用这项技术,风险将继续扩大。她表示:“你做运行测试的原因是,一旦它们在真实环境中被使用,行为就会不同。”她认为,应该创建一个公共记录本,报告由大语言模型引发的事故。这类似于信息安全或消费者欺诈报告系统。
劳工经济学家及研究员萨拉·金斯利(Sara Kingsley)建议,最好的解决方案是清楚地宣传这方面的危害和风险,“就像食品上的营养标签”。“关键是要形成一个框架,知道经常出现的问题是什么。这样你就可以有一个安全阀。这也是为什么我认为,这项工作将会永久性的持续下去。”
责任编辑:hnmd003
相关阅读
-
揭秘OpenAI“红军”:聘请专家攻击ChatGPT解决技术伦理问题-每日时讯
新浪科技讯北京时间4月17日早间消息,据报道,在安德鲁·怀特(AndrewWhite)获得GPT-4的使用权之后,他...
2023-04-17 -
【环球新视野】ChatGPT之父辟谣:并未秘密训练GPT-5 短期内也不会
快科技4月17日消息,近期有消息称GPT-5正处在秘密训练中,并且将在年内闪上市。现在官方亲自来辟谣了,O...
2023-04-17 -
15分钟,充电80%,宁德时代钠离子电池来了!“突破资源瓶颈的高性价比之选”,首发落地奇瑞
行业瞩目的上海车展将在明日(4月18日)开幕,各路车企动作不断的同时,上游动力电池龙头宁德时代也没有...
2023-04-17
相关阅读
-
揭秘OpenAI“红军”:聘请专家攻击ChatGPT解决技术伦理问题-每日时讯
新浪科技讯北京时间4月17日早间消息,据报道,在安德鲁·怀特(AndrewWhite)获得GPT-4的使用权之后,他...
-
两位美国参议员就隐私泄露丑闻致信马斯克
两位美国参议员就隐私泄露丑闻致信马斯克2019年至2022年期间,特斯拉员工群体通过内部消息系统,分享客...
-
特斯拉下调新加坡市场Model 3、Model Y车型售价:环球热点评
特斯拉下调新加坡市场Model3、ModelY车型售价盖世汽车讯据路透社报道,4月14日,特斯拉宣布已下调新加坡...
-
破釜沉舟?马自达加速电动化转型
破釜沉舟?马自达加速电动化转型4月16日,马自达(中国)首次对外公布了电动化时代的转型战略和目标愿景...
-
环球关注:卡塔尔成为2022年全球最大液化天然气出口国
当地时间4月15日,总部位于卡塔尔首都多哈的天然气出口国论坛发布“2023年度天然气市场报告”。报告显示...
-
辽宁养老机构与医疗卫生机构签约服务率达100%|世界关注
为满足老年人日益增长的健康需求,日前,辽宁省卫生健康委等19个部门印发了《辽宁省关于深入推进医养结...
-
5年间追回医保资金超771亿元,医保基金监管能力全面提升
近日,国家医保局和各地医保部门陆续公布一批违法违规使用医保基金的典型案例,不少案例涉及定点零售药...
-
2023版《居民常见恶性肿瘤筛查和预防推荐》发布!
4月15日,是第29届全国肿瘤防治宣传周的第一天,2023版《居民常见恶性肿瘤筛查和预防推荐》在上海全新发...
-
全球看热讯:苹果 MR 头显或亮相在即 能否开启”后 iPhone 时代“?
财联社4月17日讯(编辑周子意)苹果公司2023年的全球开发者大会(WWDC)还有不到两个月就要召开了,这对...
-
贵州茅台一季度净利润超预期同比增 19%,系列酒今年营收目标 200 亿!:世界热头条
贵州茅台今年一季度业绩超预期。一位券商食品饮料行业首席分析师对财联社记者称。16日下午,贵州茅台(6...
-
苹果 MR 头显或亮相在即 能否开启”后 iPhone 时代“?:天天快资讯
财联社4月17日讯(编辑周子意)苹果公司2023年的全球开发者大会(WWDC)还有不到两个月就要召开了,这对...
-
美联储没必要再加息?美财长:银行业或收紧贷款以替代加息
财联社4月17日讯(编辑刘蕊)美东时间周六,美国财政部长耶伦表示,在近期美国银行业经历动荡和危机后,...
-
苹果将于 2025 年完全使用再生稀土元素 业内:再生稀土价格一样 品质不如原矿稀土_天天新消息
继特斯拉宣称下一代永磁电机将完全不使用稀土材料后,近日苹果宣布将于2025年完全使用再生稀土元素。多...
-
建设历经 18 年!欧洲最大核反应堆投入运营 有望满足芬兰 14% 电力需求
财联社4月17日讯(编辑卞纯)作为欧洲最大的核反应堆,芬兰奥尔基卢奥托岛核电站3号反应堆(Olkiluoto3...
-
“大心肺计划”托起西藏孩子的滑雪梦
这几年,滑雪登山项目越来越受到重视。“西藏的孩子耐力好、登山强,可以说在滑雪登山方面是有优势的。...
-
林芝市深入研讨冷水鱼产业发展
近日,国家特色淡水鱼产业技术体系首席与岗站专家一行18人赴林芝市开展调研,实地了解林芝市冷水鱼养殖...
-
焦点资讯:推动藏医药在传承创新中高质量发展
连日来,西藏藏医药事业发展迎来一个个里程碑事件,将不断推进藏医药事业更高质量发展,满足广大群众用...
-
优化营商环境 一季度拉萨新增经营主体8330户-当前热文
今年一季度,拉萨市新登记注册经营主体8330户,其中企业2418户、个体工商户5901户、农民专业合作社11户...
-
西藏印发方案开展特殊困难老年人探访关爱服务
记者从西藏自治区民政厅获悉,日前,自治区民政厅联合区党委政法委、文明办、教育厅等十部门研究印发《...
-
丹杰林社区多举措推进民族团结进步创建工作|今日最新
为深入贯彻落实自治区第十次党代会和区党委十届三次全会精神、王君正书记在拉萨市干部大会上和在拉萨调...
-
拉萨市2023年4月份“拉萨讲坛”开讲:热点
4月14日,拉萨市2023年4月份“拉萨讲坛”开讲。市委常委、组织部部长张定成参加。讲坛邀请北京师范大学...
-
每日快讯!保险退保还能恢复吗?手续费扣除比例多少?
保险办理完退保手续之后是无法进行恢复的。 投保人向保险公司提交退保审核之后,保险公司会进行审核,...
-
每日简讯:被保险业务员骗了可以退保么?能退多少?
被保险业务员欺骗了是可以退保的; 商业险退保并不追求其具体的退保缘由,一般在保险保障期内的,都是...
-
保险没有回访可以退吗?退多少钱? 焦点关注
保险没有回访是可以申请退保的; 客户在购买商业保险之后,为了确保消费者对保单相关保障是知情的,而...
-
被保人不知情的保单能不能退?可以全额退吗?|当前热议
被保人在不知道的情况,投保人是可以直接退掉保单的。 在投保人与被保人非同一人的情况下,保单是否退...
-
6万的保险能退多少钱回来?怎么能退全额?
将已交6万保额全额进行返还,这就相当于退保没有损失;全额退保通常只针对犹豫期内退保的保单,保单合同...
-
当前报道:首届中国糖尿病和代谢性疾病药物器械研发创新大会隆重开幕
为推动中国糖尿病及代谢性疾病领域药械研发能力和水平提升,造福广大患者,2023年4月14日,由中国医药创...
-
环球即时:马斯克否认特斯拉开启“价格战”:只为覆盖更多消费者
【TechWeb】4月17日消息,据外媒报道,近日,有人称,特斯拉在电动汽车和燃油汽车之间开启了一场“价格...
-
苹果正在研发多款MacBook 部分将在6月份推出
【TechWeb】4月17日消息,据外媒报道,长期关注苹果的一名资深记者透露,苹果公司正在研发多款笔记本电...
-
【环球新视野】ChatGPT之父辟谣:并未秘密训练GPT-5 短期内也不会
快科技4月17日消息,近期有消息称GPT-5正处在秘密训练中,并且将在年内闪上市。现在官方亲自来辟谣了,O...
精彩推荐
阅读排行
精彩推送
- 定义电动安全时代新秩序,沃尔沃...
- 赛力斯:碳酸锂价格下降对公司电...
- 大年三十作文怎么写?大年三十作...
- 擀面杖吹火的歇后语怎么说?擀面...
- 全球视讯!小学体育教学论文怎么...
- 加油努力的励志简单句子怎么写?...
- 重阳节敬老标语怎么写?重阳节敬...
- 放开我的手作文800字怎么写?放...
- 爱国演讲稿怎么写?爱国演讲稿范...
- 学游泳日记400字怎么写?学游泳...
- 华山一日游有哪些好玩的地方?华...
- 小学生军训作文400字怎么写?小...
- 国药现代与山东百诺签署药品上市...
- 桂林旅游去年归母净亏损2.82亿元...
- N1 Life完成千万美元融资,由君...
- 全球焦点!黄山旅游去年营收8亿...
- 三四线城市密集引入达芬奇机器人
- 马斯克火星计划:成功率 50%,...
- 天风证券维持萤石网络“增持”评...
- 内蒙古:农牧区寄递物流综合服务...
- 鄂尔多斯市获自治区科技成果转化...
- 【环球热闻】巴彦淖尔市税收收入...
- 乌海市打造风光氢储用一体新能源...
- 巴彦淖尔中旗:打造北疆国防教育...
- 北方最大工业CT检测中心在京开工...
- 北京市人力资源和社会保障局:一...
- 世界今热点:地铁不再强制戴口罩...
- 在巴松错体验露营生活
- 西藏林芝开展洒水增湿作业 全力...
- 世界观热点:拉萨开展“食品安全...