今日快看!识别「ChatGPT 造假」,效果超越 OpenAI:北大、华为的 AI 生成检测器来了
2023-06-02 13:07:01来源:ZAKER科技
机器之心专栏
机器之心编辑部
AI 造假的成功率很高,前几天「10 分钟骗 430 万」还上了热搜。在最热门的大语言模型上,研究人员最近探索了一种识别方法。
(资料图片)
随着生成式大模型的不断进步,它们生成的语料正逐步逼近人类。虽然大模型正在解放无数文书的双手,它以假乱真的强劲能力也为一些不法分子所利用,造成了一系列社会问题:
来自北大、华为的研究者们提出了一种识别各式 AI 生成语料的可靠文本检测器。根据长短文本的不同特性,提出了一种基于 PU 学习的多尺度 AI 生成文本检测器训练方法。通过对检测器训练过程的改进,在同等条件下能取得在长、短 ChatGPT 语料上检测能力的可观提升,解决了目前检测器对于短文本识别精度低的痛点。论文地址:https://arxiv.org/abs/2305.18149代码地址 ( MindSpore ) :https://github.com/mindspore-lab/mindone/tree/master/examples/detect_chatgpt
代码地址 ( PyTorch ) :https://github.com/YuchuanTian/AIGC_text_detector
引言
随着大语言模型的生成效果越发逼真,各行各业迫切需要一款可靠的 AI 生成文本检测器。然而,不同行业对检测语料的要求不同,例如在学术界,普遍需要对大段完整的学术文本进行检测;在社交平台上,需要对相对简短而较为支离破碎的假消息进行检测。然而,既有检测器往往无法兼顾各式需求。例如,主流的一些 AI 文本检测器对较短的语料预测能力普遍较差。
对于不同长度语料的不同检测效果,作者观察到较短的 AI 生成文本可能存在着一部分归属上的「不确定性」;或者更直白地说,由于一些 AI 生成短句同时也常常被人类使用,因而很难界定 AI 生成的短文本是否来自于人或 AI。这里列举了几个人和 AI 分别对同一问题做出回答的例子:
由这些例子可见,很难对 AI 生成的简短回答进行识别:这类语料与人的区别过小,很难严格判断其真实属性。因此,将短文本简单标注为人类 / AI 并按照传统的二分类问题进行文本检测是不合适的。针对这个问题,本研究将人类 / AI 的二分类检测部分转化为了一个部分 PU(Positive-Unlabeled)学习问题,即在较短的句子中,人的语言为正类(Positive),机器语言为无标记类(Unlabeled),以此对训练的损失函数进行了改进。此改进可观地提升了检测器在各式语料上的分类效果。
算法细节
在传统的 PU 学习设定下,一个二分类模型只能根据正训练样本和无标记训练样本进行学习。一个常用的 PU 学习方法是通过制定 PU loss 来估计负样本对应的二分类损失:
其中,表示正样本与正标签计算的二分类损失;表示将无标记样本全部假定为负标签计算的二分类损失;表示将正样本假定为负标签计算的二分类损失;表示的是先验正样本概率,即正样本在全部 PU 样本中的预估占比。在传统的 PU 学习中,通常将先验设置为一个固定的超参数。然而在文本检测的场景中,检测器需要处理各式长度不同的文本;而对于不同长度的文本而言,其正样本在所有和该样本相同长度的 PU 样本中的预估占比也是不同的。因此,本研究对 PU Loss 进行了改进,提出了长度敏感的多尺度 PU(MPU)loss 损失函数。
具体地,本研究提出了一个抽象的循环模型对较短文本检测进行建模。传统的 NLP 模型在处理序列时,通常是一个马尔可夫链的结构,如 RNN、LSTM 等。此类循环模型的这个过程通常可以理解为一个逐渐迭代的过程,即每个 token 输出的预测,都是由上一个 token 及之前序列的预测结果和该 token 的预测结果经过变换、融合得到的。即以下过程:
为了根据这个抽象的模型进行先验概率的估计,需要假定该模型的输出为某个句子为正类(Positive)的置信度,即判定为人说出的样本的概率。假设每个 token 的贡献大小为句子 token 长度的反比,是非正(Positive)即无标记(Unlabeled)的,且为无标记的概率远远大于为正的概率。因为随着大模型的词汇量逐渐逼近人类,绝大部分词汇会同时出现在 AI 和人类语料中。根据这个简化后的模型和设定好的正 token 概率,通过求出不同输入情况下模型输出置信度的总期望,来得到最终的先验估计。
通过理论推导和实验,估计得到先验概率随着文本长度的上升而上升,最终逐渐稳定。这种现象也符合预期,因为随着文本变长,检测器可以捕捉的信息更多,文本的 「来源不确定性」也逐渐减弱:之后,对于每个正样本,根据其样本长度得到的独特先验对 PU loss 进行计算。最后,由于较短文本仅有部分 " 不确定性 "(即较短文本也会含有一些人或者 AI 的文本特征),可以对二分类 loss 和 MPU loss 进行加权相加,作为最终的优化目标:
此外需要注意的是,MPU loss 适配的是长度较为多样的训练语料。倘若既有的训练数据单质化明显,大部分语料为大段冗长的文本,则无法全面发挥 MPU 方法的功效。为了使得训练语料的长度更多样化,本研究还引入了一个在句子层面进行多尺度化的模块。该模块随机遮盖训练语料中的部分句子,并对余下句子在保留原有顺序的前提下进行重组。经过训练语料的多尺度化操作,训练文本得到了长度上的极大丰富,从而充分利用了 PU 学习进行 AI 文本检测器训练。
实验结果
如上表所示,作者先在较短的 AI 生成语料数据集 Tweep-Fake 上检验 MPU loss 的效果。该数据集中的语料均为推特上较为短小的语段。作者又在传统的语言模型微调基础上将传统二分类 loss 替换为含有 MPU loss 的优化目标。改进之后的语言模型检测器效果较为突出,超过了其它基线算法。作者又对 chatGPT 生成文本进行了检测,经过传统微调得到的语言模型检测器在短句上表现较差;经过 MPU 方式在同等条件下训练得到的检测器在短句上表现良好,且同时能够在完整语料上取得可观的效果提升,F1-score 提升了 1%,超越了 OpenAI 和 DetectGPT 等 SOTA 算法。如上表所示,作者在消融实验中观察了每个部分带来的效果增益。MPU loss 加强了长、短语料的分类效果。作者还对比了传统 PU 和 Multiscale PU(MPU)。由上表可见 MPU 效果更胜一筹,能更好地适配 AI 多尺度文本检测的任务。总结
作者通过提出基于多尺度 PU 学习的方案,解决了文本检测器对于短句识别的难题,随着未来 AIGC 生成模型的泛滥,对于这类内容的检测将会越来越重要。这项研究在 AI 文本检测的问题上迈出了坚实的一步,希望未来会有更多类似的研究,把 AIGC 内容进行更好的管控,防止 AI 生成内容的滥用。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
责任编辑:hnmd003
相关阅读
-
今日快看!识别「ChatGPT 造假」,效果超越 OpenAI:北大、华为的 AI 生成检测器来了
机器之心专栏机器之心编辑部AI造假的成功率很高,前几天「10分钟骗430万」还上了热搜。在最热门的大语言模
2023-06-02 -
GPT-4 变笨引爆舆论!文本代码质量都下降,OpenAI 刚刚回应了降本减料质疑
大模型天花板GPT-4,它是不是……变笨了?先是少数用户提出质疑,随后大量网友表示自己也注意到了,还贴...
2023-06-02 -
富士通发布 AI 平台 FujitsuKozuchi|当前动态
品玩6月2日讯,富士通发布AI平台FujitsuKozuchi,将面向全球企业用户提供一系列AI(人工智能)与ML(机器学
2023-06-02
相关阅读
-
今日快看!识别「ChatGPT 造假」,效果超越 OpenAI:北大、华为的 AI 生成检测器来了
机器之心专栏机器之心编辑部AI造假的成功率很高,前几天「10分钟骗430万」还上了热搜。在最热门的大语言模
-
每日视讯:B站一季度净亏损同比收窄72% CEO回应“UP主停更潮”
B站重申了对2023年全年收入展望,预计在240亿元至260亿元人民币之间。
-
2023 谷歌研究学者计划名单公布:清华姚班、北大等多位校友在列
机器之心报道编辑:陈萍、小舟2023年谷歌研究学者计划共涉及16个领域,多位华人学者获奖。2023年谷歌研究学
-
对话荣耀赵明:根据需求定制自研芯片战略,对大模型将“慎之又慎” 聚焦
如果你也喜欢不客观实验室,希望和我们一起探讨数码相关的选题,请私信不客观,我们将回复您加群的方式,期
-
GPT-4 变笨引爆舆论!文本代码质量都下降,OpenAI 刚刚回应了降本减料质疑
大模型天花板GPT-4,它是不是……变笨了?先是少数用户提出质疑,随后大量网友表示自己也注意到了,还贴...
-
余额宝赎回转入是什么意思?余额宝赎回到账时间
余额宝赎回转入是什么意思?余额宝赎回转入的含义是我们之前通过余额宝购买了某项基金产品,而当我们卖出...
-
环球热门:教育部和各省(区、市)开通2023年高考举报电话
央视网消息:近日,教育部统一公布了教育部以及各省(区、市)2023年的高考举报电话,欢迎广大考生、家长及
-
意外险短期怎么样?保费是多少?_当前快讯
意外险短期相对于其他形式的意外险,具有以下几个优点:1、灵活性高:意外险短期通常可以根据被保险人的需
-
当前消息!太平共享盛世年金保险E款可靠吗?有哪些保障?
可靠。太平共享盛世年金保险E款由太平寿险推出,是一款正规的商业年金险产品。太平寿险作为中国知名的保险
-
天天讯息:保险公司的年金险可以买吗?有什么风险?
保险公司的年金险是一种可以帮助客户规划养老生活的保险产品。其基本原理是客户在缴纳一定费用后,保险公司
-
合众稳盈长红养老年金保险(A)款有什么优点?有什么缺点?_环球快看点
保证收益:合众稳盈长红养老年金保险(A)款具有固定保证利率,可以确保您在投资过程中获得稳定的收益。弹性
-
增额增值寿险买哪个好?在哪买?
对于购买增额增值寿险这一问题,我们需要从以下几个方面考虑。1 保障内容。由于增额增值寿险结合了投资理念
-
27亿重金注资固态电池,上汽集团究竟为了啥?|热文
27亿重金注资固态电池,上汽集团究竟为了啥?整个5月,关于固态电池的消息不断。包括上汽集团、马车动力、
-
速递!5月阿维塔11大定订单2,366台
5月阿维塔11大定订单2,366台2023年6月2日,阿维塔科技宣布,首款情感智能电动轿跑SUV阿维塔11,5月大定订单
-
RCEP对15个签署国全面生效
2023年6月2日,《区域全面经济伙伴关系协定》(RCEP)对菲律宾正式生效,标志着RCEP对东盟10国和澳大利亚、
-
2023年暑期档电影总票房突破1亿元
据猫眼专业版数据,6月1日14时06分,2023年暑期档电影总票房(含预售)突破1亿元。《哆啦A梦:大雄与天空的
-
西门子医疗加码光子计数CT-全球视讯
西门子医疗正在德国福希海姆(Forchheim)建造一家新工厂,用于生产半导体晶体材料,总投资额高达8000万欧
-
富士通发布 AI 平台 FujitsuKozuchi|当前动态
品玩6月2日讯,富士通发布AI平台FujitsuKozuchi,将面向全球企业用户提供一系列AI(人工智能)与ML(机器学
-
联想郝常杰:以开放融合态度支持国产高性能计算生态发展-环球速讯
在建造高性能计算系统的时候,联想一直秉承开放融合的态度,不仅支持传统的X86架构,还完成了对飞腾、海光
-
小米汽车再换阵:前麦格纳高管黄振宇接管供应链
文|李安琪编辑|杨轩李勤为确保明年一季度交付节点,老汽车人开始陆续担纲小米汽车的核心岗位。近日,36氪
-
苹果数据显示 iOS 16 普及率超过 80% iPadOS 16 超过 70% 世界看热讯
【TechWeb】6月2日消息,据外媒报道,按惯例,苹果公司在下周的全球开发者大会上,将推出iPhone、iPad等各
-
当前消息!36 氪专访华瑞指数云:SDS 进入 2.0 时代,渐进式迭代以 10 年为周期
整理|Ricky作者|王与桐软件定义存储(SDS),并不是个新概念,但是在创投圈子却还是年轻的。该概念发展至今
-
苹果零售链大动作:四年内亚太拟新开 15 家店 上海有望再开一家-观焦点
财联社6月2日讯(编辑黄君芝)据报道,苹果公司(AppleInc )正在制定扩大和加强其零售连锁店的计划,旨在
-
严打“卖惨”虚假助农 抖音新规禁止公益类账号变现 新消息
中新经纬6月2日电为促进公益行业更好发展,针对有账号试图以助农助困助残为由编造不实场景、实施虚假公益等
-
天天热头条丨A 股三大股指集体高开 保险、贵金属板块领涨
中新经纬6月2日电2日,A股三大股指集体高开,上证指数涨0 24%,深证成指涨0 36%,创业板指涨0 33%。两市超2
-
德意志银行警告:欧美企业违约潮已迫在眉睫!-环球即时
财联社6月2日讯(编辑马兰)德意志银行本周发布了年度违约研究报告,报告指出,由于过去一年激进的加息政策
-
占便宜上瘾!印度 5 月俄油采购量再创记录|观点
财联社6月2日讯(编辑卞纯)印度上个月抢购了创纪录数量的俄罗斯石油,与此同时,自沙特的石油进口量降至28
-
《四部医典》入选《世界记忆名录》 全球信息
“2014年《四部医典》开始申报第四批《中国档案文献遗产名录》时,便已经为申报《世界记忆名录》做准备...
-
失业保险申领成功后多久能领到?在哪里查询?
找到当地就业局或人社部门,提交申请材料,提交申请材料后,相关部门会进行审核和认定,确认是否符合领取失
-
快看:4001234567是什么保险公司的电话?有什么作用?
经过查询,这个电话号码属于中国人民保险公司的客服热线电话。作为我国最大的保险公司之一,中国人民保险拥
精彩推荐
阅读排行
精彩推送
- 蚂蚁保险重大疾病理赔多少?理赔...
- 商业保险报销多久到账?怎么报销?
- 百万医疗怎样赔付?需要哪些材料...
- 中欧基金经理桑磊:基金投资中,...
- 四年级解方程100道题带过程及答...
- 赛力斯:5月新能源汽车销量8562...
- 锌锰电池是碳性还是碱性?锌锰电...
- 无线传输是什么意思?无线传输速...
- 电机防爆等级怎么区分?电机防爆...
- 什么是风光互补?风光互补发电系...
- 人体有个“止咳开关”!没事按一...
- 可编程是什么意思?可编程是怎么...
- 什么是NetBIOS协议?netbios应不...
- 杭州萧山希尔顿花园酒店正式开业...
- 环球今亮点!增109.4% 比亚迪5...
- 国际首部《卵巢组织冻存移植技术...
- 微软与初创公司 CoreWeave 签...
- 出门问问港交所 IPO 欲冲“ A...
- 对话中关村科金张杰:通用大模型...
- 星环科技:AI 领域布局比较早 ...
- 解锁第二人生,国内首个网红“ ...
- MDI文件是什么?mdi文件用什么打开?
- 今日关注:快乐“六一” 与您“...
- 拉萨市实验幼儿园开展亲子文艺汇演
- 2023年首届西藏自治区数字教育大...
- 快捷方式病毒有几种?文件夹快捷...
- 隐藏文件是什么意思?win7怎么显...
- 流氓软件卸载了还有危险吗?如何...
- 光电池是怎样将光能转换成电能的...
- 纳指etf受汇率的影响吗?纳指etf...