本想用 AI 来打败 AI,结果不小心翻车了。。。 当前速讯
2023-07-05 06:22:56来源:ZAKER科技
不久前,一张马斯克婴儿时期的照片在外网被疯狂转发。
起因是一名博主在推特上发了张图,并配文 " 据报道,埃隆 · 马斯克正在研究一种抗衰老配方,但结果失控了。 "
【资料图】
但只要稍微用心辨别,就能看出来这是成年马斯克的脸直接移植上去的, AI 味儿太冲了。
自打这 AI 大模型成熟以后,各种 AI 生成的内容就在网络上迅速泛滥。
像什么川建国同志退休后的生活;
还有 " 马斯克投资 AI 失败,卖烧烤还债 "" 马斯克在广州城中村摆摊的日子 "" 马斯克 kiss 女机器人 " 。各种梗图层出不穷,开局一张图,内容全靠编的情况是愈演愈烈。而在文本领域,不少学生借着 AI 写论文、写作业,甚至于莫言也坦言,给余华的颁奖词是 ChatGPT 帮忙写的。
那么问题来了, AI 生成的内容满天飞,我们要怎么去区分到底哪些是 AI 创作的,哪些是人类创作的呢?
前段时间 AI 诈骗 430 万的案子大家都还心有余悸,再这么任由 AI" 狂飙 " 下去,下一个受害者可能很快就会出现。
其实吧,现在市面上也出现了不少反 AI 工具,专门用来检测 AI 生成的内容。不过,这些工具真的就靠谱吗?
为此,世超专门找了几个检测工具,测试了一波。
首先是 AI 图像检测。
世超分别找了 Umm-maybe 、 Illuminarty 、 AI or Not这三个讨论度比较高、甚至是号称准确率在 95% 的检测工具,方便做一个对比。其中 Illuminarty 和 Umm-maybe 测试结果显示的是概率, AI or Not 则是直接给回答。本以为 AI 检测工具是个 " 火眼金睛 " ,但没想到在马斯克 " 返老还童 " 的那张图片上,就开始翻车了。
Illuminarty 和 AI or Not 的态度都很明确,这明显就是由 AI 生成的。
但轮到 Umm-maybe ,画风就变了。
它告诉我,这张图片是人类创作的概率为 81% 。
我寻思这肉眼都能瞧出来是 AI 干的好事,这怎么还能检测不出来呢。为了看看是不是偶尔的 bug ,我又多试了几次。
这张奥黛丽赫本在《 罗马假日 》里的电影截图, Umm-maybe 给了个模棱两可的答案,概率是一半一半。
剩下的一个站 AI ,一个站人类。至少从马斯克和赫本这两张图片的测试结果来看,除了 AI or Not 之外,其他两个 AI 检测工具的判定都不太准确。不过,打脸的时刻总是来得很快。
当我以为 AI or Not 稍微靠点儿谱的时候,它却说这张金角大王拿着汉堡的 AI 图片,是人类生成的。
你以为这就完了?更离谱的还在后头。这张梅西踩缝纫机的 AI 照片, Umm-maybe 给出的人类创作概率为 89% 。
这有点过于荒谬了。。。还有这张人跟巨型老虎合影的照片,肉眼就能看出来是 AI 生成的吧。
结果除了 Umm-maybe ,其余都认为这是人类创作的,甚至 Illuminarty 还觉得 AI 生成的概率只有 1.5% 。
总结一下,在 AI 图片的检测上,世超总共测试了 10 张不同的图片, 8 张由 AI 生成, 2 张由人类创作。排除掉了 2 项有争议的结果后, AI or Not 和 Umm-maybe 的准确率都是 67% ,而 Illuminarty 的准确率为 50% 。
也就是说,这三个 AI 图像检测工具的准确度并不算高。咱们再来看看文本的检测情况。
同样,还是选用了 3 个比较热门的检测工具:GPTZero 、 Sapling 以及 Copyleaks 。
世超先让 ChatGPT 生成了一段关于椰汁的广告文案,再依次用工具进行测试。
但一上来就给我整不会了。我原封不动从 ChatGPT 那边粘贴过来的文案, GPTZero 竟然说是可能完全由人类编写。
而 Sapling 给出结果也一样,这段文字由 AI 生成的概率为 0 。只有 Copyleaks ,把全文都标红了,咬死这是 AI 写的。三个工具里有两个都检测不出来这是 ChatGPT 写的,是不是有点太过分了。。。不信邪的我,又让 ChatGPT 以鲁迅的风格写了一篇《 火锅日记 》。
Copyleaks 依旧稳定发挥, GPTZero 这回倒是学聪明了,只有 Sapling 还在死死坚持那就是人写的。为了测试这些工具对于人类创作的反应,我又节选了一段《 活着 》里的内容。
可能是余华老师的《 活着 》过于出名,几个工具在这一关上倒是没有踩坑。
前前后后测试了好几次,除了 Copyleaks 的正确率相对比较高之外,剩下的感觉都不是特别聪明的样子,而且 Sapling 还出现了对中文不太友好的情况。
其实吧,无论是图像还是文字检测,都是靠着 AI把人类创作和机器生成区分出来。
换句话说,就是用魔法来打败魔法。
只是不同的训练模型,所用的数据集不同,分类的指标也不同。不过,这次的测试结果大家应该也看到了, AI 检测工具的效果并没有想象中那么好。
世超觉得问题,可能就出在这训练数据上。
像上文提到的 AI or Not ,它的数据集范围就只有 Stable Diffusion 、 Midjourney 、 Dall-E 、 GAN 和 Generated faces 生成的图像,如果超出了这个范围,误判也是常有的事儿。
虽然可以利用视觉算法,将输入图像的分辨率、清晰度等局部细节跟 AI 图像的特征进行比对。但拦不住 AI 进化的速度太快了,像之前备受吐槽的 " 六指战士 "Midjourney 每更新一版,对于细节的刻画也就更逼真。
这文本呢,也是类似的情况。就比如说这 GPTZero ,要想知道文字到底是不是由 AI 生成的,需要看两个指标,一个叫困惑度,一个叫突发性。
困惑度指的是 AI 模型在看到这段文字时,会不会觉得很难懂,像什么 " 依托答辩 " 之类的谐音梗, AI 不一定能够看懂,困惑度越高,就证明内容越有可能是人类创作的。而突发性,指的就是句子结构的变化程度。
毕竟人类跟 AI 不同,在写东西的时候句式可能一会儿长一会儿短,追求的就是一个变化多端, AI 则更倾向于使用统一的句式。
但 AI 在不断的进化中,无论是在困惑性还是突发性上,生成的内容越来越接近人类。
更何况现在的 AI 大模型一天一个样,等 AI 检测追上来, AI 生成的内容早不知道飙到哪去了。
但凡人类有什么风吹草动, AI 就马上能内化到自己的模型里。照这么下去, AI 生成的东西只会越来越难以辨别。
所以眼下,咱们能做的就是寄希望于技术大牛们,赶紧想办法让 AI 检测工具实现" 弯道超车 "。
而这场由 AI 掀起的风浪,终究或许也只有 AI 知道怎么去平息了。
责任编辑:hnmd003
相关阅读
相关阅读
-
本想用 AI 来打败 AI,结果不小心翻车了。。。 当前速讯
不久前,一张马斯克婴儿时期的照片在外网被疯狂转发。起因是一名博主在
-
iPhone 15 系列新配色曝光,苹果再次打响色彩战
去年九月,苹果在秋季新品发布会上带来了全新iPhone14系列,其中iPhone
-
深圳证监局点名部分券商:研报业务内控不到位,对从业人员疏于管理 环球播资讯
7月4日,深圳证监局发布了2023年第2期证券期货机构监管通讯。在本期通
-
当前速读:新能源车正开着,电池掉了!网友:满格电瞬间没了!最新回应……
近日,一则新能源汽车疑似行驶途中电池包脱落的视频在社交平台热传,引
-
流水的“互联网老公”,铁打的女性消费-环球动态
图片来源@视觉中国文|商业数据派,作者|黄小艺,编辑|刘雨琦姐狗文学,
-
2023 上半年车企的追求:安全、续航、低成本
图片来源@视觉中国文|电车通市面上对电动车的质疑声没有停过,但比发展
-
“巨型泡面桶”遭疯抢,被炒至 1999 元!深圳市监局回应
近日,山姆泡面桶炒至500元仍遭疯抢网红泡面桶被炒至1999元引发关注。7
-
海天味业-海天味业集团官网 全球观热点
1、现已拥有酱油、蚝油、醋、调味酱等八大品类,合计200余个规格品种。
-
上市银行“发钱季”,40家银行分红5877亿!买银行理财,不如买银行股? 环球简讯
上市银行进入分红季,多家银行派发大额现金红包。7月4日,齐鲁银行(60
-
环球视点!ESPN评足坛十大右后卫:阿什拉夫居首,坎塞洛第7、英格兰4人上榜
ESPN评足坛十大右后卫:阿什拉夫居首,坎塞洛第7、英格兰4人上榜,曼城,
-
【时快讯】龙皇集团(08493)根据一般授权发行3456万股
智通财经APP讯龙皇集团08493发布公告该公司于2023年7月3日根据一般授权
-
世界短讯!电动汽车需求低于预期,大众埃姆登工厂减产裁员
IT之家7月4日消息,大众汽车正在削减其位于德国西北部埃姆登工厂的电动
-
7月4日基金净值:万家兴恒回报一年持有期混合A最新净值0.9918,涨0.36%_世界视讯
7月4日,万家兴恒回报一年持有期混合A最新单位净值为0 9918元,累计净
-
李斌再投20亿自制电池,盈利的蔚来近在眼前远在天边-今日讯
近日,电动车企业蔚来正式成立了属于自己的电池制造公司。据企查查APP
-
[风险]光一退(300356):公司股票进入退市整理期交易第三次风险提示公告-当前独家
证券代码:300356证券简称:光一退公告编码2023-083号光一科技股份有限
-
每日短讯:云南昭通多地遭遇强对流天气 紧急避险转移群众8350人
昭通市防汛指挥部第一时间启动新一轮强降雨防汛Ⅳ级应急响应,就抢险避
-
来了!你们要的“二手手机”推荐|全球热议
引入大家好,我是键盘侠说。本期视频给大家推荐一期2000元以内,可以
-
6 月:比亚迪继续“一打十”,理想首破 3 万辆|世界看热讯
小伙伴们,6月新能源销量出炉啦,作为号称史上最卷的一个月,咱们来看
-
为什么要出一台 15 寸 的 MacBook Air?上手体验告诉你
这次WWDC大家的关注点都在VisionPro上,其实苹果悄无声息发布的MacBook
-
刚曝光的骁龙 8 Gen 2 旗舰,设计太骚了
此前爆料称,realme真我正在准备推出新款高端机型,搭载骁龙8Gen2。现
-
焦点热门:乘联会:预估 6 月新能源乘用车厂商批发销量 74 万辆,同比增长 30%
IT之家7月4日消息,乘联会综合预估6月乘联会新能源乘用车厂商批发销量7
-
当前快讯:经合组织:英国是唯一一个通胀仍在上升的主要经济体
财联社7月4日讯(编辑牛占林)经济合作与发展组织(OECD)最新数据显示,
-
当前速看:“药店四小龙”哪家强?大参林一季度最赚钱,定增 30 亿再扩军
本文来源:创业圈作者:何秀兰文|记者何秀兰迈入万店时代,大参林(603
-
2023 世界人工智能大会倒计时两天!一起来看大模型、人形机器人、智能驾驶……还有大奖奖金等你来角逐!|环球通讯
《科创板日报》7月4日讯(记者黄心怡)2023世界人工智能大会(WAIC2023
-
乘联会:6 月新能源乘用车厂商批发销量同比预增 30%
中新经纬7月4日电4日,乘联会网站披露,预估6月新能源乘用车厂商批发销
-
电子商务行业类别代码_电子商务属于什么专业类别_环球资讯
1、来源电子商务学习网《电子商务专业考公务员考试属于什么专业类别》
-
五粮液是第一大股东!这家袖珍银行冲刺香港上市,资产只有804亿|天天热消息
经过扩股增资、选聘会计师事务所和联席保荐机构等一系列准备动作后,宜
-
8万人小城迎46亿投资,国内单体最大碳酸锂项目在新疆若羌投产 今日看点
若羌,是塔克拉玛干、库木塔格、库鲁克三大沙漠环绕下的宝贵绿洲,是古
-
【独家焦点】万达电影预计上半年扭亏,电影扎堆上映,优质内容才能赢得观众
图片来源:图虫电影市场回暖了?7月3日,万达电影(002739 SZ)发布202
-
注册资本创记录!瑞众人寿565亿超越平安,营销员:“照单全收”华夏保险保单
来源:视觉中国被接管三年后,华夏保险“变身”瑞众人寿。7月3日,国家
精彩推荐
阅读排行
精彩推送
- 各地持续优化对农服务 加大科技...
- 全球速看:伊朗成为新成员!上合...
- 卢伟冰官宣小米 MIX Fold3 已...
- 「小白」iQOO 11S 测评:200W...
- 字节、网易相继入局,AI 之后大...
- “盗窃”而来的 3000 亿单词?...
- 300 元的旗舰小屏机用起来怎么...
- 当前快报:理想汽车CEO李想:7月...
- 天天热讯:合成飞机大作战什么时...
- “金牌ADC”喻文波退出亚运电竞...
- 今年市卫健委明确24件为民办实事项目
- 亚运测试赛激战正酣 老场馆“微...
- 天天视点!中国人权研究会在日内...
- 比魅族懂宣传,Nothing Phone ...
- 3799 元起,iQOO 11S 发布:...
- 苹果 iPhone 15「新」配色绿色...
- 荣耀赵明:千帆竞渡,打破苹果一...
- 全球看点:国家原子能机构:IAEA...
- 精选!再见巴黎!内马尔获三年6...
- 48家券商7月金股出炉!计算机、...
- 优酷回应将注入阿里影业:不属实
- 诊所突发火情,达达快送大连小哥...
- 新时代北京的精气神|接诉即办 ...
- NothingPhone2 真机上手 灰色...
- 紧抱华为大腿,失去“灵魂”的赛...
- 全球微动态丨iQOO 11S 评测:...
- iQOO 11S 首发:不只是电竞旗...
- 用 AI,挑战北京「地狱级」路线...
- 东方甄选首次在App直播:将在抖...
- 热推荐:淡妆浓抹总相宜的宜是什...