如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》 全球热讯
2023-06-07 15:28:03来源:ZAKER科技
机器之心发布
(资料图片仅供参考)
作者:之江实验室
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。
今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。
为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。
白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的发展与重要应用
这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。
数据安全问题
白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。
在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
使用规范问题
在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。
其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。
其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。
其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。
可信伦理问题
ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。
白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。
ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。
知识产权问题
ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。
而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。
模型安全问题
从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。
例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。
安全与隐私建议
最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。
在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。
在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。
在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。
总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
责任编辑:hnmd003
相关阅读
相关阅读
-
如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》 全球热讯
机器之心发布作者:之江实验室当前,生成式大模型已经为学术研究甚至是
-
软通动力与华为昇腾 AI 共同推出训推一体化平台
(全球TMT2023年6月7日讯)5月30日,多模态大模型产业高峰论坛在北京举
-
环球快讯:海昌海洋公园股价又崩!盘中最多跌超 33% 公司称暂不知原因
财联社6月7日讯(编辑胡家荣)今日海昌海洋公园(02255 HK)盘中出现闪崩
-
明星基金继续押注中国股票:每一次下跌都是买入好机会
财联社6月7日讯(编辑马兰)从相关股指走势图来看,投资者似乎正在看淡
-
今年前 5 个月我国进出口增长 4.7% 5 月汽车出口增长超 1 倍
财联社6月7日讯,中国海关总署今日公布5月进出口数据。以人民币计价,
-
中华人民共和国城市房地产管理法第六十条内容 房屋所有权登记发证制度是什么?
小产权房没有房产证。小产权房是指在农民集体土地上建设的房屋,未缴纳土地出让金等费用,产权证由乡政...
-
养老保险停交怎么办?养老保险的缴费年限是什么?
养老保险中断,劳动者及劳动者所在的用人单位可以及时补缴。在补缴后,养老保险的缴费年限仍然会继续累...
-
南方保本基金是什么基金?南方保本基金的保本期
南方保本基金是什么基金?Wind数据显示,截至6月30日,南方基金旗下保本基金在上半年的业绩排名中处于行...
-
基本工资的意义是什么?基础绩效工资标准是什么呢?
相信对于大部分职工而言,工资薪酬是最为关注的部分了,在一些单位里,工资包括了基本工资与绩效工资,...
-
中国金茂:前5月签约销售额728.12亿元,同比增加43%
中国金茂:前5月签约销售额728 12亿元,同比增加43%6月6日,中国金茂控
-
环球微动态丨新城控股:前5月合同销售额357亿元,同比下降30%
新城控股:前5月合同销售额357亿元,同比下降30%6月6日,新城控股集团
-
退休年龄新规定内容是什么?退休年龄是多少岁?
男年满六十周岁,女年满五十周岁,连续工龄满十年的,应该退休。不具备退休条件,由医院证明,并经劳动...
-
中华人民共和国劳动合同法第三十七条是什么?辞职信的格式是什么?
辞职信要按照下列格式写:1、在第一行正中写上辞职申请;2、称呼之后,书写正文;3、明确表达辞职申请,写...
-
商业汇票的绝对记载事项有哪些?汇票的绝对应记载事项指什么?
汇票的绝对应记载事项,指票据法规定必须在票据上记载的事项,若欠缺记载,票据便为无效。相对记载事项...
-
武汉房产税的征收标准是什么?房产税的缴纳标准是什么?
武汉房产税由房产所在地的税务机关依照房产原值一次减除10%至30%后的余值按年征收,分期缴纳。房产税征...
-
基金申购时间要多久?基金申购和认购有什么区别?
基金申购时间要多久?基金申购指的是出借者到基金管理公司或选定的基金代销机构开设基金帐户,按照规定的...
-
养老保险领取政策都有什么?养老保险领取标准是什么?
养老保险领取标准是达到法定退休年龄并累计缴费满15年。累计缴费不足十五年并且达到法定退休年龄的,可...
-
csgo开箱模拟器有哪些?csgo开箱模拟器免费网站介绍
很多喜欢开箱的小伙伴却由于囊中羞涩,没办法享受那种刺激的感觉,下面分享十个可以每日白嫖的csgo开箱...
-
农民如何买养老保险?农村户口买养老保险的方式是什么?
农村户口买养老保险的方式:到当地统筹个人缴纳社会保险的部门,填写《养老保险缴纳登记表》,提交户口...
-
采用注射方式执行死刑是什么?现在还有枪决吗?
注射死刑,或注射毒药、致命性注射是利用注射足以致命剂量的药剂(通常是巴比妥酸盐、肌肉松弛剂和氯化钾...
-
造价工程师挂靠费要多少?造价师是指的是什么?
一、造价工程师挂靠费用要多少建设部造价工程师4-5万 年(带高工4 5-6万 年)水利部造价工程师1-1 2万...
-
结婚登记的程序办理流程是什么?婚姻登记工作规范内容是什么?
夫妻复婚手续办理流程:1、准备3张2寸双方近期半身免冠合影照片和本人有效的居民身份证和户口簿;2、男女...
-
国寿鑫耀至尊年金保险条款是什么?保障哪些方面?
投保范围:国寿鑫耀至尊年金保险具有广泛的投保范围,适用于0-65周岁之
-
天天短讯!商业年金险和商业养老保险是一样的吗?特点是什么?
不完全一样,两者之间有点区别。商业年金险是一种保险产品,它是由保险
-
华夏喜盈门升级版年金险好处有哪些?要怎么买?
该产品最大的亮点在于可以附加万能账户来实现收益的二次增长。万能账户
-
专访兰世立:首富只是虚名,任何一个行业都需要“疯子” 全球热闻
兰世立。图片来源:受访者提供兰世立把东星集团成立32周年庆典安排在了
-
年金险和两全险的区别有哪些?可以一起买吗?|全球消息
年金保险与两全保险的差距主要在于保险金的给付以及保障范围的不同上。
-
国华盛世福年金保险尊享版优点是什么?能不能买? 全球滚动
通过购买年金险,被保人可以在约定的年龄或日期领取稳定的养老金,实现
-
违章停车罚款多少钱?中华人民共和国道路交通安全法第五十六条内容是什么?
违章停车罚款多少:行人、乘车人、非机动车驾驶人处警告或者五元以上五十元以下罚款;机动车驾驶人妨碍其...
-
地税征收的范围是什么样的?中华人民共和国城市维护建设税法第一条是什么?
地方税有城市维护建设税、城镇土地使用税、耕地占用税、车船使用税、牲畜交易税、集市交易税、以及筵席...
精彩推荐
阅读排行
精彩推送
- 多大能领结婚证?民法典第一千零...
- 开车撞死人怎么办?道路交通安全...
- 子女已满八周岁的抚养的原则是什...
- 追债公司合法吗?讨债公司承办委...
- 建行货币基金有风险吗?建行货币...
- 多长时间会换发长期机动车驾驶证...
- 现制酸奶距离喜茶,只差一个高端...
- 观速讯丨机构:第一季全球智能手...
- 海关:5月份我国进出口3.45万亿...
- 这首毕业歌唱出我们平凡又深刻的...
- 库克表示正在密切关注 ChatGPT
- 前员工披露 Vision Pro 开发...
- 当前快讯:三星 One UI 6.0 ...
- 天天播报:iOS 17 更新,让苹果...
- 2023,数据库国产替代走到哪了?...
- 焦点简讯:被特斯拉告了,大 V ...
- 今日热文:应用侧 AI 落地,从...
- 先入咸阳者为王:肺癌黄金靶点 ...
- 大模型下探音视频 AI 市场,战...
- 中华人民共和国刑法第一百三十三...
- 每日精选:这家企业估值50亿美元...
- 全国职工数字化应用技术技能大赛...
- 年金险基本保额是什么意思?保额...
- 环球观热点:保险公司年金险好不...
- 年金险期满可以拿回本金吗?年金...
- 年金险从什么时候领取划算?年金...
- 增额寿险与年金险的区别是什么?...
- 富瑞:维持太平洋航运买入评级 ...
- 短期有价证券是速动资产吗?短期...
- 即时焦点:弘和仁爱医疗延长两笔...