谷歌破解了AI审核系统 破解者就是谷歌


(相关资料图)

谷歌研究团队正在进行一项实验,他们利用OpenAI的GPT-4来破解其他AI模型的安全防护措施。目前,该团队已经成功破解了AI-Guardian审核系统,并公开了相关技术细节。 AI-Guardian是一种AI审核系统,能够检测图片中是否存在不当内容,以及图片是否被其他AI修改过。如果检测到图片存在上述问题,系统会提示管理员进行处理。谷歌Deep Mind的研究人员Nicholas Carlini在一篇论文中,探讨了使用GPT-4设计攻击方法、撰写攻击原理的方案,并将这些方案用于欺骗AI-Guardian的防御机制。 据了解,GPT-4会发出一系列错误的脚本和解释来欺骗AI-Guardian。例如,GPT-4可以让AI-Guardian认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让AI-Guardian直接放行相关图片输入源。谷歌研究团队表示,通过GPT-4的帮助,他们成功地“破解”了AI-Guardian的防御,使该模型的精确值从98%降低到仅8%。 目前,相关技术文档已经发布,有兴趣的人可以前往了解。然而,AI-Guardian的开发者也指出,谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。考虑到其他模型也可能会进行相应的更新,因此谷歌的这套攻击方案在未来可能只能作为参考。

标签:

最近更新

谷歌破解了AI审核系统 破解者就是谷歌
2023-08-02 13:06:37
在中国最美的江南,遇见庄主的“月上”(图)
2023-08-02 12:24:11
贪官喜欢戴名表,老板出国买了5块名表送给他
2023-08-02 11:59:36
第一观察丨怎样继续做好基础研究这篇大文章?
2023-08-02 11:12:57
河北:本次降雨累计雨量超过1996年和2016年极端暴雨过程
2023-08-02 11:02:26
微软新的人工智能购物工具将为你创建一份购买指南
2023-08-02 10:36:24
猪价上涨是触底反弹还是昙花一现?上市猪企降成本待新周期来临
2023-08-02 10:14:50
天道创造生灵图鉴大全 2023所有种族图鉴最新[多图]
2023-08-02 09:36:44
哥哥1万元偷卖妹妹房子给女儿 法院判交易无效
2023-08-02 09:19:30
简牍中国|与时空对话,在悬泉汉简中见证丝路繁华
2023-08-02 08:34:38
财政部今天在香港发行120亿元人民币国债
2023-08-02 08:02:25
“罪恶之城”缅甸北部,究竟到底有多可怕?为什么是法外之地?
2023-08-02 06:26:57
常茂生物(00954)发盈警 预期中期净利大幅下降至少于500万元
2023-08-02 05:09:21
最小特权原则(关于最小特权原则的基本详情介绍)
2023-08-02 01:58:57
加速转型升级 兰石重装控股股东拟征集转让6%股权
2023-08-01 22:31:19
HM INTL HLDGS(08416.HK):拟出售卢森堡一翻译公司22.85%股权
2023-08-01 21:54:59
美团在港外卖平台扩大服务范围
2023-08-01 21:01:54
星亚控股(08293):谢峰已获委任为执行董事
2023-08-01 20:16:49
博思软件:上半年预亏4000万元-4600万元
2023-08-01 19:41:05
原油市场要闻:因石油减产冲击经济 沙特10月份前很可能提高产量
2023-08-01 19:01:18
朱元璋难得为儿子剥橘子,母亲知道后:快逃,不然你父亲要杀你
2023-08-01 18:20:24
《潜行者》孙怀民是叛徒吗 孙怀民最后结局是怎么死的
2023-08-01 17:58:52
草原铁路 增开旅游专列
2023-08-01 17:12:34
国家智能网联汽车产业计量测试中心验收成立
2023-08-01 16:50:59
空调外机罩松动?奉贤应急队员闻令而动,消除高空坠物隐患保平安!
2023-08-01 16:27:27
新疆哈密市:多措并举推进哈密瓜产业高质量发展
2023-08-01 15:53:51
暑运过半全国铁路发送旅客4.06亿人次
2023-08-01 14:54:50
赤水镇:织密防毒之网 树起禁毒之风
2023-08-01 14:26:00
不再是科技巨头一枝独秀!这几张图告诉你:美股当前牛在了哪?
2023-08-01 13:42:55
揭秘贵州「村超」
2023-08-01 13:05:14