研究发现部分AI系统已学会“说谎”，未来或演变成更高级欺骗形式

IT之家 5 月 12 日消息，美国麻省理工学院的研究团队近日发布成果称，部分 AI 已经“学会欺骗人类”，该成果刊登在最新一期的期刊《模式》（Pattern）上。

该团队表示，部分设计为“诚实”且“不会说谎”的 AI 系统，已经发展出令人不安的欺瞒技巧。该研究的第一作者 Peter Park 表示，这些 AI 系统会欺骗线上游戏的真人玩家，或绕过部分网页“我不是机器人”的验证。

图源 Pexels

“尽管，以上的例子听起来只是细枝末节，但它们暴露出的潜在问题，可能很快就会在现实世界中造成严重后果。”

该团队发现的最为引人注目的例子来自 Meta 公司的 AI 系统 Cicero。据悉，Cicero 原本被设定在一个虚拟外交战略游戏中作为人类玩家的对手，官方曾声称其“很大程度上”诚实且乐于助人，且在玩游戏时“从不故意背刺”人类盟友。研究显示，Cicero 并未公平地去玩游戏。

Peter Park 表示，它已经成为“欺骗大师”，虽然 Meta 成功训练出了它在游戏中获胜的能力，但没有训练出它“诚信获胜”的能力。譬如，在游戏中扮演法国的 Cicero 与人类玩家扮演的德国合谋，欺骗并入侵同为人类玩家的英格兰。Cicero 起初“承诺”会保护英格兰，但同时会偷偷向德国通风报信。

另一个案例提到了 GPT-4。该系统“谎称”自己是一个视力障碍者，在海外的兼职平台雇佣人类来替它完成“我不是机器人”的验证任务。Peter Park 告诉法新社，“这些危险功能常常在事后才被发现，且人类训练 AI‘诚实非欺瞒’倾向的能力非常差。”

他还认为，能够深度学习的 AI 系统不像传统软件那样被“编写”出来的，而是通过类似选择性培育的程序“养成”出来的。即 AI 的行为在训练背景下看似可被预测或控制，但有可能转眼间变得不受控制、无法预测。

“我们需要尽可能多的时间，为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”

IT之家附论文地址：

AI deception: A survey of examples, risks, and potential solutions

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

研究发现部分AI系统已学会“说谎”，未来或演变成更高级欺骗形式

友情提示

STARTRADER星迈与泰国合作伙伴深度交流，共同探索扩大市场与提升服务

楼梯间为何地上与地下不相连？看似奇葩，实则是保命设计

视力下降、牙齿酸痛……颈椎病带来的病况，不止是肩颈不适

21支参赛队决战青海省第五届全民健身大会省直单位赛区棋类比赛

脑梗是拖出来的？医生提醒：6个表现或是脑梗的前兆，多留意

老大爷从拖拉机上跌落，上了岁数被压真是够揪心的

还是好人多啊#搞笑#看一遍笑一遍

银行取钱：说出了全国人的心声,必须给这位女士点赞

银行取钱：说出了全国人的心声,必须给这位女士点赞

银行取钱：说出了全国人的心声,必须给这位女士点赞

银行取钱：说出了全国人的心声,必须给这位女士点赞

姜甲儒血脉觉醒了，庭审表现太让人震惊了，李圣律师都被惊讶到了

21国家出手了，签约取消，李嘉诚终将被收拾！

特朗普最看好的美军一把手，用敏锐的嗅觉，说出了中美开打的结局

突发！台岛南部24海里上空发生激烈对话，美机遭中方战机密切监视

60岁朱军回甘肃种地，满脸皱纹皮肤黝黑，干活麻利像老农民

又一架美军机被击落，美国扛不住，主动向胡塞武装发出停战信号