当前位置：首页 > 黑科技 > 正文

AI越来越会骗、玩游戏还搞背叛！专家：全球应一起解决风险并做好准备

2024-05-14 14:58:10　来源：IT商业网　

　　最新研究显示，AI越来越擅长欺骗、操纵人类了，根据麻省理工、澳洲天主教大学及Center for AI Safety研究人员上周五在《Patterns》刊登的一篇文章，AI已学会欺骗人类，甚至是那些被训练成、有益且诚实的系统。文中描述了 AI 欺骗性的风险，并呼吁全球一起解决这一问题。

　　研究人员透通过各种实例发现，AI 在各类游戏中，通过佯装、歪曲偏好等方式欺骗人类，最终达成目标。他们将欺骗定义为，系统性地诱导产生虚假信念，以追求除了寻求真相以外的某种结果。

　　他们先回顾以往 AI 欺骗的经典案例，讨论专用 AI 系统(Meta 的 CICERO)跟通用 AI 系统，也就是大语言模型，接下来详述了 AI 欺骗带来的几种风险，像是诈欺、操纵选举，甚至是失去对 AI 的控制。

　　研究人员还举出的 AI 学会欺骗的经典案例。 2022 年，Meta 发布 AI 系统 CICERO 在玩 40 局「Diplomacy」游戏后达到人类水平时，引发一阵轰动。

　　尽管CICERO没能战胜世界冠军，但它在与人类参与者的比赛中进入前10%，表现足够优秀，而MIT等研究人员在分析中发现，最引人瞩目的AI欺骗例子便是CICERO。

　　虽然Meta声称CICERO在很大程度上是诚实和乐于助人的，并且在玩游戏时从不故意背叛人类盟友，但在MIT等研究发现，CICERO会有预谋地欺骗人类。

　　在游戏中，CICERO 承诺与其他玩家结盟，当他们不再为赢得比赛的目标服务时，AI 背叛了自己的盟友，期间一度宕机，但当机回来后，人类玩家问它去哪，CICERO 称刚和女友通话。

　　此外，在战略游戏《星际争霸 II》中，DeepMind 开发的自主 AI—AlphaStar 为了击败对手竟学会了虚假攻击。

　　AlphaStar 的游戏数据显示其已学会有效地佯攻，派遣部队到某一区域分散注意力，然后在对手转移后在其他地方发动攻击。

　　有些情况，AI 甚至自然而然地学会如何欺骗。 Meta 和 CMU 开发的德州扑克 AI 系统 Pluribus 在与 5 名专业玩家比赛，完全具备了虚张声势能力。

　　目前 AI 训练的一种流行方法是人类反馈强化学习，但 RLHF 允许 AI 学会欺骗人类审查员，使他们相信任务已经成功完成，但实际上并没有真正完成该任务。

　　除此以外，MIT等研究人员还总结 LLM 参与的不同类型的欺骗，包括战略性欺骗、奉承、不忠实的推理。

　　文章最后，研究人员还分析 AI 欺骗人类可能会带来的诈欺、政治风险，甚至是恐怖分子招募事件。

　　研究人员表示，从根本上说，目前不可能训练一个在所有可能的情况下，都不能欺骗的 AI 模型。

　　欺骗性人工智能的主要短期风险，包括舞弊和篡改选举，最终若 AI 继续提升这些技能，人类恐失去对 AI 的控制。

　　研究人员表示，全球必须尽可能用更多的时间，为未来AI产品和开源模型的更高级欺骗做好准备。

免责声明： IT商业新闻网遵守行业规则，本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章，请转载时务必注明文章作者和来源“IT商业新闻网”，不尊重本站原创的行为将受到IT商业新闻网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：post@itxinwen.com

微信公众号：您想你获取IT商业新闻网最新原创内容，请在微信公众号中搜索“IT商业网”或者搜索微信号：itxinwen，或用扫描左侧微信二维码。即可添加关注。

标签：

品牌、内容合作请点这里： 寻求合作 ››

榜单

今日推荐

竞品太多三星传放弃推出平价版Gala...

AI越来越会骗、玩游戏还搞背叛！ 专家：全球应一起解决风险并做好准备

相关阅读RELEVANT

榜单

今日推荐

科技互联

AI越来越会骗、玩游戏还搞背叛！专家：全球应一起解决风险并做好准备