IT商业网-解读信息时代的商业变革
当前位置: 首页 > 黑科技 > 正文

AI越来越会骗、玩游戏还搞背叛! 专家:全球应一起解决风险并做好准备

2024-05-14 14:58:10  来源:IT商业网    

  最新研究显示,AI越来越擅长欺骗、操纵人类了,根据麻省理工、澳洲天主教大学及Center for AI Safety研究人员上周五在《Patterns》刊登的一篇文章,AI已学会欺骗人类,甚至是那些被训练成、有益且诚实的系统。 文中描述了 AI 欺骗性的风险,并呼吁全球一起解决这一问题。

  研究人员透通过各种实例发现,AI 在各类游戏中,通过佯装、歪曲偏好等方式欺骗人类,最终达成目标。 他们将欺骗定义为,系统性地诱导产生虚假信念,以追求除了寻求真相以外的某种结果。

  他们先回顾以往 AI 欺骗的经典案例,讨论专用 AI 系统(Meta 的 CICERO)跟通用 AI 系统,也就是大语言模型,接下来详述了 AI 欺骗带来的几种风险,像是诈欺、操纵选举,甚至是失去对 AI 的控制。

  研究人员还举出的 AI 学会欺骗的经典案例。 2022 年,Meta 发布 AI 系统 CICERO 在玩 40 局「Diplomacy」游戏后达到人类水平时,引发一阵轰动。

  尽管CICERO没能战胜世界冠军,但它在与人类参与者的比赛中进入前10%,表现足够优秀,而MIT等研究人员在分析中发现,最引人瞩目的AI欺骗例子便是CICERO。

  虽然Meta声称CICERO在很大程度上是诚实和乐于助人的,并且在玩游戏时从不故意背叛人类盟友,但在MIT等研究发现,CICERO会有预谋地欺骗人类。

  在游戏中,CICERO 承诺与其他玩家结盟,当他们不再为赢得比赛的目标服务时,AI 背叛了自己的盟友,期间一度宕机,但当机回来后,人类玩家问它去哪,CICERO 称刚和女友通话。

  此外,在战略游戏《星际争霸 II》中,DeepMind 开发的自主 AI—AlphaStar 为了击败对手竟学会了虚假攻击。

  AlphaStar 的游戏数据显示其已学会有效地佯攻,派遣部队到某一区域分散注意力,然后在对手转移后在其他地方发动攻击。

  有些情况,AI 甚至自然而然地学会如何欺骗。 Meta 和 CMU 开发的德州扑克 AI 系统 Pluribus 在与 5 名专业玩家比赛,完全具备了虚张声势能力。

  目前 AI 训练的一种流行方法是人类反馈强化学习,但 RLHF 允许 AI 学会欺骗人类审查员,使他们相信任务已经成功完成,但实际上并没有真正完成该任务。

  除此以外,MIT等研究人员还总结 LLM 参与的不同类型的欺骗,包括战略性欺骗、奉承、不忠实的推理。

  文章最后,研究人员还分析 AI 欺骗人类可能会带来的诈欺、政治风险,甚至是恐怖分子招募事件。

  研究人员表示,从根本上说,目前不可能训练一个在所有可能的情况下,都不能欺骗的 AI 模型。

  欺骗性人工智能的主要短期风险,包括舞弊和篡改选举,最终若 AI 继续提升这些技能,人类恐失去对 AI 的控制。

  研究人员表示,全球必须尽可能用更多的时间,为未来AI产品和开源模型的更高级欺骗做好准备。

免责声明: IT商业新闻网遵守行业规则,本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章,请转载时务必注明文章作者和来源“IT商业新闻网”, 不尊重本站原创的行为将受到IT商业新闻网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:post@itxinwen.com
微信公众号:您想你获取IT商业新闻网最新原创内容, 请在微信公众号中搜索“IT商业网”或者搜索微信号:itxinwen,或用扫描左侧微信二维码。 即可添加关注。
标签:

品牌、内容合作请点这里: 寻求合作 ››

相关阅读RELEVANT