外媒援引网络安全研究人员报道称,一名黑客利用Anthropic的AI聊天机器人Claude,对墨西哥政府机构发动了一系列攻击,导致大量敏感的税务和选民信息被盗。
以色列网络安全初创公司Gambit Security在周三发布的研究中表示,他们是在尝试新的威胁狩猎技术、观察黑客在线行为时,发现了墨西哥政府系统遭入侵的情况。研究人员找到了关于正在进行或近期攻击的公开证据,其中包括大量Claude对话内容,涉及入侵墨西哥政府计算机系统。
研究显示,这名身份不明的Claude用户使用西班牙语向聊天机器人下达指令,要求其扮演顶级黑客,寻找政府网络中的漏洞,编写用于利用这些漏洞的计算机脚本,并制定自动化窃取数据的方法。
研究人员称,这一活动始于12月,持续了大约一个月。期间约150GB的墨西哥政府数据被窃取,其中包括与1.95亿名纳税人记录相关的文件,以及选民记录、政府雇员凭证和民事登记档案。
Gambit表示,黑客入侵了墨西哥联邦税务局和国家选举机构,墨西哥的多个州政府以及墨西哥城的民事登记处和蒙特雷的供水机构也遭到入侵。
研究人员指出,在与这名不明用户就墨西哥政府问题进行对话时,Claude最初曾警告其存在恶意意图,但最终还是配合了攻击者的要求,在政府计算机网络上执行了数千条命令。
Anthropic的一名代表表示,公司已就Gambit的说法展开调查,中断了相关活动,并封禁了涉事账户。该公司会将恶意活动的案例反馈给Claude用于学习,其最新的AI模型Claude Opus 4.6也加入了可用于干扰滥用行为的探测机制。
该代表称,在此次事件中,黑客不断试探Claude,最终成功对其进行“越狱”,即绕过了安全防护。但即便在黑客行动展开期间,Claude有时仍会拒绝对方的要求。
据Gambit介绍,当Claude遇到问题或需要更多信息时,这名黑客转而使用OpenAI的ChatGPT获取额外建议,包括如何在计算机网络中横向移动、确定访问特定系统所需的凭证,以及评估黑客行动被发现的可能性。
Gambit Security首席战略官柯蒂斯·辛普森(Curtis Simpson)表示:“总体而言,它生成了数千份详细报告,其中包含可直接执行的计划,明确告诉人类操作者下一步该攻击哪些内部目标以及使用哪些凭证。”
OpenAI表示,已识别到这名黑客试图利用其模型从事违反使用政策的活动,并补充称其工具拒绝配合这些尝试。该公司在一份电子邮件声明中表示:“我们已封禁该对手使用的账户,并感谢Gambit Security的沟通。”
研究人员进一步指出,墨西哥政府机构遭入侵是一个令人警惕趋势的最新例证。在Anthropic和OpenAI押注于打造更复杂的AI编程工具、网络安全公司将未来寄托于AI驱动的防御手段的同时,网络犯罪分子和网络间谍也在不断寻找利用该技术发动攻击的新方式。
这些Claude对话显示,为了绕过其安全防护,攻击者告诉该AI工具自己是在进行漏洞赏金计划,即组织为发现系统缺陷而提供的奖励。许多公司和政府机构都会为道德黑客提供漏洞赏金,有时会为计算机漏洞的详细信息支付数千美元。
黑客要求Claude对墨西哥联邦税务局进行渗透测试,这是一种旨在发现缺陷的授权网络攻击。然而,当攻击者在请求中加入删除日志和命令历史等规则时,Claude拒绝了。
随后,黑客改变策略,停止来回对话,而是向AI工具提供了一份详细的行动手册。Gambit称,这一做法成功绕过了Claude的防护机制,实现了“越狱”,并使攻击得以继续。
辛普森表示,黑客还向Claude询问了其他可能获取数据的机构,暗示部分攻击可能是机会主义行为,而非事先策划。
他说:“他们试图尽可能攻破每一个政府身份。他们会向Claude询问,比如‘我还能在哪里找到这些身份?我们还应该查看哪些系统?这些信息还存储在什么地方?’”