Claude Mythos 破解了 73% 的专家级网络安全任务，这是此前任何 AI 都无法解决的

根据英国人工智能安全研究所(AISI)的最新评估,Anthropic的Claude Mythos Preview已成为首个完成完整模拟企业网络攻击的AI模型。

该研究结果在该模型于4月7日发布后数天公布,表明AI网络安全能力已达到需要全球安全团队立即关注的水平。

什么是Claude Mythos?

Anthropic于4月7日推出了其Claude Mythos Preview模型,但选择不进行广泛的公开发布。该团队转而向安全研究公司授予有限访问权限,以评估和准备应对其先进功能。

在X上关注我们以获取最新资讯

这一发展已开始引起科技界甚至政策圈的关注。根据路透社援引知情人士的报道,美国财政部长Scott Bessent和美联储主席Jerome Powell与主要银行首席执行官举行了紧急会议,警告与该模型相关的潜在网络风险。

人工智能安全研究所(AISI)是英国政府科学、创新与技术部内的研究机构,对Anthropic的Claude Mythos Preview进行了网络安全评估,以检验其网络安全能力。

首先是夺旗(CTF)评估,系统必须识别和利用漏洞来获取隐藏的"旗帜"。Mythos在专家级任务中取得了73%的成功率。这是在2025年4月之前任何模型都未能解决的。

Claude Mythos网络攻击能力。来源:AISI

此外,AISI构建了一个名为"The Last Ones"(TLO)的32步企业网络攻击模拟。人类安全专业人员大约需要20小时才能完成。

Mythos Preview在10次尝试中完成了3次完整模拟。平均而言,它完成了32个攻击步骤中的22个。Claude Opus 4.6是表现第二好的,平均只完成了16个步骤。

Anthropic自己的红队测试发现,当用户明确指示时,Claude Mythos Preview可以检测并利用所有主要操作系统和领先网络浏览器中的零日漏洞。

AISI指出,组织应优先考虑基础网络安全措施。这包括定期修补、严格的访问控制、安全配置加固和全面的日志记录。

订阅我们的YouTube频道观看领导者和记者提供的专业见解

文章《Claude Mythos破解了73%以前任何AI都无法解决的专家级网络任务》首次出现在BeInCrypto。

来源:https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/