除了 Mythos 5,Anthropic 还发布了 Claude Fable 5,这是一个 Mythos 级人工智能模型,它使用与 Mythos 5 相同的核心设计,但为公众提供了额外的保护措施。
“《神鬼寓言 5》的功能超过了我们迄今为止推出的任何型号,”Anthropic 写道。 “它在几乎所有经过测试的人工智能能力基准上都是最先进的,在软件工程、知识工作、视觉、科学研究和许多其他领域表现出了卓越的性能。”
根据 Anthropic 的数据,《神话 5》和《神鬼寓言 5》在多个软件工程、网络安全、生物学和推理基准测试中取得了最高分。该公司在衡量漏洞发现和利用的 ExploitBench 上得分为 78%,在 Terminal-Bench 编码基准上得分为 88%。 Anthropic 表示,结果表明,与之前的 Claude 系统相比,该模型可以处理更长、更复杂的任务。
人工智能正在帮助发现技术漏洞,而 Zcash 只是最新的例子
虽然 Anthropic 表示《神鬼寓言 5》在冗长、复杂的任务上表现尤其出色,但为了防止滥用,涉及网络安全、生物学、化学或 AI 模型复制的请求均由 Claude Opus 4.8 处理,该公司表示,这种安全措施在不到 5% 的会话中触发。
“发布具有这种功能的模型会带来风险,”Anthropic 写道。 “如果没有保障措施,《神鬼寓言 5》在网络安全等领域的功能可能会被滥用,造成严重损害。”
此次发布之际,人工智能开发人员面临着越来越多的问题,即如何发布功能日益强大的系统。 Anthropic 认为,Mythos 可以帮助防御者在攻击者利用漏洞之前找到并修复漏洞。与此同时,包括 OpenAI 首席执行官 Sam Altman 在内的批评者指责该公司使用“基于恐惧的营销”来销售其人工智能模型。
