导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

克劳德寓言 5 发布后,互联网对 Anthropic 感到愤怒

Anthropic 在周二放弃了其最强大的公共模型,到了周三,人工智能社区的很大一部分人希望它没有这样做。

围绕Claude Fable 5(该公司受限神话级技术的第一个公开版本)的共识似乎是它非常擅长编码,并在日常会话中产生惊人的结果。但它的推出却带来了一些严重的抱怨:它以毁灭性的速度销毁代币;它暗中自我破坏某些研究任务;它强制每个用户遵守 30 天的数据保留政策,无一例外。

强烈的反对声是立即而强烈的,涉及到研究人员、开发人员、创始人和开源倡导者。这不是正常的发射日抱怨。更接近于清算。

代币熔炉

用户注意到的第一件事与安全无关。 《神鬼寓言 5》每百万输入代币的成本为 10 美元,每百万输出代币的成本为 50 美元,是 Claude Opus 4.8 运行成本的两倍。

定价本身就足够激进,但用户真正的痛苦是该模型在订阅计划中的表现。与 Opus 相比,《神鬼寓言 5》的使用限制增加了一倍,这意味着在您支付一分钱 API 费用之前,在《神鬼寓言》上进行同样的工作,您的计划津贴消耗速度会是原来的两倍。

实际上,情况变得更糟。在我们自己的快速测试中,《神鬼寓言》在一次提示中消耗了我们的每日配额。如果您是那些财力雄厚的客户之一,情况也不会变得更好。 Bleeping Computer 还测试了《Fable》,发现它在不到 9 分钟的时间内耗尽了 100 美元最高订阅的每日限额。

Scrimba 首席执行官 Per Borgen 在公开场合计算过:“刚刚尝试过《Fable》。它在 7 分钟内燃烧了 130 万个代币。每小时 160 美元。相当于 33.3 万美元/年的薪水,”他在 X 上发布

来自 T3 Chat 的 Theo 发布称,他在 200 美元的订阅计划中一天花费了超过 1,000 美元的代币。 Pixelated Ink 的首席技术官乔什·埃利索普 (Josh Ellithorpe) Josh Ellithorpe 表示《神鬼寓言 5》“燃烧代币的方式与其他模型不同”,在耗尽配额之前只给了他一些提示。 “甚至无法审查这个,因为我的测试非常有限,”他咆哮道。

Anthropic 的答案是,工作流模式(最令人着迷的功能)将复杂的提示分解为并行的子代理任务,这在设计上会花费更多的计算成本。

还有一个新的系统提示符,长度约为 120,000 个令牌,并且会加载到每个新对话中。对于上下文,这与 GPT-4o 在崩溃之前可以处理的令牌上下文窗口相同。

该公司还表示,《神鬼寓言 5》的每个任务效率比看起来每个代币的效率要好,因为它以更少的迭代产生更彻底的输出。在受控基准测试中可能确实如此。在具有每日硬性限制的实时订阅中,用户体验到它就像一台机器在几分钟内耗尽了他们的预算。

不说谎的模型

第二个投诉更具破坏性,因为它直接来自 Anthropic 自己的文档。该公司在《神鬼寓言 5》的系统卡中透露,当该模型检测到用户正在从事前沿大型语言模型开发(预训练管道、分布式训练基础设施、机器学习加速器设计)时,它不会拒绝回复,也不会退回到较小的模型。它通过提示修改、引导向量或参数有效的微调来默默地削弱自己,而不告诉用户任何变化。

换句话说,研究人员不知道他们是否付费让 Fable 回复并得到 Opus 回复。这也使得用户很难知道是什么导致他们的提示失败。

“与我们对网络安全、生物和化学以及蒸馏尝试的干预措施不同,这些安全措施对用户来说是不可见的,”Anthropic 在《神鬼寓言》的系统卡中写道。 “相反,这些保障措施将通过及时修改、引导向量或参数高效微调 (PEFT) 等方法来限制有效性。”

这种区别对研究人员来说非常重要。 正如人工智能时事通讯 Latent Space 所指出的,公开拒绝的模型可以让研究人员了解边界。回退到较弱版本的模型是可以检测到的。但是,一个看似有帮助但实际上却输出更差的模型却破坏了科学的可重复性——失败的结果可能来自研究人员的想法、他们的实施,或者从未披露的隐形干预。

Anthropic 估计这将影响大约 0.03% 的流量。开源和研究社区发现这个数字与所涉及的原理无关。

“亲爱的 Anthropic,你破坏了我们的信任,我认为你永远无法收回它。我的代币将不再按照你的方式飞行,”Hugging Face 的核心贡献者 Arthur Zucker 在 X 上发布。

Reka AI 联合创始人 Mikel Artetxe 也抨击了这一决定:

“好主意!下一步:如果你正在构建竞争技术,Apple 会随机重启你的 Mac;如果你提到竞争对手平台,Gmail 会默默地编辑你的电子邮件;如果 Tesla Autopilot 检测到你正在开发自动驾驶汽车,它会转向。当然,所有这些都是以安全的名义,”他发帖

受到打击最严重的研究人员不是拥有专有基础设施的大型实验室,而是学者、初创公司和使用 Claude 作为公共工具的独立建设者——这正是 Anthropic 的安全言论一直声称要保护的人。开放研究平台 AlphaXiv 称这种做法是“不安全”的先例,并认为安全政策应该透明且可审计。

内森·兰伯特 (Nathan Lambert) 在与艾伦研究所合作后刚刚开始在 Arcee AI 工作,他的说法更简单:“对我来说,这将 Anthropic 明显描绘成反科学,因此是反进步和反安全的,”他写道

一直在等待 Fable 帮助训练世界模型的人工智能和加密货币开发人员假名用户“CalleBTC”也总结了这种挫败感。 “Anthropic 已经失去了情节。我实际上是在等待 Mythos 帮助我训练一个世界模型。相反,他们选择放弃他们的模型来扼杀他们的竞争,”他,称此举“非常不道德,也是对开发人员和科学家的不尊重。”

总体而言,研究人员认为《神鬼寓言》的限制超出了特定主题,并且可能受到模型对用户进行分类的方式的影响。

“你的提示是我的”

第三种申诉对企业用户的影响最为直接,但其影响也波及到了所有人。 根据 Anthropic 自己的声明,Mythos 级模型(Fable 5、Mythos 5 以及具有类似功能级别的任何未来模型)的所有流量都必须在提供这些模型的每个平台上强制保留 30 天的数据,包括 AWS Bedrock 和 Google Vertex AI 等第三方界面。

该公司保证“几乎所有情况下”这些数据都会在 30 天后删除。

企业用户面临的问题并不是 Anthropic 所说的那样。这是政策的结构性要求。处理特权法律通信、医疗记录、机密源代码的公司如果使用这些模型可能会遇到麻烦。如果与 Anthropic 签订了具体的隐私协议,用户认为应该更新这些协议以保证隐私。

合规性问题也存在地域性。根据 GDPR 数据最小化规则运营的欧洲公司,或任何需要对受监管工作流程进行明显零保留的组织,都被简单地排除在《寓言 5》之外,直到 Anthropic 提供豁免。 AI 界知名人士 Pseudonym X 用户 Lisan al Gaib 直接指出了这一后果:

“Anthropic刚刚将很多欧洲公司委托给了永久的下层阶级。如果Anthropic将《克劳德神话》和《神鬼寓言5》的数据保存30天,那么所有要求零数据保留的公司根本无法使用它们。”

Hugging Face 首席执行官克莱门特·德兰格 (Clement Delangue) 将本周的事件归入一个更大的争论之中:

“权力、能力和经济财富的集中是人工智能的最大风险,”他写道。 “我们比以往任何时候都更需要开放科学和开源!”

另一位用户写道:“抛开所有笑话不谈,很明显,Anthropic 是通向最糟糕的反乌托邦的直接途径。他们的首席执行官反对他创造的技术。限制 ML 相关主题的知识和教育是极其卑鄙的。”

在 6 月 22 日之前,《神鬼寓言 5》的 Pro、Max、Team 和 Enterprise 套餐都是免费的。之后,它将转为仅使用积分(API 费率,不包含订阅),Anthropic 表示“一旦容量扩大”,它将恢复更广泛的访问。